试了下 MiroFish
前段时间刷到的 MiroFish真 挺猛的。GitHub 全球趋势第一,还拿了盛大集团 3000 万孵化,关键作者好像还是个大四学生,比我年龄还小,真的令人感慨(
正好朋友想看看自己投资的一个基金配置如何,纠结对冲与否等问题,我就偷来了这个需求想试试看这个项目对于基金这种信息披露比较彻底的需求处理如何。
下下来到docker跑了一下,顺手接了 deepseek 的 API(主要是便宜,用起来也还行),订阅了Zep Cloud一个月,把基金公开信息和其他相关背景信息用ChatGPT整理成了详细背景报告后,我就开始试玩。
玩了一阵子,踩了不少坑,来博客这边记录下感受吧。
第一感觉:它不是又一个“聊天”App
一开始上手的时候其实挺明显的:
作者试图做一种——
有持续状态、会自己往前推的系统。
不是一问一答,而是它带着我给他的任务和背景信息自己“跑”。
但实际用下来,有点落差
用了一会之后问题也挺快就出来了。
上下文一长,速度就开始掉
deepseek 本来还挺快的,但比较健谈,我背景信息给的足或许也是一部分原因,总之上下文很快堆起来后:
- 响应明显变慢
- 一个成功请求后隔很久才会有下一个
- 最终时长远高于前端给出的预期
可问题在于,这东西本来就很吃上下文。
一慢下来,那种“系统在运转”的感觉就直接断了,会让我怀疑是不是系统卡住了,是不是得准备好去拍错了的感觉。
模型的味道还是很重
报告里有一个挺明显的问题:它没有真的跳出模型本身的习惯。
表现就是:
- 很会说,但偏圆
- 很容易打太极
- 观点不太立得住
你会感觉它一直在“接话”,但没有在“往前推”,只是在不断给出最安全的答案。
主动性没有预期那么强
我原本是有点期待它能:
- 主动拆问题
- 引入变量
- 甚至改写问题
但实际更多还是:
- 在已有语境里延展,鲜少有新的,偶尔有了,也是发散在周围不怎么参与核心
- 很少很少主动跳出来
所以更像“持续对话”,而不是“参与思考”。
很强的“舆情驱动感”
这一点挺明显的。
整个过程会感觉:
它特别容易被上下文里的倾向带着走
让我挺容易想到作者之前的 BettaFish(微舆)。
优点是顺,但问题也有:
- 容易迎合
- 方向不太稳
- 更像顺势,而不是建结构
以及,一些挺真实的踩坑
这里有两个让我非常无奈的地方。
刷个页面,直接给我“重开一局”
前端这块有个设计挺离谱的:
组件一挂载就会自动启动模拟,而且还带了个 force: true。
👉 只要你重新打开页面,它就可能把你之前的东西清掉,然后从头跑
我当时是因为后面越来越慢,怀疑是不是前端卡住了,想刷新一下看进度。
结果一刷新数据直接没了,从头开始。
那一刻是真的有点无语。
“20倍加速”,它当成经济机制给我分析了
还有一个理解偏差也大的让我无奈,想加速一下仿真环境,就给了个“20倍加速”的前置条件,想看看高变化市场下会怎么样。结果它直接把“20倍加速”本身当成了经济系统的一部分来解释。。。
但我还是觉得它挺有潜力的
虽然问题不少,但我没有觉得它是做歪了。反而有点像当年第一次用 GPT-3.5 的感觉,主要是目前它依赖的东西发展都很快,上下文工程越来越成熟,“世界建模”越来越被重视,如果落地现在这种偏文本流的预判以后或许可以得到质变吧。
一个不太严谨的感觉
现在的 MiroFish 给我的感觉有点像GPT-3.5 刚出来的时候,会让我隐约觉得,这东西有一天,或许会是一个正经的严肃的产品。