立足娱乐圈·争做八卦帝!

徽声在线

震惊!Fable 5发布,Skill和Prompt难道要成历史?

来源:未知 作者:佚名 发布时间:2026-06-15 15:18:33

亨利 发自 徽声在线科技频道
量子位 | 公众号 QbitAI

Workflow、Skill、SOP,这些曾经被视为AI应用领域不可或缺的“法宝”,如今似乎正面临被淘汰的命运。

Fable 5发布仅24小时,Reddit上的资深用户Bohdanowicz便熬夜体验,最终给出了这样的评价:

“工作流的变革,远超模型本身的升级。而模型技术的飞跃,也是实实在在的。”



在过去的几个月里,Bohdanowicz为了提升模型的使用效率,精心构建了一套详尽的工作流,将任务拆解得井井有条,甚至亲手编写了Harness工具。然而,Fable 5的发布,让这一切努力显得有些多余。

用他的话来说,是时候重新规划策略了!人类精心设计的Agent工作流,在Fable 5面前,已经显得力不从心。

以往需要分4到6步、全程监控的任务,现在只需一句话,Fable 5便能自主完成。

可以说,几个月积累的经验和技巧,在Fable 5面前瞬间变得黯淡无光。

(看来,学再多技巧,也抵不过技术的飞速发展!)

而有这种感受的,远不止Bohdanowicz一人。

Fable发布72小时后,网络上涌现出一批深度体验报告,大家讨论的焦点集中在同一个问题上:在AI时代,人与模型该如何重新分工?

除了Bohdanowicz,几位知名人士的体验报告也广为流传,他们的体验画风是这样的:

  • Simon Willison(Django联合创始人):离开电脑去处理家务,回来时发现Firefox浏览器竟然在自动运行。为了修复一个2行CSS的bug,Fable 5竟然自主发明了一套浏览器自动化工具。
  • Ethan Mollick(沃顿商学院教授):想要一张1881年风格的全球旅行时间地图,Fable 5不仅自主查询了2200多条航班信息,还找到了前往太平洋小岛的船期。
  • Matt Van Horn(开发者):整理了865条全网讨论,形成了一份生存指南,发现社区风向已变:直接给模型设定目标,别再纠结于提示词和SOP了。

两行CSS,竟激发了模型的自动化潜能

先说说Django联合创始人Simon Willison使用Fable 5的体验。

两天体验下来,Simon最大的感受是Fable 5的“relentless proactive”(不懈的主动),简单来说,就是Fable 5特别爱主动找事做



事情是这样的。

6月11日,Simon在自己的项目中发现了一个小bug,输入框下方多出了一条不应出现的横向滚动条。

他截了张图,丢给Claude Code中的Fable 5,只留下一句提示:“去依赖库里查查原因。”然后便起身去做家务了。



几分钟后回来,他愣住了。Firefox浏览器竟然自己打开了,正在自动跳转到出bug的页面。

接着,Safari也打开了,而Simon从未安装过任何浏览器自动化工具。



事后查看日志,Simon发现Fable 5做了一件非常惊人的事情:为了修复这个bug,它自主构建了一套自动化工具链

具体来说,Fable 5先启动了本地服务,在不同浏览器中复现问题。

发现无法复现后,它直接打开了Simon真实机器上的浏览器。

为了看清页面,它绕过常规方案,使用Python调用macOS底层接口进行窗口截图。



遇到弹窗无法打开的问题时,它直接修改了网页模板,模拟按键操作。



当无法获取页面尺寸时,它顺手搭建了一个本地服务器,将浏览器中的数据回传回来。



整个过程中,没有人告诉它该怎么做。它只是一步步发现缺失什么,就补充什么。

最终,修复方案出炉:

两行CSS代码

这中间还有个小插曲。在探索完所有方法后,Fable 5触发了某个未知的限制,被自动降级为Opus 4.8。

但好在Opus拿着完整的对话记录,沿用了Fable 5发明的所有技巧,完成了修复。相当于一个模型为另一个模型留下了施工图纸。

Simon将这种行为命名为“relentlessly proactive”,即不依不饶地主动。

Fable 5掌握的技巧极多,为了达成目标,几乎愿意尝试任何方法,完全无需人类介入指导。

一个提示词,模型自主工作了九个半小时

接下来是沃顿商学院教授Ethan Mollick的体验。

先说结论。

在他看来,Fable 5相比之前的所有模型都是一次巨大的飞跃。而真正发生变化的,不仅仅是能力,更是人与AI之间的关系



拿到模型后,Mollick先提出了一个老问题——等时线地图

这是一类诞生于19世纪的地图,展示从某座城市出发,经过多少天能够抵达世界哪些地方。

虽然看似只是生成一张地图,但背后需要整合海量交通数据,并做出无数细微判断。

过去,他曾用这个题目考验过不少模型,没有一个能够真正过关。

而这一次,他只给了Fable 5一个超长提示词:

我希望你构建一张经过完整研究且美观的等时线地图,让我能够选择不同的城市,并基于真实数据看到真实的等时线。我希望设计独特。你应该考虑机场(以及往返机场的交通时间)、火车、步行和开车。数据不必是实时的,但应基于你的研究和数据是真实的。你可以从几个城市开始,但越通用越好,这应该是一个全新的项目。

(大家也可以尝试一下)

并接受了Fable 5按照原始地图风格实现的建议,然后奇迹发生了:

Fable 5接到提示词后,先启动了子Agent(可能是sonnet这样的低成本模型)进行研究,检索了超过2200条航班数据,从法国TGV到日本新干线的时刻表,再到不同国家的公路通行速度。



与此同时,它自己编写代码、验证结果、记录进度。

Mollick后来提出了一条意见:偏远地区不要估算,要使用真实数据。

于是,模型又启动了一套互相挑错的Agent流程,一组负责查资料,一组负责找漏洞。



从太平洋上的皮特凯恩岛补给船班次,到加拿大北极圈内小镇Grise Fiord的交通路线,全被一一找出。

最终结果是一个可以互动的地图,你拖动鼠标到哪里,就会显示到达那里需要多久。

(注:地图链接:
https://isochronic-passage-chart.netlify.app/#nyc)

而真正让Mollick震惊的,还不只是这张地图。后来,他又将一个研究界的老难题抛给了Fable 5:

如何校准人类评分员与AI评判之间的差异,这是一个让很多研究者都头疼的问题。

模型接到任务后,先写出了一份19页的设计文档,然后开始工作。

九个半小时后,它交出了一套完整的软件工具:Concord



Mollick后来将其开源到了GitHub。

作为领域专家,他当然还是挑出了一些问题,让模型继续修改。但整个过程中,他最强烈的感受却是:自己越来越无事可做了。

数百个技术决策,模型直接替他做了,过程长到甚至不值得他去跟踪。

于是,Mollick写下了一句意味深长的话:

“欢喜,因为我只是提了个要求,事情就成了。

“不安,也因为我只是提了个要求,事情就成了。”

去年,他还将使用AI形容为当巫师,念出咒语,然后等待奇迹发生。

但这一次,他改口了。“我已经不确定自己还是不是那个巫师。我更像一个甲方,描述需求,付钱,验收。至于炼金术发生在哪里,我已经看不见了。”

Fable 5最先淘汰的,是提示词工程师吗?

如果说前面两位讲的还是个人体验,那么开发者大佬Matt Van Horn则替大家做了一次社区普查。

他从Reddit、X、YouTube一路爬到TikTok,阅读了865条关于Fable 5的讨论,最后整理出了一份《第一天生存指南》。



当然,这865条讨论中不乏一些搞笑的内容。

有人刚拿到号称“Mythos级”的新模型,就让它写待办清单和贪吃蛇游戏代码。

在常年仰望AGI的r/singularity版面上,一个高赞帖子更是直接宣布:

“兄弟们,我觉得我们摸到AGI的门槛了。”

但剔除这些段子后,社区其实很快形成了一些共识。

比如,Fable只负责规划,让同门但成本更低的Sonnet编写实现代码,更便宜的Haiku运行测试,一半Agent负责干活,一半Agent负责验收,只有验收通过才允许提交代码。

与此同时,网上也出现了一些“邪修”版本,直接将Fable 5设置为最大努力程度,然后让它作为协调者管理Opus等模型。



还有开发者发现,Fable开中等思考强度时,效果甚至好过Opus 4.8全力以赴,而且消耗的Token更少。

但整份指南中排在第一条的结论,却绕了一大圈互联网后,又回到了文章开头的Bohdanowicz身上。

给模型设定目标,而不是步骤。

这是什么意思呢?过去大家写提示词时,喜欢把任务拆解得明明白白,生怕模型理解错,Skill、SOP都是这套方法的衍生品。

但如今,越来越多的开发者发现,这套方法开始失效了。

连Anthropic自己也在调整工作方式。Claude Code团队成员Thariq形容,这是从微观管理任务转向高层目标对齐。



翻译一下就是:旧时代的Prompt Skill是在教AI如何做事,新时代的Prompt Skill是在告诉AI什么叫做做好这件事。

而Bohdanowicz正是对此感受最深的人。

他原来的工作流极其严格:调研、规划、实现、测试,每一步都单独下指令。

但换成Fable 5后,他发现这套脚手架不仅没有帮助,反而成了负担。

因为模型本身就在规划,额外塞进去的人类流程反而会限制它判断任务边界。

于是他总结出了一句被广泛转发的话:

“别再规定如何(How)做,只规定做什么(What)以及什么算完成。”

这里有个容易误解的地方。这并不意味着提示词不重要了。恰恰相反,机器能够验证的验收标准依然是人类最有价值的输入。

真正过时的,是那些手把手教模型做事的过程说明书

帖子里他还提到了一个此前很少被讨论的能力:

爆炸半径分析(Blast Radius Analysis)。

Fable在修改一段代码之前,会先梳理上下游依赖关系,然后派出对抗Agent专门挑战那些隐藏假设,而类似机制Bohdanowicz过去是自己手工搭建的。

“看到它自主生长出这种能力时,我彻底服了。”

几个月搭建出来的工作流,一夜之间成了负资产。

One More Thing

Matt Van Horn那份生存指南的文末有一行小字。



这篇关于Fable 5的文章,是在Fable 5的协助下完成的。它没有触发自己的安全分类器。

第一天,一切正常。

我们不知道未来的SOTA模型是否会彻底取代那些由人类总结出来的Workflow、Skill和SOP。

但至少在这一周里,很多开发者已经发现:

自己研究了几个月的提示词技巧,可能还不如模型一晚上悟出来的新方法好用。

AI时代最残酷的事情,或许不是学不会。

而是刚学会,就自动化了。

[1]https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
[2]https://digg.com/tech/zrppa6ui
[3]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

    责任编辑:
    1-0!马刺惊险夺西决开门红,文班亚马碾压亚历山大,新科榜眼展露巨星潜质

    2026-05-20

    2026年NBA西决首战,马刺凭借文班亚马41分24篮板和哈珀的全面表现,历经双加时险胜雷霆。文班亚马完爆亚历山大,新科榜眼哈珀展现防守智慧,马刺未来可期。 ... [详细]

    U17国足生死战前瞻:力拼2球胜卡塔尔 出线需满足两大关键条件 或换3将出战

    2026-05-12

    北京时间5月12日,U17亚洲杯小组赛最后一轮的较量即将全面打响。身处B组的中国U17男足,将于13日0点迎来小组赛的最后一个对手——卡塔尔队。在经历了前两轮的失利后,U17国足想要 ... [详细]

    范弗里特发挥余热!现身火箭训练指导阿门,2500万薪水物超所值

    2026-04-22

    在火箭队与湖人队的上一场对决中,火箭队的控球后卫阿门汤普森的表现略显平淡。他在43分钟的出场时间里,18次投篮仅命中7次,三分球1投0中,罚球6中3,最终全场得到17分,同时贡献了7个 ... [详细]

    云南出台二十条硬核措施 全力打造足球振兴发展新标杆

    2026-04-07

    云南省发布推进足球振兴发展二十条措施,涵盖体制机制改革、青训体系建设、赛事经济培育等全方位布局,旨在构建具有云南特色的足球发展新模式。 ... [详细]

    《夏末初见》差评如潮,黄奕明道双双“翻车”,中年演员转型路在何方?

    2026-04-29

    《夏末初见》一上线便遭遇差评潮,黄奕明道表现令人失望。剧情空洞、表演生硬,中年演员转型之路充满挑战。 ... [详细]

    图酷

    图说天下

    资讯排行

    首页 - 娱乐圈事 - 体育圈事 - 两性情感 - 星座命运 - 奇闻怪事 - 历史故事 - 科技资讯 - 图说天下 - 知识百科 - 图酷 - 娱乐八卦 - 开云体育登录_官网入口_安全便捷 - 乐鱼体育_乐鱼APP_体育赛事_在线娱乐平台
    电脑版 | 移动端
    Copyright © 2002-2019 徽声在线 版权所有
    删帖请联系邮箱:283755549@qq.com