Anthropic首次向公众推出其最强大的AI模型Claude Fable 5,同时设置了安全防护措施。Fable 5是其Mythos模型的首个公开版本,擅长软件工程、知识工作和视觉任务,但在网络安全、生物、化学和蒸馏等高风险领域,模型会阻止响应并回退至Claude Opus 4.8。Mythos最初因网络安全问题仅限于少数合作伙伴使用,上周Anthropic扩大了对15个国家数百个组织的访问,现在任何人都可以通过Anthropic的Claude API和基于消费的企业计划访问该技术。
Fable 5的订阅将分阶段推出:到6月22日,Fable 5将包含在Pro、Max、Team和基于席位的企业计划中,且无需额外费用。6月23日后,Anthropic将从这些计划中移除Fable 5,需使用信用积分,计划尽快恢复为标准订阅功能。Anthropic还向已获批准访问先进模型的组织推出了新的Mythos版本——Mythos 5。
随着Anthropic准备进入公众市场,这一发布引发广泛关注。Anthropic警告称,系统的快速发展可能很快实现递归自我改进(RSI),即在没有人类干预的情况下自主提升自身。为了确保安全,Anthropic在发布Fable 5之前对其分类器进行了压力测试,并在超过1000小时的测试中未发现普遍的越狱漏洞。
尽管如此,仍可能出现新型攻击。为此,在推出Fable 5和Mythos 5后,Anthropic要求对所有流量保留30天的数据,即使企业之前有零保留协议。该公司表示不会将数据用于训练,仅用于“防御复杂和新型攻击,包括新越狱”和“识别并减少误报”。这一政策可能为行业设定了一个先例,即对越来越强大的模型的访问需要强制性的数据保留政策。
尽管并非所有问题都会得到Fable 5的回答,但Anthropic表示Fable需要回退至Opus 4.8的情况非常少,早期数据显示至少95%的Fable会话完全依赖于模型自身的响应。在第三方测试中,分析公司Hex表示,Fable在复杂、长时间的分析任务中首次获得90%的基准分数,表现出强烈的判断力和对细微差别的关注。Vibe-coding平台Base44指出,Fable在“一次性完成完整应用程序”方面表现更佳,工具调用能力也相当出色。AI驱动的工作空间和代理平台Genspark表示,Fable在其评估中超越了所有其他模型,尤其在UI设计和游戏编码任务上表现显著更好。
Fable 5和Mythos 5的定价为每百万输入令牌10美元和每百万输出令牌50美元,是Opus 4.8价格的两倍,这可能会对广泛使用造成威慑。许多企业对AI的成本日益关注,尤其是在看到账单或提前耗尽年度预算后。Anthropic预计Fable 5的需求将非常高且难以预测,但一些企业如购物奖励平台Rakuten认为,额外的思考是值得的。“在最高努力下,Fable反思并验证其工作,这使得高度自主的操作成为可能——额外的思考是自我偿还的。”
博主点评: Anthropic的Claude Fable 5在安全性和可访问性之间找到了微妙的平衡,其引入的30天数据保留政策可能会引领行业新标准。随着AI技术的飞速发展,如何在保障安全的同时推动创新,将是未来AI发展的关键挑战。企业在使用时需谨慎评估成本与效益,尤其是在预算紧张的情况下。