[AI前沿] AI行业的颠覆：小型模型能否取代大型模型？

AI热潮建立在一个基本假设之上：更大的模型更强大，最强大的模型将获胜。然而，随着成本的上升，行业即将面临这一假设破裂的考验。用户已开始重新审视小型且便宜的模型，成本意识的模型选择是新的趋势，尽管其对行业的影响尚不清楚，但预计将会非常显著。Coinbase联合创始人Brian Armstrong预测，大多数任务将在12-18个月内转向99%便宜的模型。他在X平台上表示：“对智能的需求几乎是无限的，但80%的工作负载将运行在99%便宜的模型上，而20%的工作负载仍将使用最新一代模型。”如果Armstrong的预测成真，这将对AI行业产生重大影响。过去，大多数AI公司以质量竞争，默认使用最先进的模型。如果这些工作可以通过更便宜的模型完成而不影响质量，这将意味着AI经济学的巨大转变，尤其是对OpenAI和Anthropic等大型实验室的财务打击。初步测试表明，当系统安排得当时，便宜的模型可以在不牺牲质量的情况下替代高端模型。法律AI工具Harvey最近的一项测试显示，该公司在不降低质量的情况下将推理成本降低了3倍。该测试与推理平台Fireworks AI合作进行，结合了Claude Opus和Fireworks的GLM 5.1，并将最密集的任务转移到Opus上，结果显著降低了服务器时间和整体成本。Harvey的联合创始人Gabe Pereyra表示：“质量始终是第一位的，但质量的定义正在从单纯使用最强大的模型转变为使用最有效获取正确答案的最佳模型。”这种趋势通常被框定为大型实验室与中国模型或开放权重模型之间的竞争，但这忽略了更大的问题。真正的分歧在于大型模型与小型模型之间。你可以通过从GPT-5.5切换到DeepSeek的V4 Flash来节省成本，但切换到GPT-5.4-mini同样有效。大型实验室的内部推理与独立服务的开放权重模型之间正在进行一场激烈的价格战。对于小型与大型模型的更大问题而言，胜出的具体小型模型并不重要。这一切看似显而易见——当然不应使用过多的计算资源，但这与迄今为止主导行业的规模优先方法相悖。受苦涩教训的启发，实验室们全力训练最计算密集的模型，推动AI模型的前沿。由于投资者的重金补贴，客户没有理由选择其他更先进的选项。随着token价格上涨和补贴放缓，用户首次面临成本压力。我们尚不清楚这种新的成本压力是否真的会促使企业用户转向小型模型。他们可能会选择通过减少调用次数、使用更少的上下文，或者简单放弃最不具前景的部署来节省开支。但如果大多数部署确实能在小型模型上同样运行，这可能会对推理的需求造成严重打击，并引发有关如何证明训练前沿模型成本的新问题。

博主点评： 这一趋势或许是AI行业的一个重大转折点。企业在追求高性能的同时，是否会意识到小型模型的潜力？而这一转变将如何影响大型实验室的商业模式，值得持续关注。