企业客户在部署使用大模型时,面临的经典问题是,选择开源模型,还是闭源模型。
从 Menlo Ventures 在 2025H1 更新的企业调研看,开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。
附图黑色是闭源的大模型 GPT-4 不同版本的价格(每百万次 Token 使用,输入输出 4:1),蓝色是开源的大模型 Llama3.1 405B 在 Together 和 Fireworks 上的价格。
开源 vs. 闭源,这个争夺推动了持续的价格下滑。而大模型成本的下滑,有助于生成式 AI 应用更早达到的经济性。