罗宾 5G 知识社群

知识块 #2505044T6ZRP

大模型的 “小型化过程” 带来的影响

Robin | 2025-05-04

当前，30 亿参数的 “小模型“ 的性能已经达到最开始 ChatGPT 所使用的 1750 亿参数模型的效果。这得益于更好的压缩技术（distillation 蒸馏、quantization 量化等），以及更高质量的训练数据。

这个小型化过程会带来显著的好处：边缘侧和端侧通常算力是有限的，没办法部署大模型，但小型的模型如果性能够，就可以用的起来。（而边缘和端侧等低延迟特性就可以发挥起来了）。

与此同时，我们也想到了另一个问题，甲方企业 CIO 的难题。通常一个 IT 项目从立项招标到部署应用，起码要耗费几个月，甚至更久的时间。而模型改进（如下图所示）是以月为单位进步的，很可能甲方企业根据标书购买的大模型还没有部署上线，就已经落后，而且落后很多。

大模型时代的 IT 投资保护是一个值得思考的话题。

LLM 小模型成本 IT 投资 ROI 端侧智能边缘智能

数据来源 Abdin Translink Capital

分享链接 http://robin5G.com/2505044T6ZRP

延伸阅读

企业客户 Menlo Ventures

企业客户在部署使用大模型时，面临的经典问题是，选择开源模型，还是闭源模型。

从 Menlo Ventures 在 2025H1 更新的企业调研看，开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。

游戏西部证券

根据 Liftoff 的估算，2020 年全球游戏激活付费用户的成本将达到 43.88 美元，同比增长 23.9%。

Apple WSJ

美国新车销售安装了 Android Auto 和 Apple Car-play 的汽车的比例。从覆盖面范围看，远远超过任何一家车厂自己”主导“的车机系统。