知识块 #2505046S5PWL
不同垂直领域的数据占比:互联网数据 vs. 物理数据
Robin  |  2025-05-04

公开资料显示 GPT-3 模型的训练数据几乎都是来自互联网的数据。而大模型要走向垂直行业领域,从训练数据角度自然需要引入大量的来自垂直行业的数据,尤其是物理数据。

附图来自甲子光年的判断。我们认为此图表还遗漏了一个领域,就是企业的内部数据。每家企业无论大小,都有自己的私有数据。

数据来源 甲子光年
分享链接 http://robin5G.com/2505046S5PWL
延伸阅读
金融 IDC

IDC 咨询公司研究显示,2022 年中国银行业 IT 投资规模达到 1,446 亿元,同比 2021 增长了8.3%。预计在 2026 年将达到 2,213 亿元人民币,年复合增长率 CAGR 为 11.2%。

其中,IT 解决方案市场规模在 2022 年为 649 亿元,同比 2021 年增长 10.1%。预计到 2027规模可达 1,429亿元,年复合增长率为 17.1%。

就下图玩家份额看,金融 IT 解决方案的市场格局比较分散,还未出现 “赢家通吃” 的局面。

太阳能 The Economist

针对全球光伏发电的装机容量,国际能源署持续进行各种预测。

经济学人的报道,实际安装量是所有预测数字里面最激进的。

全球能源格局正在巨变。

金融 IDC

IDC 咨询公司研究显示,2022 年中国银行业 IT 投资规模达到 1,446 亿元,同比 2021 增长了8.3%。预计在 2026 年将达到 2,213 亿元人民币,年复合增长率 CAGR 为 11.2%。

其中,IT 解决方案市场规模在 2022 年为 649 亿元,同比 2021 年增长 10.1%。预计到 2027规模可达 1,429亿元,年复合增长率为 17.1%。

就下图玩家份额看,金融 IT 解决方案的市场格局比较分散,还未出现 “赢家通吃” 的局面。