附图是知名软件开发者论坛 Stack Overflow 按问题设计的编程语言类型的百分比统计,Python 和 PHP 位居前两位。
随着 Vibe Coding 的兴起,English 也成为一种编程语言。这样看的话,软件开发者群体的数量可能会大爆发。
为此类软件开发者提供工具服务则会变成一个比较有规模的生意。
AI 应用的运行需要消耗算力,那中国的各垂直行业中,企业 AI 应用的算力来自哪里呢?
根据易观和 CSDN 的 AI 应用开发者调研,34.2% 的反馈 “主要使用企业自建算力设施”。只有 20% 的反馈是 “主要使用算力云服务”。
这个反馈对公有云服务商而言,并不是乐观的消息。
对于生成式 AI 应用而言,训练数据的重要性是显而易见的。
通过对大量数据的积累和分析,开发者可以训练出更加精准和高效的模型,从而提升应用的性能和用户体验。数据飞轮闭环则是指通过用户使用应用产生的数据,进一步优化和迭代模型,形成一个持续循环的过程。
从易观和 CSDN 针对中国 AI 应用开发者的调研看,“领域数据量及数据获取难度使用成本” 是响 AI 应用开发者路径规划时最大的考虑因素。
在 AI 应用开发的初期阶段,开发者可能会倾向于利用市场上成熟的模型来快速开发和部署 AI应用。这种做法可以缩短开发周期,降低开发成本,并迅速验证产品概念和市场需求。
从易观和 CSDN 针对中国 AI 应用开发者的调研看,“利用市场上成熟的大模型” 是主流看法,但也不是 “那么坚固”。
有大量的开发者在不同程度考虑企业自有大模型的安排,只是时机上有差别。
完全通过 API 按量使用付费的那种,类似公有云能力调研的方式,只有 6.2% 的开发者反馈会这么做。
开发者使用 GitHub Copilot 等 AI 辅助开发工具被认为是本轮生成式 AI 应用层落地的代表之一。
那么,中国开发者为此消费了多少钱呢? 根据 InfoQ 在 2023 年 12 月的开发者调研显示,平均每位开发者累计消费了 328.8 元。
技术社区 InfoQ 在2023年12月的调研中,被开发者使用最多的大模型前三位分别是:OpenAI GPT 系列、百度文心和阿里通义。
从大模型提供商角度,一般而言,要么类似 OpenAI 自己退出一个应用(例如:ChatGPT)让最终用户直接使用,那么就是通过 API 能力开放的方式由开发者(所代表的企业)调用。
吸引到足够多,且有品质的开发者对于大模型服务商的商业化变现息息相关。
根据技术社区 InfoQ 的调研,北京是生成式 AI 开发者聚集最多的地区,占到全国的 30.7%,广东和上海位居二三位。
从研发技术方向看,应用工具为例第一位。
2023 年 AppStore 接受到开发者应用上架申请中,其退回了(拒绝)1,763,812 次申请。
从类别看,Apple 定义了五种大的类别:性能原因、业务原因(例如不允许有独立支付功能)、设计、法律和安全原因。
工业互联网涉及多个类别的玩家,无论是云计算、企业 IT 软件,还是工业制造业的设备提供商,甚至还包括一些电信运营商。
那如何来衡量这些不同平台的 “生态影响力” 呢?
贝恩公司分享了一个研究,他们基于 Linkedin 的人员履历,统计提及不同平台关键字的开发者数量。
研究发现:Amazon、Microsoft Azure、PTC 位居前三,而且大幅领先其他平台。
企业 IT 和工业设备制造商也有相当规模。SAP 和 GE Predix 是代表。
应用商店的广告收入类别中,游戏类占有重要比重。
左图是苹果 App Store 和 Google Play 近年的广告收入变化。游戏类的广告收入增幅远高于非游戏类。
2020 年 App Store 和 Google Play 游戏类广告收入分别为 186 亿美金和 172 亿美金。
从收入增长趋势看,Google Play 的增幅远高于苹果; 从右图开发者数量看,Google Pay 也远高于 App Store。
从这些角度看,Android 在这两年更有增长潜力。我们也做过一项研究,iPhone 过去五年的销售收入是 CAGR 为 -2%。