罗宾 5G 知识社群

知识块 #2508108UYBCX

AI 自动完成软件工程任务的 “任务时长” 变化

Robin | 2025-08-10

以 50% 的成功率为目标，大模型工具来自动完成软件工程的任务的任务时长（Task Duration for Humans）在 GPT-4 及以前都处于很低的状态。

从 Claude 3.5 Sonnet 开始，这个时长在显著增加。即，AI Coding 开始发挥明显作用。而 GPT-5 可以将时长提升到 2 个小时以上。

AI Coding LLM GPT-5

数据来源 METR

分享链接 http://robin5G.com/2508108UYBCX

延伸阅读

企业客户 Menlo Ventures

企业客户在部署使用大模型时，面临的经典问题是，选择开源模型，还是闭源模型。

从 Menlo Ventures 在 2025H1 更新的企业调研看，开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。

5G Open Signal

附件数据来自 Open Signal 的测试数据，从用户侧角度看各家公司的宽带网络体验。

从结果看，T-Mobile 5G Home（FWA 固定无线接入）强于 AT&T 的固定宽带；而美国固定宽带网络的领头羊 Comcast Xfinity，T-Mobile 5G Home 也不落下风。

这些数据也可侧面解释了，为什么作为一家移动运营商 T-Mobile，能够通过 5G 技术手段获得了近两年美国固定宽带的净增用户的大部分。

战略 BCG

BCG 亨德森智库做了一项定量研究，“企业活力” 与 “企业存续时间” 和 “企业规模” 的关系。

结论就是，企业活力随企业存续时间和规模的增长而逐渐衰退，虽然也有特例。

注：企业活力指数是 BCG 亨德森智库与《财富》杂志联合研发的，旨在预测企业长期增长潜力的指数。测算方法可参见： https://www.bcg.com/en-cn/publications/2020/benefits-of-corporate-vitality