知识块 #2508108UYBCX
AI 自动完成软件工程任务的 “任务时长” 变化
Robin  |  2025-08-10

以 50% 的成功率为目标,大模型工具来自动完成软件工程的任务的任务时长(Task Duration for Humans)在 GPT-4 及以前都处于很低的状态。

从 Claude 3.5 Sonnet 开始,这个时长在显著增加。即,AI Coding 开始发挥明显作用。而 GPT-5 可以将时长提升到 2 个小时以上。

数据来源 METR
分享链接 http://robin5G.com/2508108UYBCX
延伸阅读
企业客户 Menlo Ventures

企业客户在部署使用大模型时,面临的经典问题是,选择开源模型,还是闭源模型。

从 Menlo Ventures 在 2025H1 更新的企业调研看,开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。

5G Open Signal

附件数据来自 Open Signal 的测试数据,从用户侧角度看各家公司的宽带网络体验。

从结果看,T-Mobile 5G Home(FWA 固定无线接入)强于 AT&T 的固定宽带;而美国固定宽带网络的领头羊 Comcast Xfinity,T-Mobile 5G Home 也不落下风。

这些数据也可侧面解释了,为什么作为一家移动运营商 T-Mobile,能够通过 5G 技术手段获得了近两年美国固定宽带的净增用户的大部分。

战略 BCG

BCG 亨德森智库做了一项定量研究,“企业活力” 与 “企业存续时间” 和 “企业规模” 的关系。

结论就是,企业活力随企业存续时间和规模的增长而逐渐衰退,虽然也有特例。

注:企业活力指数是 BCG 亨德森智库与《财富》杂志联合研发的,旨在预测企业长期增长潜力的指数。测算方法可参见: https://www.bcg.com/en-cn/publications/2020/benefits-of-corporate-vitality