北京大学教授梅宏:人类必须牢牢掌控软件开发的主导权
原文:今日头条 中国信息化周报 2026-04-23 作者:杨光
核心论点
一句话概括:AI是更强大的工具,不是神;人类必须牢牢掌控软件开发的主导权,这一权力不能交给机器。
三大要点
一、正确认识AI的现状与角色
- 本轮AI的本质是深度学习,只是AI的一个子领域,但它成功”取代了爷爷”占据了舞台中心
- 大模型是计算机产业的第三座里程碑(继计算机发明、互联网出现之后),应充分肯定其进步
- 数据定义了模型的天花板——在感知智能上机器已超越人类,但在认知和行为层面差距仍大
- 当前大模型不具备真正的认知能力,用深度学习路径也不可能实现人类所理解的认知
- 两条技术路径的本质:规则驱动(传统计算)vs 数据驱动(深度学习),但深度学习的底层依然是计算——张量计算
核心洞察:智能是人造出来区分自己与动物的词。计算能力曾被视为智能,只是计算机太强后我们反而不把它当智能了。
二、人类在软件开发中的主导地位不会动摇
- 软件工程的核心复杂性不在写代码,而在问题域理解、权衡取舍、成本控制与长期演进预判——这些机器无法完全覆盖
- 编码仅占软件工程工作量约10%,软件的本质困难在于复杂性、一致性、易变性和不可见性
- AI是软件发展的自然延伸而非替代——历史上每次语言演进(机器语言→汇编→高级语言)都曾被预言会替代程序员,实际只是淘汰了低效编码方式,催生了更高层次的开发角色
- 智能化软件范型即将诞生:未来软件系统将由人类编写的程序 + 机器学习生成的模型共同构成,是确定性代码计算与不确定性模型计算的融合体
三、软件如何”驯服”大模型?
- 大模型在代码生成上有根本局限:
- 可用代码数据不足且质量不高,行业软件业务逻辑无法公开获取
- 大模型丢失了代码的结构化语义、强局部性和环境依赖性
- 生成代码 ≠ 生成软件——编码仅占10%工作量
- 大量未软件化领域缺数据缺代码,大模型难以发力
-
信任危机:AI工具使用率上升,信任度却从43%降至33%,不信任比例升至46%。生成代码超出人工评审能力,成为”不敢使用的负担”
- 驯服大模型的路径——构建大模型系统:
- 模型本身存在根本问题——幻觉,无法彻底解决
- 两条路径:①让模型本身更可信可靠;②用软件方法构建模型系统
- RAG、CoT、Agent等本质上都是软件系统——它们把人的问题求解方式强加给模型,或构建代码来调度模型
- 大模型系统就是”智能化软件范型”的特例
深度拆解:软件的四个本质困难
这四点源自 Fred Brooks 1986年经典论文《没有银弹》,梅宏在AI语境下重新激活了它们:
1. 复杂性(Complexity)
- 软件实体比任何人类建造的东西都复杂——没有两个部分是完全相同的
- 状态空间随规模非线性爆炸
- AI为何帮不上:大模型能写局部代码,但无法在全局层面理解N个组件之间的交互约束。代码数据丢失了结构化语义——模型看到的是文本,不是架构
2. 一致性(Conformity)
- 软件必须屈从于它所嵌入的外部环境:接口标准、法律法规、业务规则、已有系统——这些约束毫无逻辑统一性,全凭人为约定
- AI为何帮不上:这些约束散落在文档、会议、行业惯例甚至口头约定中,根本不在训练数据里。而且经常互相矛盾——取舍需要人的判断
3. 易变性(Changeability)
- 软件是”被压迫最深的构建物”——所有人都觉得改软件比改任何东西都容易,于是改需求永无止境
- 成功的软件比失败的软件承受更多变更压力
- AI为何帮不上:变更的本质是在已有约束中重新权衡,不是生成新代码。改一行可能牵动全局——这种影响分析依赖对系统的深度理解
4. 不可见性(Invisibility)
- 建筑有蓝图,机械有图纸——软件没有几何表示,你无法”看见”软件
- 这剥夺了人类最强大的认知工具——视觉思维
- AI为何帮不上:连人都看不见的东西,模型更不可能从数据中”学到”它。UML、架构图都是事后描述,不是实体本身
关键对照:规则驱动 vs 数据驱动
| 维度 | 规则驱动(传统软件) | 数据驱动(深度学习) |
|---|---|---|
| 本质 | 计算 | 也是计算(张量运算) |
| 确定性 | 确定性的 | 不确定性的 |
| 可解释 | 可解释 | 黑盒 |
| 应对四个困难 | 有工程方法体系 | 缺乏工程方法体系 |
传统软件用确定性规则驱动,尚且被四个本质困难折磨了半个世纪;换成不确定性的黑盒参与软件构建,困难只会更多。
智能化软件范型 = 确定性代码计算 + 不确定性模型计算的融合体——两种范式各有盲区,必须融合互补,但主导权必须在人手里。
金句摘录
- “软件承载着人类文明,人类必须牢牢掌控软件开发的主导权,这一权力不能交给机器。”
- “任何技术热潮终将褪去。就像当初电脑的出现曾颠覆无数人的认知……但人们对其司空见惯后发现,本质上机器学习依然是计算。”
- “软件行业的核心竞争力从来不是写代码,而是解决复杂问题。”
- “生成代码不等于生成软件——编码仅占软件工程工作量的约10%。”
- “认清机器学习’计算为本’的本质,并非贬低其价值,而是让我们在狂热与恐慌之间,找到一条理性前行的道路。”
与 Harness Engineering 笔记的关联
OpenAI 的 Harness Engineering 实验证明:人类不写代码也能交付产品——但人类承担了架构、需求、评审、编排的全部职责。这正是梅宏论断的实践验证:
- 3名工程师 × Codex 智能体 = 100万行代码 → 人类从未写一行代码,但全程掌控主导权
- Harness Engineering 的本质 = 用软件方法构建模型系统,让 Agent 在人类划定的约束内执行
- 两者共同指向同一个结论:AI 编码,人类造软件