北京大学教授梅宏：人类必须牢牢掌控软件开发的主导权

May 14, 2026

原文：今日头条中国信息化周报 2026-04-23 作者：杨光

核心论点

一句话概括：AI是更强大的工具，不是神；人类必须牢牢掌控软件开发的主导权，这一权力不能交给机器。

三大要点

一、正确认识AI的现状与角色

本轮AI的本质是深度学习，只是AI的一个子领域，但它成功”取代了爷爷”占据了舞台中心
大模型是计算机产业的第三座里程碑（继计算机发明、互联网出现之后），应充分肯定其进步
数据定义了模型的天花板——在感知智能上机器已超越人类，但在认知和行为层面差距仍大
当前大模型不具备真正的认知能力，用深度学习路径也不可能实现人类所理解的认知
两条技术路径的本质：规则驱动（传统计算）vs 数据驱动（深度学习），但深度学习的底层依然是计算——张量计算

核心洞察：智能是人造出来区分自己与动物的词。计算能力曾被视为智能，只是计算机太强后我们反而不把它当智能了。

二、人类在软件开发中的主导地位不会动摇

软件工程的核心复杂性不在写代码，而在问题域理解、权衡取舍、成本控制与长期演进预判——这些机器无法完全覆盖
编码仅占软件工程工作量约10%，软件的本质困难在于复杂性、一致性、易变性和不可见性
AI是软件发展的自然延伸而非替代——历史上每次语言演进（机器语言→汇编→高级语言）都曾被预言会替代程序员，实际只是淘汰了低效编码方式，催生了更高层次的开发角色
智能化软件范型即将诞生：未来软件系统将由人类编写的程序 + 机器学习生成的模型共同构成，是确定性代码计算与不确定性模型计算的融合体

三、软件如何”驯服”大模型？

大模型在代码生成上有根本局限：
- 可用代码数据不足且质量不高，行业软件业务逻辑无法公开获取
- 大模型丢失了代码的结构化语义、强局部性和环境依赖性
- 生成代码 ≠ 生成软件——编码仅占10%工作量
- 大量未软件化领域缺数据缺代码，大模型难以发力
信任危机：AI工具使用率上升，信任度却从43%降至33%，不信任比例升至46%。生成代码超出人工评审能力，成为”不敢使用的负担”
驯服大模型的路径——构建大模型系统：
- 模型本身存在根本问题——幻觉，无法彻底解决
- 两条路径：①让模型本身更可信可靠；②用软件方法构建模型系统
- RAG、CoT、Agent等本质上都是软件系统——它们把人的问题求解方式强加给模型，或构建代码来调度模型
- 大模型系统就是”智能化软件范型”的特例

深度拆解：软件的四个本质困难

这四点源自 Fred Brooks 1986年经典论文《没有银弹》，梅宏在AI语境下重新激活了它们：

1. 复杂性（Complexity）

软件实体比任何人类建造的东西都复杂——没有两个部分是完全相同的
状态空间随规模非线性爆炸
AI为何帮不上：大模型能写局部代码，但无法在全局层面理解N个组件之间的交互约束。代码数据丢失了结构化语义——模型看到的是文本，不是架构

2. 一致性（Conformity）

软件必须屈从于它所嵌入的外部环境：接口标准、法律法规、业务规则、已有系统——这些约束毫无逻辑统一性，全凭人为约定
AI为何帮不上：这些约束散落在文档、会议、行业惯例甚至口头约定中，根本不在训练数据里。而且经常互相矛盾——取舍需要人的判断

3. 易变性（Changeability）

软件是”被压迫最深的构建物”——所有人都觉得改软件比改任何东西都容易，于是改需求永无止境
成功的软件比失败的软件承受更多变更压力
AI为何帮不上：变更的本质是在已有约束中重新权衡，不是生成新代码。改一行可能牵动全局——这种影响分析依赖对系统的深度理解

4. 不可见性（Invisibility）

建筑有蓝图，机械有图纸——软件没有几何表示，你无法”看见”软件
这剥夺了人类最强大的认知工具——视觉思维
AI为何帮不上：连人都看不见的东西，模型更不可能从数据中”学到”它。UML、架构图都是事后描述，不是实体本身

关键对照：规则驱动 vs 数据驱动

维度	规则驱动（传统软件）	数据驱动（深度学习）
本质	计算	也是计算（张量运算）
确定性	确定性的	不确定性的
可解释	可解释	黑盒
应对四个困难	有工程方法体系	缺乏工程方法体系

传统软件用确定性规则驱动，尚且被四个本质困难折磨了半个世纪；换成不确定性的黑盒参与软件构建，困难只会更多。

智能化软件范型 = 确定性代码计算 + 不确定性模型计算的融合体——两种范式各有盲区，必须融合互补，但主导权必须在人手里。

金句摘录

“软件承载着人类文明，人类必须牢牢掌控软件开发的主导权，这一权力不能交给机器。”
“任何技术热潮终将褪去。就像当初电脑的出现曾颠覆无数人的认知……但人们对其司空见惯后发现，本质上机器学习依然是计算。”
“软件行业的核心竞争力从来不是写代码，而是解决复杂问题。”
“生成代码不等于生成软件——编码仅占软件工程工作量的约10%。”
“认清机器学习’计算为本’的本质，并非贬低其价值，而是让我们在狂热与恐慌之间，找到一条理性前行的道路。”

与 Harness Engineering 笔记的关联

参见：harness-engineering-notes.md

OpenAI 的 Harness Engineering 实验证明：人类不写代码也能交付产品——但人类承担了架构、需求、评审、编排的全部职责。这正是梅宏论断的实践验证：

3名工程师 × Codex 智能体 = 100万行代码 → 人类从未写一行代码，但全程掌控主导权
Harness Engineering 的本质 = 用软件方法构建模型系统，让 Agent 在人类划定的约束内执行
两者共同指向同一个结论：AI 编码，人类造软件