让柯洁说人类太多余，阿尔法元到底有多牛？_新闻_

昨日Nature: 人工智能从0到1，无师自通完爆阿法狗100:0 。

这已经不是它第一次“出席”重大场合了。国家领导讲话、国际头条、微博热搜、报纸新闻……热度经久不衰，要说还有什么比“人工智能”更火的时代科技名词，我实在是想破脑袋也想不出来。

▷“高考机器人”以134分和105分的亮眼成绩问世；

▷AlphaGo用3:0的战局完成与柯洁的“华山论剑”；

▷南京大学图书馆内，智能图书机器人1小时盘点图书超1万册；

▷江西一驾校，智能机器人教练通过视频、语音实时指导学员；

▷珠海海关，智能机器人凭借28种语言正确指引旅客通关；

▷百度无人车首秀，李彦宏将它“开”上北京五环；

要接着数么？还有智能客服、医疗机器人、无人机等一大波已经、正在、即将孵化的人工智能正在赶来。不管你相不相信、愿不愿意、开不开心，人工智能时代似乎真的到来了。

当“阿尔法狗再进化”“最强阿尔法狗诞生”昨天一跃成为各大网站、资讯头条，阿尔法元（AlphaGo Zero）以100:0完虐旧版阿尔法狗。柯洁感叹“人类太多余”！网友扶额“只闻新狗笑，哪见旧狗哭”！

前排占座，吃瓜群众的反应各异：

有这样的……

还有这样的……

说了半天，人工智能究竟是神马？它背后的运作原理真的强大到令人类颤抖吗？

某位非著名人士说过：“疑问使人探索，探索是进步的阶梯。”非著名人士是谁？咳咳，还是先来关注一下“阶梯”吧。

∝ 阶梯第一步之求助度娘

人工智能，英文缩写为AI。

强大的度娘告诉我们，它是计算机科学的一个分支，企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

人工智能可以对人的意识、思维的信息过程进行模拟，虽不是人的智能，但能像人那样思考、也可能超过人的智能。在广泛的科学研究中，它由不同的领域组成，如机器学习、计算机视觉等。总的说来，人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。

所以，它是模拟、扩展我们人类智慧的一门技术，或者说，人工智能的一项重要任务，就是通过学习、强化、深度挖掘在极具挑战的领域，达到超人的境地。

∝ 阶梯第二步之对比伤害

以誉满全球的“旧狗”“新狗”为例，Nature昨天上线的重磅论文，详细介绍了谷歌DeepMind团队最新的研究成果。

旧版阿尔法狗棋艺精进，是先“泡”在海量的历史棋谱里“偷师”，然后自我训练，实现超越。而新一代的阿法元（AlphaGo Zero），却是白手起家、自学成才，无需任何人类先验知识。

阿法狗元棋力的增长与积分比较

新版对阵旧版，3天对比N天，100:0，完全是终极大虐杀！

该项目负责人说：阿尔法元远比阿尔法狗强大，因为它不再被人类认知所局限，而能够发现新知识，发展新策略。美国杜克大学人工智能专家陈怡然教授表示，“我个人觉得最有趣的是证明了人类经验由于样本空间大小的限制，往往都收敛于局部最优而不自知（或无法发现），而机器学习可以突破这个限制。”

身为人类的我不禁瑟瑟发抖……

∝ 阶梯第三步之深度学习and强化学习

杜克大学吴春鹏介绍了技术细节：之前战胜李世石的AlphaGo基本采用了传统增强学习技术再加上深度神经网络DNN完成搭建，而AlphaGo Zero吸取了最新成果做出了重大改进。

简单来说，强化学习是一种通过不断增强实现储备加固的学习方法，是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大；深度学习则是一种结构，一种基于对数据进行表征学习的方法，其动机在于建立、模拟人脑进行分析学习的神经网络。通过模仿人脑的机制来解释数据，例如图像，声音和文本。

举个栗子

：

一棵树要生根得有一个过程，而为了汲取营养，细须般的根需要巩固自身，也会逐渐粗壮起来。当然，牵扯到如何生长？如何加固？创新技术突破？成果重大改进？这可就不是非著名人士可以解答的了。

所以，我们不妨回到最初的问题：非著名人士是谁？