专访 | AutoX 创始人肖健雄:让自动驾驶变的和电脑一样普及
   来源:机器之心     2020年07月13日 16:31

机器之心原创

撰文:彭君韬( Tony )

编辑:刘燕

出走学界、仍是商界新人的肖建雄,正用十分之一的成本构建自动驾驶解决方案。

从教授到企业家,肖健雄对新身份适应的很快。

33 岁的肖健雄以企业家身份入选了今年 MIT Tech Review —— 35 Innovators Under 35,这是由美国科技媒体 MIT Tech Review(麻省理工大学科技评论,创办于 1899 年)自 1998 年创立的一项年度科技人物评选,旨在表彰全球 35 岁以内最杰出的 35 位创新人士。

肖健雄所获得的荣誉归类于榜单中的杰出创业者(Entrepreneurs),相比于同类入选者,例如美国一流生物科技公司 Caribou Biosciences 创始人 Rachel Haurwitz,亦或是市值超过 30 亿美元的柔宇科技创始人刘自鸿,肖健雄还是个商界新人,2016 年 10 月,他正式创办了研究自动驾驶技术的企业 AutoX。

2017 年 2 月,在一场由丹华资本和斯坦福华人创业者协会主办的斯坦佛 AI 活动中,肖健雄介绍了他的自动驾驶公司 AutoX。

在随后的半年时间里,AutoX 获得了加州自动驾驶牌照,其无人车已经能在硅谷的车水马龙间穿梭自如。在今年三月披露的首款测试视频中,AutoX 摒弃了市面上的主流传感设备,仅依靠低成本的摄像头,实现了无人车在不同天气情况下的路面行驶。

这是 MIT Tech Review 看好肖健雄的重要原因,也让 AutoX 成为这项榜单自创立 20 年以来的第一家自动驾驶公司。MIT Tech Review 的科技主编 Will Knight 认识肖健雄已久,他认为:「肖健雄旨在将无人车变的和计算机一样普及」。

在成为企业家之前,肖健雄拥有璀璨的学术生涯―― 2012 年世界顶尖计算机视觉大会 ECCV 最佳学生论文奖获得者;2012 年 Google Research 最佳论文奖获得者;普林斯顿计算机视觉和机器人实验室创始人;两度获得 Google Faculty Awards;美国国家自然基金委员会研究奖……

不过,入选 35 Innovators Under 35 对肖健雄有着不同的意义,「这是我第一次在商业上得到认可。」

拓荒三维深度学习

肖健雄热爱计算机科学,聊到人工智能(AI)时,他整个人都兴奋了起来,「人类能造车、造机械,什么都有,但最缺智能化,AI 是很神奇的。」

同时,他又是一个很直观、喜欢视觉的人。个人喜好引领他在十多年前就读本科期间选择了计算机视觉――一种数学和工程学的结合体。肖健雄在读博士之前就读于香港科技大学,学习三维视觉重建,师从该校计算机科学与工程学的终生教授权龙,他是三维视觉的学术权威。

在港科大分别完成本科和硕士学位后,肖健雄进入麻省理工大学(MIT)。他在 2012 年获得的 ECCV 最佳学生论文奖,是在谷歌实习期间的作品《重建世界上的博物馆》(Reconstruct the world ‘ s museum ) 。这是一篇有关室内场景重现的经典论文――用 Google 街景相机,在博物馆内部拍照,继而重现博物馆的内部三维构造。

在 MIT 的 4 年,肖健雄已经开始琢磨如何将深度学习和三维视觉结合在一起。当时,深度学习之父 Geoffrey Hinton 和他的学生 A Krizhevsky 在 NIPS(神经信息处理系统进展大会)递交的那篇经典论文《ImageNet Classification with Deep Convolutional Neural Networks》,让卷积神经网络大放异彩,深度学习也迅速地在计算机视觉领域普及,这对肖健雄的影响很大。

毕业后,肖健雄加入普林斯顿大学视觉研发团队,开始着手研究一个新领域――三维深度学习。深度学习被证明在一维(语音)和二维(图像)上有着显著的效果,但将深度学习模型应用在三维数据(点云、深度图像、网格)的深度特征表示,是在最近几年才开始慢慢流行起来。

近三年,肖健雄发起或参与了几乎所有关于三维深度学习的研究——参与发布目前最大的公共三维数据集(三维数据里的 ImageNet)ModelNet 和 ShapeNet ;创建了研究三维深度学习的基础网络框架 Marvin,为后来者做了铺垫;推出 3D 卷积网络 Deep Sliding Shapes,在 RGD-D 图像中研究三维物体的特征……值得一提的是,Marvin 的所有权如今属于 AutoX。

「这个领域是我们创建的。」提起三维深度学习,肖健雄毫不掩饰内心的骄傲。

由于该领域技术在自动驾驶中有可观的应用前景,原本相对独立的三个领域——计算机视觉、深度学习和机器人找到了应用的结合点。这种趋势在近几年愈发明显,今年,机器人学术圈正在筹办一个全新的顶级大会,取名「机器人学习大会(Conference of Robotics Learning)」,以此推广机器人和机器学习的相关研究。肖健雄受邀成为第一届大会的领域主席(Area Chair)。

不难理解,当肖健雄在 2016 年离开普林斯顿大学后,一条知乎评论写道,「肖教授走了,普林斯顿视觉岂不是又没人扛把子了。」

入局自动驾驶

「我觉得这个(企业家)可能更适合我。」对肖健雄来说,创业和做学术更像是一个数学问题。「做创业,90% 会失败;做学术,90% 会成功。」

初见肖健雄,一如照片上的样子:白衬衫,深蓝色的西装裤,棕色的尖头皮鞋,梳着整齐的飞机头,戴着一副眼镜,文质彬彬。他出生在广东潮州,和马化腾、李嘉诚是老乡。他的家里人,包括爷爷奶奶、父母、姐姐,都是商人。

Credit by MIT Tech Review

早在 2013 年,肖健雄就有了创业的念头,但没有迈出那一步。在他看来,刚刚从 MIT 毕业,花 4 年时间读完计算机科学的博士学位,在技术层面还达到通透的程度。此外,当时也没有多少人真正相信无人车的前景。

学术圈有完整的体系和硬件支持。对计算机科学家而言,创新点往往在算法上,对商业模式和应用场景,甚至工程计算平台和计算,都基本不加考虑。肖健雄之前在学术界从事过 40、50 个项目,对纯发表学术论文渐渐失去激情。每个学术项目的周期都很短,能取得的进展也很有限,如同经历一个又一个小的循环,成就感自然不如自己开公司。

三年后,情况扭转。肖健雄从普林斯顿大学辞职,离开美国东海岸的新泽西州来到硅谷。知乎有人评价肖健雄创业,是典型的「学而优则商」。但真正踏出那一步,说服自己的内心,需要勇气。肖健雄是一个喜欢冒险的人,「这项创业是我一辈子做到现在最大的一件事情,也是最激动的事情。」

事实上,2016 年也是一个入局的好时间。此前,肖健雄一手创办了普林斯顿大学的计算机视觉和机器人实验室,掌握了自动驾驶的核心视觉技术。

另一方面,自动驾驶市场也日趋成熟,成为如今人工智能在应用领域里最炙手可热的一块蛋糕,传统车厂和互联网新贵都在全面押注自动驾驶。就在上周,三星也获得了加州道路上测试自动驾驶汽车的许可,正式进入这片群雄逐鹿的战场。

自动驾驶分 5 个等级区分,这是由 SAE International(美国国际汽车工程师协会)制定的行业标准(美国交通部下属的国家高速路安全管理局也制定了一套划分,从 2016 年 9 月统一使用 SAE International 的分类标准),这 5 个等级从最初级的 L1 辅助驾驶出发,到 L5 已经是完全智能化驾驶的水平。

目前,主流的自动驾驶解决方案将目标钉在 L3(高度自动驾驶,由人类负责激烈的驾驶情况)和 L4(超高度自动驾驶,由系统负责激烈的驾驶情况)。在 2020 ― 2023 年间,自动驾驶车辆能够在特定的路段,比如城市街道、高速公路上行驶。至于 L5 什么时候来临,有业内人士预计是 2030 年,持悲观态度的人甚至认为 L5 可能永远不会到来。

「实现完全无人驾驶没有这么快,有些初创公司完全押宝在完全无人驾驶,我觉得这个商业模式非常危险,我不清楚接下来五年他们怎么生存。」肖健雄说,但他仍然希望尽快普及无人车,让自动和辅助驾驶技术在某些领域尽快造福人类,而不用等到完全无人驾驶乘用车的到来。AutoX 宣传口号也是 Democratizing Autonomy(普及无人车),而他准备从摄像头入手。

深度 视觉 计算机