“有用”不如“有趣”?图灵机器人想先做“有趣”
   来源:鲸媒体     2020年08月26日 08:39

通过手机APP控制机器人播放音乐后,大约15公分高的小机器人会伴随《江南style》手舞足蹈。但它又不仅仅会跳舞,它还有情绪、傲娇又任性,会转移话题,还能多模态的交互,这得益于它其中植入的图灵机器人语义软件系统。这款机器人是图灵机器人与乐聚机器人合作制造的,图灵机器人提供语义技术,乐聚机器人制造硬件。

2010年时,郭家与俞志晨“冲”进AI领域,创立了图灵机器人。图灵机器人发布虫洞语音助手之后,开始转向做人工智能语义技术落地,当前有两款核心产品:图灵机器人平台和机器人操作系统Turing OS。图灵机器人最早的启动数据以虫洞命名,“虫洞理论”是爱因斯坦提出的;而团队名称“图灵”,也是为了向伟大科学家“人工智能之父”图灵致敬。

32岁的郭家对鲸媒体说,“如果把语义机器人分成两个方向,一个叫有用,一个叫有趣的话,我们现在最重要的事情是做好有趣这件事。”

背靠AI做“有趣”,图灵机器人的想法是什么?选择儿童市场,图灵机器人用什么做出了陪伴解决方案?面对人工智能这一火热概念,图灵机器人又有哪些独到的理解?近日,鲸媒体专访图灵机器人联合创始人郭家,交流了那些关于图灵机器人和AI的事。语义技术差异化:用兴趣点设计陪伴机器人话题

郭家觉得图灵机器人的对话是基于兴趣点来设计的:“很多聊天机器人,你问它会做什么,它可能会告诉你,会查天气,会查公交。它这话一说就败了。因为查天气我干嘛要用它呢?”

“其实我只是一般般厉害,我觉得你也很厉害呀,”面对夸奖时,机器人RoBoHoN说。人类似乎很乐于让机器人来模仿他们的行为,于是鲸媒体又说,唱个歌吧。“我正想唱歌呢,”这个小机器人很给面子地道,随后开始“唱歌”。

我们又问:“你叫什么名字?”这次RoBoHoN就不愿意配合了,透显出顽皮的个性,“你说什么,我知道我很帅啊。”它说。

这样的机器人似乎是以往不曾见过的,它有情绪,傲娇又任性且顽皮,会转移话题,还具备学习的能力。“它经常跟郭家交流,已能分辨出郭家的声音与性格,而我们没经常性的与他对话,所以有时就会有点小小的欺负人,”工作人员表示。

RoBoHoN这款陪伴机器人是夏普和富士康推出的产品,由图灵机器人提供中文语境下的技术支持。

如果询问知识类的问题,机器人可能会比正常人水平都要高,但如果与机器人进行情感互动,很少有机器人能够超过人类。而传统的语音机器人,是类似于语音助手之类的角色,可以帮忙查美食、公交、天气……人们用语音机器人来让日常生活更便捷,却很少把它当成一个陪伴的伙伴。

图灵机器人要解决的一个问题,是儿童陪伴的需求。“因为小朋友学习的时候需要一个场景,一个能让他放松开心的场景。”如果在孩子学习的时候,答对一道题,一个小机器人会鼓励他,答错一道题,小机器人会告诉他该怎样做。那么孩子会把小机器人当成一个伙伴,而不是老师。孩子学习的时候会很放松,也愿意去接受机器人的指点,郭家举例说。

图灵机器人有语气变化,在相对应的对话场景下,它会有喜悦和愤怒等不同的语气。如果对图灵机器人说,“你好笨,”它可能会说:“就你聪明,有本事别跟我聊天。” 此外,图灵机器人还具备了主动引导话题的能力,而不是一味地由用户抛出问题再进行回答。

“聊天是由话题组成的,”郭家向鲸媒体解释,“所以我们用两个人的兴趣点来设计话题,而不是用使用功能去设计话题。”人们可以跟图灵机器人聊星座,聊笑话,玩成语接龙。“很多聊天机器人,你问它会做什么,它可能会告诉你,会查天气,会查公交。它这话一说就败了。因为查天气我干嘛要用它呢?”

“现在做语义的也越来越多了,我们提供的核心服务就是要别人没有的。以兴趣点设计话题是我们差异化的一个点,”郭家说,“另一点是专攻儿童方向,”由于抓取数据的关系,聊天机器人经常会出现聊天内容范围难以把控的问题。“我们会有一个纯净版的聊天机器人,只聊儿童类的。对话内容适合儿童,而不是成年人。”

图灵机器人有两款核心产品:Turing OS、图灵机器人。图灵机器人是一个技术平台,场景可能是智能手表、智能车载、智能家居,“所有的人都可以用这一套系统,想用它做什么都可以。但是OS是我们专门针对儿童领域做的一套完整方案,做得很深度。”实现有趣:IP运营工具+个性化推荐TTS +……

“如果把语义机器人分成两个方向,一个叫有用,一个叫有趣的话,我觉得我们现在最重要的事情是做好有趣这件事。”

郭家觉得如果把语义机器人分成有用和有趣两个方向的话,图灵机器人现在最重要的事情是做好有趣。

有趣这点,直观地呈现在了图灵机器人多样的聊天风格上。这一块也是图灵机器人的核心战略与理念。图灵机器人专做To B,实现理念的方法是做个性化的机器人。每一个用户想要的机器人,每一个厂商做的机器人,不同的形象拥有不同的性格。“可以看做一个机器人工厂。”

针对个性化,图灵机器人有一套让合作伙伴运营的IP运营工具。每一个长相不同的机器人都可以被认为是一个特有的IP,具体运营时,分为知识图谱、口头禅、声学部分等。

以光头强与熊大熊二的动画片为例,把剧本导入系统后,可以自动抓取知识图谱。网状的知识图谱依靠节点来连接。节点是光头强、熊大熊二、手枪。而节点之间又依赖关系去连接,譬如光头强与熊大是敌对关系,手枪对光头强来说是武器,知识图谱构成之后,机器人便会利用它自动生成回答。

如果问:“光头强,你最讨厌的人是谁?”光头强形象的机器人会说:“我的敌人熊大熊二。”如果问它平时用什么武器,光头强会回答手枪。

而对于口头禅类不固定的话语,图灵机器人会添加语义类的设定。属于声学部分的语气语调,图灵机器人有自己的个性化推荐TTS(Text To Speech),即一种语音合成技术。

“我们确实专做语义,但是语音合成技术比较简单,我们就顺手做了,”郭家谈到了图灵机器人也做TTS的原因,“比如说其他机构收费100万元,做一个100分的TTS。我们收10万,用不到一天时间做一个你自己声音的TTS,它效果可能不到100分,只有80分,但你会发现这是属于你的,这也是图灵机器人差异化的地方。这事儿没有人给我们做,所以我们就自己做了。如果不结合语义的话,单纯这个技术没什么技术含量。”

语气语调是TTS的重要一部分,图灵机器人做此技术也得益于它自身做情感语义的基因。“因为我们做了语义情感,所以我们能把TTS做得更准,本身AI领域没有什么技术是别人做不了的。”

图灵机器人并无年龄层面的划分。图灵机器人引进过心理学模型韦氏智力测验来测评其机器人智力,综合的智力水平包括素质、表达能力等。第一次测试后机器人的年龄是6岁,上个月测试已经将近10岁,“但我觉得年龄划分有点不准确。因为现在的人工智能还处于弱人工智能的发展水平,如果只靠智商来测的话,程度是不低。但是却不能像人一样正常沟通。所以更重要的是看要这个技术的应用广度和深度。”

无年龄层划分,特别小的孩子,没有图像引导,也能理解机器人在说什么吗?“人们在理解事物的时候靠的是关联,用生物学领域的概念解释叫镜像神经元。当孩子认识‘水’这种东西时,可能并不是像背单词那样一遍遍的重复训练,而是看到妈妈喝水,触摸水温,才产生对于水的关联认识。”郭家对鲸媒体说,“其实跟机器人聊天也是这样,是一个过程。只要让孩子感受到关联性就好了。”

这又牵涉到另一种叫做多模态交互的技术。屏幕可以视为一种模态,语音也是一种模态,而多模态的机器人能够说话、做动作、有表情,各种模态都会关联在一起。瞄准AI创业,转化落地儿童解决方案

“2015年人工智能就报道出来了,但从2015年到2017年我们身边有什么东西因为它而发生了变化吗?”郭家静默了片刻,“好像没有。”“所以我们想要做落地方案,比如儿童这一块。”

2010年,郭家与自己的大学同学,现图灵机器人CEO俞志晨开始创业。郭家笑称自己“当时是愣头青,直接冲进来了。”那时的他们已看好人工智能方向,“我们觉得移动终端一定会成为人们身边的一个智能设备,所以我们就想做一个帮助人解决问题的人工智能助理,当时是想做助理。”

“我们自己的判断是这事儿一定会发生,趋势是能看见的。而且因为我们学这个,肯定希望做点擅长的事情,”郭家说。2010年移动互联网正在建设,数据将成为公共资源这一苗头已萌生,而郭家也注意到了国外的案例,人们在打电话订机票的时候,接电话的是机器人。机器人会咨询机票时间、目的地,好像已经没人类客服什么事了。“其他涉及到这一块的,他们也还是偏向做有用的东西。”

“最有趣的,只有我们一家。不是因为做起来难,主要是因为大家觉得看起来没有什么价值。做有用的,比如订机票客服机器人,可以拿分成,有金额产生。人们会认为做有趣的东西看不到什么价值。但我们恰好认为有趣重要,所以一直做自己。”32岁的郭家说。

最初的团队只有4个人,今年的图灵机器人团队已经有了200人。据郭家介绍,这200人里除了6个销售人员,剩下的都是产品、研发、运营人员。“快速扩张也在今年,”团队30人的规模持续了很长时间,从去年年终开始扩张,扩张之后技术人员占一半,“我们主要是技术扩张。”

图灵机器人的启动数据是团队在2012年发布的虫洞语音助手,其支持自然语言理解,可应用于智能手机、智能电视、智能手表等多领域多平台进行人机对话、智能问答应用。最开始图灵机器人的To C产品用户量最高的时候达到4000万,积累了大量数据,之后图灵机器人开始把技术以免费形式开放。数据积累得更多,到现在为止每天新增的企业和开发者数量加起来有300家,每个月可达1万家。

“开放技术一直都是免费的。当时开放出来是觉得产品体验不如理想中的版本,那些有兴趣的发烧友、企业拿来自己去做,这种情况下我们再收费,我觉得这不是一个长久的生意,”郭家说,“我们自己都认为它不足够好,干嘛跟别人收费。所以我们还是靠场景化方案OS来做营收。”

图灵机器人应用的底层技术架构来自国外。“中国的科技领域跟原来的移动互联网操作系统是一样的,中国擅长的还是做应用,不是做底层。”现在的应用主要靠模型驱动,模型等于算法加数据,“图灵的优势是数据,有全世界最多的中文语料,数据很大。”但算法的底层才是框架。“全世界最好用的框架应该不超过10个,国内没有可以用的。”

“我们自己来衡量语义技术做得够不够好有两个基本值,”郭家说。一个值是准确度,另一个是CPS。CPS是微软提出的一个关于智能语音交互的统计指标,即人类与AI“聊天机器人”的对话轮数,具体解释为用户与聊天机器人所能维持的“单轮对话”平均次数。据微软统计的数据显示,当前微软小冰的CPS是23轮左右,而Google Now、Siri等人工智能助手的CPS大多不超过3轮。“我们的CPS在30轮左右,”郭家说。

图灵机器人也从数据中发现,用户在和机器人交互的时候,机器人有时候并没有懂用户表达的意思,回答的内容也不完全符合逻辑,但用户仍然喜欢与机器人继续交流。“不是因为准确,而是因为有趣。”用户在与机器人聊天过程中会不断抛出话题,或者关联、跳跃到其他话题,而那些话题是用户感兴趣的,聊天就会这样传接下去。

“说实话我们创业那时候也比较挑,挑客户,”从当时开放的免费技术说起,郭家对鲸媒体说。刚起步的图灵机器人意气年少,只与行业前几名合作。行业巨头不差钱,图灵机器人也无后顾之忧。“觉得赚钱很简单,也不着急赚钱。这两年也在反思,”郭家认真地道,“人工智能到底什么时候才能对我们身边的生活真正起到一些改变的作用?”

今年人工智能的概念大火,业内人士趋之若鹜,一时间AI成了人人挂在嘴上的名词。但人工智能行业其实一直存在,“2015年就报道出来了,但从2015年到2017年我们身边有什么东西因为人工智能而发生了变化吗?”郭家静默了片刻,“好像没有。”

“再这样做下去,实现不了企业的价值。赚不赚钱都是次要的,一定要有价值,所以我们想要做落地方案,比如儿童这一块。”8000万营收的目标,今年是商业化第一年

“他们就像一个人揪着自己的头发往上提,说自己会飞一样。被大家捧得很高,又认为自己是专家,但其实脚还没有离开地面,”郭家对鲸媒体说,“脚没法离开地面,因为需要真正找到一个切入点做一点具体的事情。”

图灵的家庭陪伴机器人可以自动更新,用户在购买之后,享受的服务与更新都为免费形式。“我们希望机器人能像孩子钟爱的芭比娃娃一样,从小陪伴他长大。就算不更新,孩子也会想到,那款机器人承载着他童年的记忆和教给它的信息。再换一个就没有这些东西了,所以孩子还想要原来那一个。”

但如果机器人可以自动更新系统,甚至更新智商,那么孩子也许就没有必要再买新的机器人?“到时候你可能就会想看机器人在你面前演动画片了,”郭家说,“甚至你还可以跟它们互动。”图灵机器人现在也正在着手把动画片剧情导入机器人中,以哆啦A梦为例,大雄形象的机器人和静香形象的机器人到时可以互动,而且有即时串演性质。用户观看的时候对机器人说,我昨天闯祸了。哆啦A梦的机器人就会说,我们上次也闯祸了,我跟大雄去做了一件……于是“哆啦A梦”与“大雄”开始表演他们捣蛋闯的祸。

“我应该给这个东西起个名字,比如叫什么实景动画片,”郭家若有所思地说。

机器人之间可以像人类一样对话交流,这类场景似乎才是“未来”的感觉,而外界也认为让机器人学会人说话,已经很难。郭家却觉得,人工智能真正的难点在于技术人员如何把自己的思维落地,形成产品化思维、场景化思维。“我觉得整个行业的困局在这里。不是大家担心的那样,说不够智能怎么办,不是这个问题。”

郭家举了一个例子来说明:美国有一家公司,它所做的事情是把视觉识别技术应用在拖拉机上,让拖拉机到庄稼地里的时候,能够自动识别杂草,然后喷洒除草剂。“但是谁能想到这个用人工智能来解决问题的点子呢,我们甚至不知道有类似的需求,更谈不上对于运作模式的了解。做农业的人又不懂。”

“做AI诱惑太多了。有时候会形容业内的有些同业者,他们就像一个人揪着自己的头发往上提,说自己会飞一样。大家捧得很高,又认为自己是专家,但其实脚还没有离开地面,”郭家对鲸媒体说,“脚没法离开地面,因为需要真正找到一个切入点做一点具体的事情。”在郭家看来,AI领域技术很难,这是毫无疑问的,但是现阶段AI领域还属于一个延续性创新的阶段,在迭代,还不是变革性创新的阶段,“为什么语义还是我们的好,说到语音还是会选择讯飞,因为是延续性在生效,在这个阶段下技术突破就没有质的飞跃,也无法颠覆。”

爱因斯坦也食人间烟火。谈到今年的目标,郭家说是做到8000万的营收。“今年是商业化的第一年,争取成为我知道的这些人工智能公司里第一家实现盈亏平衡的吧。”图灵机器人与机器人厂商合作时,收入来自分成。

图灵机器人的合作方包括HTC语音助手、富士康、IBM等,也包括一些做翻译的机构。翻译也是语义识别的一部分,但图灵机器人本身不做翻译。 “其实我们没有必要做,”郭家分析,“有用的东西有天然的缺陷,它做不到百分之百准确。”就当前做翻译的公司来言,其内部的翻译业务也有两个团队,一个团队做机器翻译,一个团队做人工翻译。机器翻译是免费的,人工翻译收费。人们在需求服务时会使用机器,但真正完美解决问题,又倾向于借助人工,“因为机器人无法超出用户预期,无法让用户感觉体验很爽,”郭家说,“所以这点我们跟别人合作就好。”

教育行业内有众多语音识别的机构会找图灵机器人合作,但郭家称那可能是下一步的发展趋势。“我觉得先把有趣做好,再做有用。如果我做的东西再怎么有用,小孩子不接受,不想看到,那样的话我觉得没什么用。”郭家说,去调研时候家长的第一反应是,这东西有什么用,如果能教孩子学英语,我肯定买。“这是中国教育一直缺少的一部分基因。但我们会引导说,家长可以观察一段时间,孩子在跟机器人交互的过程中就逐渐学会了他想学的东西。”

郭家说到最多的字眼,是“有趣”。但背靠AI来做有趣的事物,看上去似乎有点浪费。“我觉得一个公司,尤其是创业公司,还是要有自己的一个特点。大家都想做平台,而且很多人一上来就做平台。但是往往大家忽略了,平台之所以成为平台,首先是有流量。而流量来源于它有一个能够抓住用户的特点。譬如微信,最开始没有朋友圈,不能发图片,不能语音对讲,甚至第一版只能发文字。但它主打的点是,这是一款不再花钱只是使用流量的通讯工具。”郭家对鲸媒体说,“这一点抓住了用户,才成为平台,才建立了生态圈。”他重复道,“我们还是想先做好一个点,做好‘有趣’。”

或许AI真正达到人类期望水平的那一天,一大波人便无暇再追逐人工智能,而是会发愁自己的饭碗。那让一个机器人达到老师的水平需要多久?鲸媒体问道。

“我觉得也许永远都不会达到。”郭家说,“那可能是一种新的模式,而不是完全仿照原来的模式。”

东西 机器人 语义