܄

三角兽CTO亓超:AI&人机对话系统应用实践

【数据猿导读】 从目前来看,人工智能毫无疑问是目前科技领域中最火的话题,而人机对话作为人工智能的重要部分也备受关注。但与很多人的认知不同的是,人机对话并不是最近才有的新鲜概念,而是源于计算机初创时期的构想,之所以没有广泛的应用于众多产品中最主要的原因是受包括语音、自然语言理解等在内...

三角兽CTO亓超:AI&人机对话系统应用实践

数据猿线上公开课是由数据猿主办,每期邀请一位大数据领域的实战专家,分享大数据技术在各个产业中的最新应用,旨在搭建一个深度学习和交流的平台。

本期邀请到的嘉宾是三角兽的CTO亓超,本期主题《AI&人机对话系统》。亓超——AI领域开放域聊天和chatbot顶尖专家,10年科研与工程经验。曾在佳能、腾讯、阿里,微软及百度负责推荐算法和人机对话系统研发。2014年微软小冰开放域聊天技术创始人,百度T8Lead,度秘聊天技术负责人,从零开始搭建微软小冰和百度度秘人机交互系统。

以下为本期课程精华内容整理:

从目前来看,人工智能毫无疑问是目前科技领域中最火的话题,而人机对话作为人工智能的重要部分也备受关注。但与很多人的认知不同的是,人机对话并不是最近才有的新鲜概念,而是源于计算机初创时期的构想,之所以没有广泛的应用于众多产品中最主要的原因是受包括语音、自然语言理解等在内的技术限制。

从人机对话最早被提出到现在,其发展经历了几个阶段:首先是2010年左右,由于语音技术实现了快速发展,涌现出了包括Siri在内的众多语音软件,而语音交互产品也迎来了第一个发展波峰。

但随后由于用户体验差等原因行业又迎来了一轮低峰期,也造成了用户对Siri等产品的粘性降低。之后随着新的技术的发展升级以及更多数据的使用,人机对话又重新引起了人们的兴趣,特别是AlphaGo与人类对战之后,市面上随后出现了小冰、度秘等产品,各大公司也纷纷推出了自己的Bot,比如亚马逊推出的Echo,Facebook的Messenger等。

综合来看,我们可以明显看到人机对话作为一个技术驱动的行业,其发展过程也与相关技术发展休戚相关。虽然经历了一些起伏,但总体还是朝着一个平稳快速的方向发展。

目前来说,一个成熟的人机对话系统通常会包括三个部分:第一,聊天部分,类似于朋友间的信息分享;第二,服务或信息获取,类似于用户通过搜索引擎寻找自己需要的信息,比如订票等;第三,主动推送,这也是机器“智能”的一个重要表现,机器不能只是被动接受指令,也需要在合适的场景下有一些主动的行为。

从技术上来说,这三部分所涉及的主要是开放域聊天、任务驱动的多轮对话、中控决策三项核心技术。

所谓的开放域聊天就是不局限话题的聊天,即在用户的 query 没用明确的信息或服务获取需求时系统做出的回应。开放域聊天在现有的人机对话系统中,主要起到拉近距离,建立信任关系,情感陪伴,顺滑对话过程(例如在任务类对话无法满足用户需求时)和提高用户粘性的作用。

任务驱动的多轮对话是用户带着明确的目的而来,希望得到满足特定限制条件的信息或服务,例如:订餐,订票,寻找音乐、电影或某种商品,等等。因为用户的需求可以比较复杂,可能需要分多轮进行陈述,用户也可能在对话过程中不断修改或完善自己的需求。此外,当用户的陈述的需求不够具体或明确的时候,机器也可以通过询问、澄清或确认来帮助用户找到满意的结果。

中控决策,是由于线下需要对接的服务偏多的情况下,会形成一些需要决策的问题,比如当用户提出一个词“苹果”时,机器到底是提供《苹果》的电影服务还是提供水果电商购买服务或者苹果手机的购买或者新闻服务,这就需要一个决策的管理系统根据上下文作出回答。

从更具体的技术角度来说,对话系统作为NLP(自然语言处理)的一个重要出口,集成了众多技术,如图一中最底层(第一层)是对话技术所倚赖的基础技术,比如深度学习,是为了在表示好一句话的同时让机器更好的理解;增强学习是在考虑到对话也是一个博弈的过程,需要动态调节、策略以及数据模型的需求;自然语言处理部分,由于中文没有英文那么严谨的语法结构,尤其是在口语过程中,因此目前的NLP目前不会做深层的句法分析;

语义部分,就是话语本身代表的意义,比如用户发出一个订火车票的需求,机器就需要做两件事情,第一是意图的分析,第二是关键词提取;信息检索,对于无法结构化呈现的数据进行重排序;数据挖掘,很多数据都是纯文本形式,假如要从电影的评论里提取电影的标签来用于线上理解,那么线下就需要把这些数据变成结构化、半结构化的数据或者用深层的语义将其变成可以匹配的向量。

三角兽_亓超_人机对话系统_人工智能-1

第二层是对话里的子模块,是由最底层技术里的某几部分组合而成。

语义理解(NLU),需要结合语义分析、自然语言处理等技术组合而成;决策过程,机器会参考用户的历史选择以及当前的选择偏好进行决策;

推荐系统,机器会根据用户以往感兴趣的话题或其他内容进行对话,使对话过程持续下去;

知识库,数据的支持建设;逻辑推理,目前机器都是根据知识库的储备进行推理,更深层的逻辑推理还停留在学术阶段;

语料分类、标签,除了寻求解决方法的类似性之外还会对用户、问题、企业等进行分类处理方便后期推荐、排序;

情感分析,受益于自然语言理解技术的快速发展,情感分析不再局限于关键词,而是根据语义分析挖掘出文本的浅层意义。

第三层是由技术的子模块组成的子系统,这些系统可以独立或者存在于一些更大的系统里提供服务。

第四层和最后一层是对话系统对外提供API服务的封装。

对话系统所涉及到的技术众多,各项技术的发展也不一而足,那如何去评估一个对话系统就是一个值得关注的问题了。

根据对话系统的类型不同,具体的评估标准也会有所差异。对于聊天对话系统来说,单轮相关度、整体满意度和用户活跃度是其评估的三个主要标准;任务驱动的对话系统则是以意图识别、语义解析、Policy策略和自然语言生成四部分为评估标准。

技术的发展最终需要走向落地应用,这样其作用才会得到最大程度的发挥。目前三角兽依托自身对话系统方面的技术积累,已经通过与To B类企业合作探索了不同领域的应用:

首先,企业服务领域,利用Bot应用提升获取信息和获取服务的用户体验,为企业增加用户粘性、提高品牌和市场运营效率,主要应用在互联网企业、传统企业网站、媒体、金融。

Bot应用目前可以应用在两个地方,第一种是针对企业微信、微博、官网和App,将语义技术植入到现有场景中,让机器人拥有交互的功能。比如Bot应用接入App,光明网App在两会期间推出的AI机器人小明就是由三角兽打造的。腾讯应用宝商店的App做成Bot也有三角兽支持。

第二种是用于企业售前和售后的智能客服,上文提到的和新世界集团的合作,是三角兽为新世界集团提供售前的导购助手,顾客可以问机器人较为复杂的问题,例如:我应该买个什么样的生日礼物?这里有没有适合儿童吃的东西?满足用户多元化需求。

其次,IOT,智能终端领域,是目前大家最好理解的一块,相当于为智能硬件装上大脑,让机器听懂人话并作出,满足用户直接和潜在的需求,提供陪伴、信息和服务。主要应用在智能家居、智能车载、智能手机、智能机器人、智能音箱方面。

比如前几天新发布的锤子坚果Pro手机搭载的BigBang 功能和智能语义拖拽功能都使用了三角兽的语义技术。

另外三角兽针对垂直领域多轮对话的能力也输出给了众多客户,比如聊天和音乐输出给耳机、音箱,电影和问答输出给智能电视,音乐和导航输出给车载市场等等。

最后,泛娱乐,例如模仿人物性格,赋予游戏、动漫角色、虚拟偶像“生命”,以及明星偶像的机器“分身”,每个粉丝都能可以随时与喜欢的角色互动。我们为JIBO机器人做的中文系统,就是打造了一个年轻的、邪萌的男性风格。

申请数据猿线上课程讲师,可联系Susie:15083112127(手机/微信)


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
数据智能 无限未来—2020世界人工智能大会云端峰会数据智能主题论坛顺利举办
数据智能 无限未来—2020世界人工智能大会云端峰会数据智能主题...
数据管理简史:从人工到人工智能
数据管理简史:从人工到人工智能

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部