聊天机器人概述
1950年,艾伦·m·图灵在《心智》杂志上发表了一篇关于计算机机械和智能的文章。在这篇文章的开头,他提出了“机器能思考吗?(机器会思考吗?)”,提出了经典的图灵测试。通过图灵测试被认为是人工智能研究的终极目标,图灵本人也因此被称为“人工智能之父”。
1966年,最早的聊天机器人程序ELIZA诞生了。它是由麻省理工学院(MIT)的Joseph Weizenbaum开发的,为临床模拟罗杰斯心理疗法开发了一个基本的脚本程序。实现技术只是对用户输入电脑的文字进行关键词匹配,人工编写回复规则。
从65438到0972,美国精神病学家肯尼斯·科尔比(Kenneth Colby)用LISP编写了一个计算机程序PARRY来模拟偏执型精神分裂症。
1988年,英国程序员罗洛·卡彭特(Rollo Carpenter)创立了聊天机器人Jabber Wakey。该项目的目标是“以有趣、娱乐、幽默的方式模拟自然人机聊天”。这个项目也是通过与人类交互来创建人工智能聊天机器人的早期尝试,但Jabber Wakey尚未用于执行任何其他功能。该技术是利用上下文模式匹配技术找到最合适的回复内容。
从65438年到0988年,加州大学伯克利分校的Robert Wilensky等人开发了一个聊天机器人系统,叫做UC(UNIX Consultant)。UC聊天机器人的目的是帮助用户学习UNIX操作系统。
从65438年到0990年,美国科学家、慈善家休·g·罗布纳(Hugh G. Loebner)设立了一年一度的人工智能竞赛——罗布纳奖(Loebner Prize)。Lobner奖旨在通过对话的方式测试机器的思维能力。被视为考验图灵的时机。比赛奖品分为金、银、铜三个类别。到目前为止,没有一个参赛程序达到金奖或银奖的标准。
在Lobner奖的推动下,关于聊天机器人的研究达到了一个高潮,其中比较有代表性的聊天机器人系统是2月23日诞生的Alice(人工语言互联网计算机实体)。随ALICE发布的Aiml(人工智能标记语言)已经广泛应用于手机虚拟助手的开发中。
2001,SmarterChild在短消息和即时通讯工具中的普及,使得聊天机器人第一次被用于即时通讯领域。2006年,IBM开始研发超级大脑沃森,可以用自然语言回答问题。作为一台基于IBM“深度问答”技术的超级计算机,沃森可以使用数百种算法在3秒钟内找出特定问题的答案。
2010年,苹果推出人工智能助手Siri。Siri的技术来自美国国防部高级研究计划局公布的CALO计划:简化军队复杂事务,具有学习、组织和认知能力的虚拟助手。从CALO项目衍生的软件的民用版本是Siri虚拟个人助理。
此后,微软萧冰、微软Cortana(小娜)、阿里小米、JD.COM JIMI、网易七鱼等聊天机器人层出不穷,这些聊天机器人逐渐渗透到人们生活的各个领域。
2016年,全国各大公司开始推出可用于搭建聊天机器人系统的开放平台或开源架构。
2010以来,标志性的聊天机器人产品如下图所示。
总结:随着人工智能相关技术“东风”逐渐兴起,自然语言处理研究取得丰硕成果,聊天机器人相关技术发展迅速。同时,聊天机器人作为一种新颖的人机交互方式,正在成为移动搜索和服务的入口之一。毕竟搜索引擎的最终形态很可能是聊天机器人。很多人工智能领域的探索者和开发者都想抢占和抢占聊天机器人这个新的交互入口。
下面从几个维度的排列来介绍分类。
在线客服聊天机器人系统的主要功能是自动回答用户提出的与产品或服务相关的问题,从而降低企业客服的运营成本,提升用户体验。代表性的商用在线客服聊天机器人系统有小I机器人、JD.COM JIMI客服机器人、阿里小米等。以JD.COM JIMI客服机器人为例,用户可以通过与JIMI聊天,了解产品的具体信息、平台的活动信息以及购物中存在的问题。另外,JIMI有一定的拒绝能力,可以知道用户哪些问题不能回答,可以及时把用户转到人工客服。阿里巴巴集团于2015年7月24日发布了一款名为“阿里小蜜”的人工智能购物助手虚拟机器人。阿里小蜜基于垂直领域(服务、导购、助理等)提供良好的客户体验。)客户需要的地方。
娱乐场景下聊天机器人系统的主要功能是与用户进行无话题限制的交谈(闲聊),从而起到陪伴和安慰的作用。其应用场景集中在社交媒体、儿童陪伴娱乐、游戏陪练等领域。有微软的萧冰、微信的肖伟、北京龙泉寺的仙儿机器人和尚等代表系统。
教育场景下的聊天机器人系统可以根据不同的教育内容进一步划分。这类聊天机器人的应用场景是具有人机交互功能的学习训练产品,儿童智能玩具。
个人助理应用程序可以通过语音或文本与用户进行交互,实现用户个人事务的查询和代理,如天气查询、短信技术、定位和路线推荐、闹钟和日程提醒、点餐等,使用户可以更方便地处理日常事务。
智能问答聊天机器人系统能够以自然语言的形式回答用户提出的事实性问题以及其他需要计算和逻辑推理的复杂问题,从而满足用户的信息需求,帮助其做出决策。不仅仅是事实性的问题和答案,如什么,谁,哪个,哪里,什么时候等等。,还包括非事实性的问题和答案,如如何、为什么等。应该是要考虑的,所以智能回答的聊天机器人通常作为聊天机器人的一个服务模块。
从实现的角度来看,聊天机器人可以分为检索型和生成型。检索聊天机器人的答案是事先定义好的。在聊天过程中,机器人使用规则引擎、模式匹配或机器学习训练的分类器,从知识库中选择最佳答案展示给用户。生成式聊天机器人不依赖于预先定义的答案,但在训练机器人的过程中,需要大量的语料库,其中包含上下文相关的聊天信息和回复。
虽然目前一般使用基于搜索的聊天机器人系统在特定的生产环境中提供聊天服务,但基于深度学习的Seq2Seq模型的出现,可能会使基于世代的聊天机器人系统成为主流。
基于功能的聊天机器人可以分为四种类型:问答系统、面向任务的对话系统、聊天系统和主动推荐系统。
目前问答系统和主动推荐系统的评价指标比较客观,评价方法也比较成熟。然而,给定相同的输入,面向任务的对话系统和填充系统可以以各种形式做出响应。对于用户的同一个输入,通常会有多种合理的、不固定的反应,这就很难通过一个客观的机制对其进行评价,所以需要加入人的主观判断作为评价的依据之一。
通常一个完整的聊天机器人系统框架如图所示,主要包括自动语音识别、自然语言理解、对话管理、自然语言生成和语音合成五个主要功能模块。需要指出的是,并不是所有的聊天机器人系统都需要语音技术。
比如以文本方式实现人机交互的聊天机器人系统,就不需要自动语音识别模块和语音合成模块。
Amazon Lex是一种可以在任何程序中使用语音和文本构建对话界面的服务。Amazon Lex提供了一个可扩展、安全且易于使用的端到端解决方案,用于构建、发布和监控开发者发布的机器人。下图是聊天机器人如何通过对话帮助用户完成订花的需求。
另一个典型的聊天机器人框架是脸书的Wit.ai。Wit.ai积累了大量高质量的会话数据,有效推动了聊天机器人系统的发展,通过人工智能与人类智能的结合,进一步提高了聊天机器人的智能水平。
聊天机器人有四大类,包括问答系统、面向任务的对话系统、聊天系统和主动推荐系统。
Siri定位为面向任务的对话系统,为用户提供打电话、点餐、订票、播放音乐等服务。Siri对接了很多服务,设置了“底层”操作。当Siri无法理解用户的输入时,它会命令搜索引擎返回相关服务。Siri的出现引领了移动终端个人事务助手的商业化发展趋势。
下图是Siri的技术框架:
2011年2月,由IBM耗资3000万美元研发的IBM Watson登上了美国著名智力竞赛节目Jeopardy。面对程序中充满双重含义的英文问题,IBM Watson可以在庞大的自然语言知识库中分析寻找线索,并将这些线索组合成答案。最终,IBM Watson以压倒性优势击败了程序中最聪明的大脑,创下了这个知识竞赛系列27年历史上的最高分。IBM Watson作为IBM开发的问答系统,集成了自然语言处理、信息检索、知识表示、自动推理、机器学习等多种技术的应用。,并形成假设认知和大规模取证、分析、评估的深度问答技术。IBM Watson可以用自然语言分析数据,通过大规模的学习和推理为用户提供个性化服务。
2012年7月9日,谷歌发布智能个人助理Google Now。Google Now通过自然语言交互为用户提供页面搜索、自动指令等功能。Allo是Google在上述工作的基础上发布的语音助手。Allo能够随着时间的推移学习用户行为。
2065年4月2日438+04
主动推荐系统采用一种技术方式来实现个性化信息推送。主动推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为数据建立用户画像,从而基于用户画像主动推荐系统认为符合用户兴趣和需求的信息。在电商购物(如阿里巴巴、亚马逊)、社交网络(如脸书、微博)、新闻资讯(如今日头条)、音乐电影(如网易云音乐、豆瓣)等领域得到了广泛而成功的应用。主动推荐系统本质上是一种帮助人们解决信息过载问题的工具。所谓信息过载,就是用户真正需要的、真正感兴趣的东西淹没在同类物品的海洋中。主动交互可以显著提升用户体验,机器人的主动交互更接近人与人之间的真实对话,使对话更加自然。
主动推荐的一种方式是基于知识图的主动推荐系统。比如在建立音乐领域的主动推荐系统时,可以先建立音乐领域的知识图谱和用户的知识图谱,然后在用户信息搜索过程中建立用户音乐偏好的画像,从而更精准地推送用户的音乐。
从图中可以看出,在用户点歌的过程中,主动推荐系统结合音乐知识图谱、用户个人知识图谱和用户历史对话数据,可以综合给出最佳音乐推荐。
主动推荐系统和问答系统、面向任务的对话系统和聊天系统被认为是聊天机器人产品的四大类。