为了让你摆脱尬聊,机器人也学会带点小情绪了

未来图灵 2017-09-27 21:33:25

情绪化聊天机器人(ECM,Emotional Chatting Machine),是清华大学计算机系朱小燕、黄民烈博士的团队今年做的一项研究。根据团队论文《情绪化聊天机器人:带着内外记忆生成情感对话》(Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory)的介绍,ECM在传统的Sequence to Sequence模型的基础上,采用静态的情感向量嵌入表示,动态的情感状态记忆网络和情感词外部记忆的机制,让 ECM 得以根据用户的输入,并基于指定的情感分类(包括快乐、伤感、愤怒、厌烦、好感等五种情绪)输出相应的回复。

但更深层的理解范畴是,ECM能利用客观世界的知识或背景信息,并结合记忆、联想和推理,实现开放领域的交谈与对话。这关涉到目前人工智能存在的很多逻辑问题。“比如讽刺一件事,人类知道关于这个内容或这件事情的背景信息,因此人类很容易理解这是一个反讽,但现在计算机系统还不太能做到这一点。黄民烈博士表示,“如果模型不能很好地利用这种背景知识和信息,就会得到一个相反的结论。”

语言本身的复杂性

就目前而言,自动对话系统有两种主要模式:一种是基于信息检索,即在大规模场景对话样本的数据库或语料库中,避开对自然语言的理解,直接用数据建立有效的问(query)答(response)句匹配和问答相关度量化模型,来实现人机之间的对话。比如,记录点餐员与客户之间的对话,模仿这些数据,就可以建立一个自动点餐的应用。

另一种则是基于深度学习的生成式对话系统,即人工智能从海量对话数据中自动学习问句和答句之间的语义关联,从而达到对任何用户提出的问题都能够自动生成回复的目的。其中,语句语义学习的方法包括单词嵌入(word embedding,基于一个词语和其他词语的共现信息来构建该词语的语义向量)、循环神经网络(recurrent neural network,把一句话看成词语的序列,词语在句中出现的位置不同,词语和句子的语义也不同)、卷积神经网络(convolutional neural network,对句子进行扫描,提取特征,选择特征,最后组成句子的语义表示)、递归神经网络(recursive neural network,对语句进行句法分析,根据句法分析表达语义)等。

尽管深度学习在自然语言处理领域的研究成果已经不容小觑,且过去两年来已经有致力于避免聊天机器回复过于统一,产生更多样化、更有意思的回复,但是,朱小燕、黄民烈老师的团队,第一次将情感因素引入此基于深度学习的生成对话模型中,是ECM研究特别值得关注的地方。

在通常情况下,语言经人工智能高度抽象后会显得过于“安全”、无趣,人机只能进行单轮对话而不能多轮推进。ECM研究要做的是将上述偏向于理性、概率性的语义翻译过程富化,使之同时基于语言和情感两个维度,从而得到更加“准确”,更加符合现实交流需求的结果。

在黄民烈博士看来,语言本身的复杂性有很多方面,包括情绪、风格、结构等,而语言经过高度抽象后往往只字之差意义去相去甚远,这种符号上表达的含义很难用模型进行表述和定义。他表示,一个符合情境的交谈或对话需要符合多个因素。首先是交谈的话题;其次,交谈的对象是什么,是在和谁说话;再者,双方的情绪甚至心理活动状态是怎样的。除此之外,还需要考虑用户的背景和对话中扮演的角色,甚至多方面综合的感知信息如语音、语调、姿态和表情等。

固定的人格和属性

ECM研究还只是在做初步尝试。根据朱小燕、黄民烈博士团队的工作进程,ECM目前能在给定情感分类的基础上作出回复,仍未涉及如何评判用户情绪的研究。黄民烈博士表示,后续可以通过设计共情机制,或是通过上下文、情境等信息判断合适的回复,不过这非常复杂和具有挑战性。

“比如现在我们可以和小冰聊天,但很快,你会意识到它不是一个‘人’。”黄民烈博士指出,要实现人工智能拥有情绪,更加智能,需要两个方面的内容,一是语义理解,二是身份设定,而且后者更为重要——每一个机器都要有一个固定的人格和属性。比如,如果设定某一个机器人是一位会弹琴的三岁小男孩,那么,这个机器人在与人对话时,就应该生成与这样的身份设定相符合的答复。

更特别的是,这样的情绪化聊天机器人,事先不再需要学习、适应固定用户本身的说话特点,只要学习社交媒体中发生的大量对话即可。作为第一作者,黄民烈博士曾在2014年的《情感分析中的新词发现》(New Word Detection for Sentiment Analysis)一文中也提到,大多数网络新词,如“给力”“菇凉”等,仍未被算法识别和使用。但最近有研究发现,Twitter、微博这些社交平台上的对话,以及电影对话已经被作为人工智能学习和生成交流语言(spoken language)的数据利用。

就说话风格而言,今年9 月份,黄民烈博士带领清华的两位学生、联合搜狗搜索团队发表的《在连贯性生成式对话中,给聊天机器人设定人格和属性》(Assigning personality/identity to a chatting machine for coherent conversation generation)一文预测,未来情绪化聊天机器人可能不再需要模仿、学习特定风格的对话数据,就可以像一个“年轻女孩”“老人”“内向的人”“开朗的人”那样与人对话。“这会是一个很有趣的研究方向。”

本文为未来图灵(futureturing)独家文章,转载请申请授权并注明来源。

编译:杨羽婷

0 阅读:0