AAAI2020丨多通道反向词典模型 大讲堂 | 第138期
现有的反向词典模型很难解决高度变化的查询输入以及低频目标词这两个问题
预计时长:15分钟左右
录播课程
228人报名
立即学习
课程介绍

讲者介绍

岂凡超,清华大学计算机系自然语言处理与社会人文计算实验室博士生,师从孙茂松教授。研究方向为自然语言处理,已在AAAI、ACL、EMNLP等人工智能和自然语言处理顶级会议发表数篇论文。

 

论文名称      

多通道反向词典模型

论文地址:https://arxiv.org/pdf/1912.08441

Github地址:https://github.com/thunlp/MultiRD

 

论文内容简介

反向词典以关于目标词语义的描述为输入,输出目标词以及其他相关词。比如输入“a road where cars go very quickly without stopping”,期望反向词典输出“expressway”、“freeway”、“motorway”等词。反向词典最主要的使用价值在于解决“舌尖现象”(话到嘴边想不起来)。

现有的反向词典模型很难解决高度变化的查询输入以及低频目标词这两个问题。受到人的由描述到词的推断过程的启发,我们提出了多通道反向词典模型,可以同时解决以上两个问题。

我们的模型包括一个句子编码器和多个预测器,预测器可以通过给定的查询文本预测目标词的各种特征,进而帮助确定目标词。我们在中文和英文数据集上评测了我们的模型,实验结果表明我们的模型实现了当前最佳性能(state-of-the-art),甚至在人工真实查询数据集上超过了最流行的商用反向词典系统OneLook。此外我们也进行了定量实验和案例分析来证明我们模型的有效性和鲁棒性。

另外我们还开发了在线反向词典查询系统(提供中、英、跨语言反向词典查询功能),欢迎大家使用:

https://wantwords.thunlp.org/

 

与此同时,论文的文字版解读也已经在“AI科技评论”公众号上放出,请大家关注AI科技评论公众号,或者扫码阅读:

课程须知
  • 本系列视频为AAAI 2020线上论文预分享的精选解读,欢迎大家观看
  • 如果你对AAAI相关工作感兴趣,欢迎加入AAAI 交流群,添加微信:AIyanxishe2,备注:AAAI+领域
  • 更多精彩内容,敬请大家关注研习社公开课的持续更新

授课教师

清华大学计算机系在读博士
微信扫码分享课程