AAAI2020丨把顺序文本分类任务看作棋类游戏来解决 大讲堂 | 第150期
序列文本分类旨在对一条序列文本片段进行标签化
开课时间:2020/02/04 18:20 预计时长:15分钟左右
课程回放
301人报名
观看回放
课程介绍

 

  讲者介绍  

 

钱忱,清华大学2016级直博生(导师闻立杰副教授),新加坡国立大学交换生(导师蔡达成教授和冯福利博士后)。主要研究方向为自然语言处理中的文本分类和文本表示。博士期间在人工智能、信息管理、软件工程等相关的国际学术会议AAAI、CIKM、CAISE上以第一作者身份发表论文数篇

 

  论文主题  

Solving Sequential Text Classification as Board-Game Playing

 

  论文内容简介  

序列文本分类旨在对一条序列文本片段进行标签化。除各个片段内的文本内容以外,考虑文本片段间的上下文依赖依然是影响分类性能的关键因素。

先前的文本序列标注技术自左向右地预测对应的文本标签。然而,在决策过程中,不同的文本片段所需上下文依赖不同并且该些依赖并不一定严格按照自左向右地顺序排放。

因此,本文提出一种新的跳跃标注模式,先先打标那些需要更少上下文信息的文本片段再考虑那些需要更多上下文的部分。

技术上,我们设计了一个辅助的棋盘游戏作为序列文本分类的问题映射。通过将序列文本特征注入到所定义的游戏规则和状态评估策略之中,能有效地推动游戏玩家在每一步中最优化各自的招法,该博弈过程对应到跳跃地产生一段序列标签,此外该棋盘游戏的终局状态对应到最优的预测序列。在多个数据集上的实验结果体现出提出方法的有效性

课程须知
  • 本系列视频为AAAI 2020线上论文预分享的精选解读,欢迎大家观看
  • 如果你对AAAI相关工作感兴趣,欢迎加入AAAI 交流群,添加微信:AIyanxishe2,备注:AAAI+领域
  • 更多精彩内容,敬请大家关注研习社公开课的持续更新

授课教师

钱忱,清华大学2016级直博生,新加坡国立大学交换生。主要研究方向为自然语言处理中的文本分类和文本表示。
微信扫码分享课程