基于深度学习的中文唇语识别 GAIR大讲堂 | 第25期
开课时间:2017/10/18 20:00 预计时长:一个小时
课程回放
445人报名
观看回放
课程介绍

分享主题

基于深度学习的中文唇语识别

 

分享内容

唇语识别,即通过运动的嘴唇,识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模,最后引入Seq2Seq的翻译模型将发音转换成汉子。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。

 

分享人

戴锡笠,电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。

 

分享时间

10月18日周三晚8点

 

 

课程须知
  • 本次公开课将于10月18日周三晚8点准时开始,请大家提前10分钟进入直播间
  • 公开课后两天内会上传回放视频,错过直播的同学也不要担心
  • 欢迎大家多多向嘉宾提问,问题被采纳者有机会获得神秘礼品