结构化数据的非监督特征学习:理论,算法,及应用 大讲堂 | 第117期
大多数标准机器模型都是为具有矢量特征表示的输入而设计的
开课时间:2019/01/07 20:00 预计时长:一个小时左右
课程回放
312人报名
观看回放
课程介绍

分享嘉宾

吴凌飞,IBM全球研究院总部(IBM T.J. Watson Research Center) 研究员 , 威廉玛丽大学计算机系博士,主要研究方向为机器学习,深度学习,表征学习,自然语言处理,大数据。吴博士已经发表20几篇顶尖杂志和会议,包含但不局限于KDD, ICDM, AISTATS, EMNLP, AAAI, ICASSP, SC, SIAM Journal on Scientific Computing, IEEE Transaction on Big Data, and Journal of Computational Physics。

吴博士同时也是13项美国专利的发明人。吴博士长期担任其相关研究领域多家国际顶尖杂志的评审,比如SIAM Journal on Scientific Computing, SIAM Journal on Matrix Analysis and Applications, IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Big Data, ACM Transactions on Management Information Systems, Data Mining and Knowledge Discovery, Pattern Recognition, and Future Generation Computer Systems。

吴博士同时担任了 IEEE Big Data'18 Tutorial Co-Chair (讲座主席), 并长期担任AI/ML/DL/DM国际顶会的TPC (技术委员会委员), 如ICML'19, ICLR'19, WSDM'19, ACML'18, NIPS'18, ICML'18, IJCAI'18, KDD'18, ICDM'18, ICASSP'18, AAAI'18, WSDM'18, ICDM'17, IJCAI'17, BigData'17, KDD'17, AAAI'17, ICSSAP’17, and BigData'16。

 

分享主题

结构化数据的非监督特征学习:理论,算法,及应用(Unsupervised Feature Representation Learning via Random Features for Structured Data: Theory, Algorithm, and Applications)

 

分享背景

多数标准的机器学习模型在设计时都把向量形式的特征表示作为输入。而对于许多结构化的输入,比如时间序列、字符串、直方图、图,由于数据中并没有显式的特征,所以有许多研究都希望可以为这些复杂数据开发出有效的表示。尽管深度学习模型如今已经取得了巨大的成功,我们仍然希望设计一种一般化的方法,从结构化的“无标注”数据中直接学习到特征表征。演讲中我们将首先介绍 D2KE,这是一个可以从任意距离学习到核和它的表征的一般性框架。接下来我们将展示如何把 D2KE 用于从多元时间序列中学习嵌入(来自 AIStats 2018 的 oral 论文)。最后,我会讲解如何用 D2KE 从预训练的词表征中学习通用的文本嵌入(来自 EMNLP 2018 论文)  

 

分享提纲

  • 结构化数据非监督特征学习的重要性和挑战。

  • 宏观上介绍我们提出的结构化数据非监督特征学习的通用框架:D2KE (Distance to Kernel and Embedding)

  • 重点介绍D2KE在两个领域产生的新方法,多变量Time-Serie非监督特征学习(Wu et al., AIStats'18, oral paper),和 Texts非监督特征学习(Wu et al., EMNLP'18)。

 

分享时间

(北京时间 )  1 月 7 日(星期一)  8:00pm

课程须知
  • 本次公开课将于01月07日周一晚8点准时开始,请大家提前10分钟进入直播
  • 公开课后两天内会上传回放视频,错过直播的同学也不要担心
  • 欢迎大家多多向嘉宾提问,问题被采纳者有机会获得神秘礼品
授课教师
向TA提问
吴凌飞
IBM全球研究院总部(IBM T.J. Watson Research Center) 研究员 , 威廉玛丽大学计算机系博士,主要研究方向为机器学习,深度学习,表征学习,自然语言处理,大数据。吴博士同时也是13项美国专利的发明人。
投递简历

扫描求职百题斩小程序
助求职者一壁之力

微信扫码助力

如果您对这家企业感兴趣,想要加入一同谋事,可上传您的简历。
投递简历