实战特训:远场语音交互技术(线上班,开发板限量放送)

开课时间:5月17日开课,线上授课
开课时长:20+课时,课程上线后,至少两次直播答疑
现价:¥1,699
原价:¥1,999
课程介绍

【课程优势】

  • 三大知识模块,深入了解AI设备语音交互关键技术
  • 理论+实战,了解VOIP的核心技术及其应用
  • 资深专家授课,掌握远场语音识别系统如何搭建
  • 实例解析,对Echo音响拆解及技术进行剖析
  • 超值福利,价值1999元的开发板放送,仅限10套! 

【课程介绍】

该课程主要讲解语音信号处理麦克风阵列信号处理语音识别中的关键技术及实用技巧通过该课程的学习可以了解目前AI设备智能音响、机器人、车载设备等中语音交互的关键技术根据一些开源软件及硬件设备可以搭建一套远场语音识别系统同时语音信号处理中的回声消除、噪声抑制技术也是VOIP的核心广泛应用于各类直播平台、即时通讯等应用软件中。

【讲师介绍】

冯大航,声智科技CTO

2007年开始从事语音信号处理,麦克风阵列信号处理,语音识别方向研究,在语音交互领域已经积累10年经验。


2007年毕业于中国科学技术大学电子信息工程系,2007-2012年在中国科学院声学研究所读博士,博士期间在阵列信号处理方向发表多篇SCI、EI论文,2012年获得中国科学院院长奖学金,毕业后在中国科学院声学研究所任助理研究员,工作期间获得国家自然科学基金项目,同时参与了多个国家重大项目;2015年曾任职于云知声负责远场语音识别前端算法,2016年5月联合创建声智科技。

【课程大纲】
一、语音交互概述
 
1、语音交互行业发展未来趋势
2、麦克风介绍
  • 麦克风类型
  • 重要参数含义
3、Echo音响拆解及技术剖析
 
二、让智能设备听得清:麦克风阵列信号处理
 
1、回声消除技术
2、波达方向估计技术
3、波束形成技术
4、单通道语音增强技术
5、去混响技术
6、各个技术之间的联系
 
三、让设备听得懂:语音识别技术
 
1、语音识别基础
2、语音识别原理
  • 特征提取
  • 声学模型训练
  • 声学解码
  • 语音模型
3、搭建语音识别系统一般流程
4、远场语音识别声学模型匹配
 
【开课安排】
时间:5月17日课程上线,上线后可随时观看
授课形式:线上录播视频+讲师线上直播答疑 
 
【学员福利】
1、GPU服务
提供长达1个月的GPU服务,快速提升学员的实战开发能力。
2、价值1999元的开发板放送
抽取10名积极学员,每人提供一套价值1999元的SAI_MICA_41T-UI、USB版本的开发版,增强实操练习,有效提高学习效率。
3、优秀学员内推AI企业
优秀学员可内推BAT和AI企业,跳过层层审核,直达管理层
4、进入学员群,获免费参与活动福利
不定期邀请大牛进行线上/线下的分享,进入一线语音公司面对面交流
课程目标
  • 深入了解目前AI设备(智能音响、机器人、车载设备等)中语音交互的关键技术
  • 了解VOIP的核心技术及其应用
  • 学会如何搭建一套远场语音识别系统
  • 对Echo音响拆解及技术进行剖析
适合人群
  • 有语音信号处理经验、想深入解语音技术的从业者
  • 做过语音交互技术相关项目的从业者
  • 上过语音交互等相关课程的老师与学生

相关课程

NLP实战特训班:阿里IDST9大专家带你入门
开课日期:4月8日—4月9日,周六周末开课; 9位专家线上视频直播授课;开始
5922
¥1,499 ¥999
CCF-ADL78:深度学习专场
开课日期:4月15日课程上线,8位学术大牛坐镇!开始
3820
¥699 ¥699