活动地点:校本部东区翔英大楼T516室
活动时间:2018-11-09 11:00:00
行健讲坛学术讲座第346期
时间: 2018年11月9日(周五)上午11:00
地点: 校本部东区翔英大楼T516室
讲座: 模块化端到端语音识别
演讲者: 俞凯 教授 上海交通大学计算机系
演讲者简介:俞凯,上海交通大学计算机系教授,思必驰公司首席科学家。清华大学本科、硕士,剑桥大学博士。长期从事交互式人工智能、语音及语言处理的研究和产业化工作。NSFC优青,IEEE Speech and Language Processing Technical Committee委员。中国人工智能产业发展联盟学术和知识产权组组长,CCF语音对话及听觉专业组副主任。发表论文 130 余篇,获得多个国际评测冠军。他创立的思必驰公司入选2016高盛全球人工智能报告"AI Key Players"及2017年Gartner"Cool Vendors for AI"。
讲座摘要:传统语音识别基于HMM的声学框架和n-gram语言模型框架进行,取得了很大进展,但也遇到了性能瓶颈。近年来,以Connectionist Temporal Classification (CTC) 和序列学习为代表的深度学习模型受到广泛重视,一类完全不同的语音识别框架:端到端语音识别模型被提出。这类模型以完整神经网络来对声学序列到词序列的映射建模,具有极高的效率和优化便捷性,但也存在不够灵活,信息资源利用不充分的问题。本报告将介绍一种新型的端到端框架:模块化端到端语音识别。既保留声学模型和语言模型的区别,继承传统框架的优势,又能有效利用神经网络实现端到端的映射,保留端到端模型的解码优势。该模型使用了基于CTC声学模型的音素同步解码技术,本报告将先介绍相关技术,再展开介绍模块化端到端模型。
邀请人:上海大学通信与信息工程学院 朱梦尧 副教授
欢迎广大教师和学生参加!