模块化端到端语音识别-上海大学党委研究生工作部官方网站


模块化端到端语音识别


创建时间： 2018/11/07 侯雅荟浏览次数：返回

活动地点：校本部东区翔英大楼T516室

活动时间：2018-11-09 11:00:00

行健讲坛学术讲座第346期

时间: 2018年11月9日（周五）上午11：00

地点: 校本部东区翔英大楼T516室

讲座: 模块化端到端语音识别

演讲者: 俞凯教授上海交通大学计算机系

演讲者简介：俞凯，上海交通大学计算机系教授，思必驰公司首席科学家。清华大学本科、硕士，剑桥大学博士。长期从事交互式人工智能、语音及语言处理的研究和产业化工作。NSFC优青，IEEE Speech and Language Processing Technical Committee委员。中国人工智能产业发展联盟学术和知识产权组组长，CCF语音对话及听觉专业组副主任。发表论文 130 余篇，获得多个国际评测冠军。他创立的思必驰公司入选2016高盛全球人工智能报告"AI Key Players"及2017年Gartner"Cool Vendors for AI"。

讲座摘要：传统语音识别基于HMM的声学框架和n-gram语言模型框架进行，取得了很大进展，但也遇到了性能瓶颈。近年来，以Connectionist Temporal Classification （CTC）和序列学习为代表的深度学习模型受到广泛重视，一类完全不同的语音识别框架：端到端语音识别模型被提出。这类模型以完整神经网络来对声学序列到词序列的映射建模，具有极高的效率和优化便捷性，但也存在不够灵活，信息资源利用不充分的问题。本报告将介绍一种新型的端到端框架：模块化端到端语音识别。既保留声学模型和语言模型的区别，继承传统框架的优势，又能有效利用神经网络实现端到端的映射，保留端到端模型的解码优势。该模型使用了基于CTC声学模型的音素同步解码技术，本报告将先介绍相关技术，再展开介绍模块化端到端模型。

邀请人：上海大学通信与信息工程学院朱梦尧副教授

欢迎广大教师和学生参加！

上一条：系统动力学方法对信息系统研究的理论发展和实际应用

下一条：阐释三境界

首页

党建思政

学生事务

实践育人

信息服务

学生组织

文件下载

关于我们

新闻中心