【注:本文图片均来源于互联网,文章未经授权禁止转载!部分图片与本文无关,只为方便读者理解,关注我们每天阅读更多精彩内容】
1.【今日资讯头条 | 百度CTO王海峰获得联合国工业发展组织全球科技创新奖「突出贡献奖」】
来源:机器之心
9 月 29 日,2019 联合国工业发展组织全球科技创新大会在上海召开。本次大会由科技部社会发展科技司、商务部中国国际经济技术交流中心指导,上海市科学技术委员会、上海市虹口区人民政府、联合国工业发展组织上海全球科技创新中心共同主办。会上,百度首席技术官王海峰获颁「全球科技创新奖突出贡献奖」。
全球科技创新奖旨在表彰全球范围内在科技创新方面取得杰出成就的团队和个人。王海峰被业界称誉为「少有的学术与工程实践并举的科学家」,多年来一直专注于人工智能相关技术的研究和产业应用,兼具深厚的理论修养和丰富的实践经验。
松宝有话说:能在学术和工程上并举的科学家真的不多了。
2.【新闻 | Daniel Povey出任爱数智慧首席科学家顾问】
来源:搜狐科技
近日,语音识别开源工具 Kaldi之父,Daniel Povey,正式接受北京爱数智慧科技有限公司的邀请,出任爱数智慧的首席科学家顾问(Principal Scientist Advisor)。
Daniel Povey 曾任约翰霍普金斯大学语言和语音处理中心的助理研究教授。他是著名的语音识别开源工具 Kaldi 的主要开发者和维护者,被称为是 Kaldi 之父。Kaldi 集成了多种语音识别模型,包括隐马尔可夫和最新的深度学习神经网络,被认为是业界语音识别框架的基石,受到一大波人工智能学习和应用者的关注。
松宝有话说:期待这位天才会给中国语音处理领域带来怎样的宝藏。
3.【新闻 | 语音生成效果评价不再逐句进行:谷歌提出长文本语音生成评价新系统】
来源:机器之心
随着未来 5G 移动互联网网络的飞速发展,语音交互将有可能取代键盘和触摸成为语音输入的主导方式。但生成的语音是否逼真自然,又如何进行评价呢?传统的评价方法往往局限于单独语句,而无法对整段生成语音的效果进行全面系统的评价。近日,谷歌研究人员对评价多行文本生成语音的几种方法做了对比,并给出了不同语音呈现方法下的平均意见得分(MOS)结果。
当涉及多个句子时,生成语音的评价并不容易。单独评定句子的传统方法并不能给出全面的解读,并且在提供上下文的情况下评价者应注意锚定效应。因此,对完整段落进行评价可能是最保守的方法。
松宝有话说:希望他们的研究结果有助于推进长篇语音生成领域未来的研究。