您现在的位置是:首页 > 传感器

亚马逊Alexa的深度学习与语音识别的核心技术原理

2022-08-26 02:02:29

亚马逊Alexa首席科学家Nikko Strom博士是语音识别领域级别最高的牛人。1997 年从瑞典皇家理工学院语音通信实验室取得博士学位,后进入MIT计算机科学实验室。2000 年加入语音技术新创Tellme Networks。2007 年被微软收购后,加入微软推进商业语音识别技术研究。2011 年加入亚马逊,担任首席科学家,领导语音识别及相关领域的深度学习项目。

近几年他致力于分布式深度学习训练研究,论文已于2015年发表。

在美中技术与创新协会(AssociaTIon of Technology and InnovaTIon,ATI)主办的第一届“AI NEXT”大会上,亚马逊Alexa首席科学家Nikko Strom博士介绍了亚马逊Alexa的深度学习与语音识别的核心技术原理,以下是他的演讲全文:

(Nikko Strom于今年1月发表过同题演讲,使用相同的幻灯片,部分图片为1月时使用的幻灯片。)

今天我要谈谈Alexa的深度学习技术。我会先介绍一下Alexa,然后再说明我们如何将深度学习应用于处理如此大规模的数据,之后我将介绍语音识别和语句合成的技术细节,这是我们主要应用深度学习的两个领域。今天我在这里不是为了讲技术具体原理,所以如果你们希望听的是技术处理的细节,或许在下午的活动中会更开心。最后我将谈谈我们与业界和学界的伙伴合作的其他项目。