您现在的位置是:首页 > 传感器

MIT发明出一种可识别讲话者身份的新传感技术

2021-12-24 02:02:04

美国麻省理工学院、微软和Adobe的研究人员发明了一种新技术,即借助于高速摄像机监视物体的振动,以还原声音。在一项实验中,科学家在15英尺(约合4.6米)外透过隔音玻璃拍摄一个薯片包装袋,而后通过分析包装袋的振动还原出可以分辨的谈话内容。

MIT发明出一种可识别讲话者身份的新传感技术

这项难以置信的技术可用于鉴别音乐、谈话或者其他声音,或将带来新的隐私保护问题。麻省理工学院研究生、这篇论文的第一作者戴维斯表示:“当声音击中物体时,能使物体产生振动。这种振动运动带来了非常微小、肉眼不可见的视觉信号。人们不会意识到存在这样的信息。”

研究人员采用的方法通常需要使用到每秒拍摄数千帧画面的高速摄像机。研究人员称,他们研发的这一算法能够从整体上对物体因声波撞击产生的振动进行分析。由于不同的边缘沿着不同的方向移动,这种算法需要将所有测量数据“排成一线”,防止不同方向的测量数据相互抵消。通过这种方式,科学家能够识别不同频率的信号,进而还原声音。

MIT发明出一种可识别讲话者身份的新传感技术

过这一方法,研究人员可以知道房间中讲话者的人数和性别。如果预先获得讲话者的语音信息,那么还能识别出讲话者的身份。