当前位置:首页>>新闻动态>>国内外动态>>机器听觉:一个新兴的领域

机器听觉:一个新兴的领域


发布日期:2011-10-10

2010年9月美国著名发明家、科学家和工程师Richard F. Lyon在IEEE信号处理杂志(IEEE Signal Processing Magazine)上撰文“Machine Hearing: An Emerging Field”。Lyon对机器听觉的发展提出了他自己的想法,在这里我们引用该文中的一些文字供读者参阅:
    “如果有机器能够像人类一样听声音,那么我们就对它有很多的想象和期待,例如能在有音乐和背景噪声的情况下分辨语音,能对语音或音乐中的一部分提取出来做特殊处理,能判断声音的方向,能学会知道哪些噪声是常规的哪些是值得注意的。听觉机器应该能够组织它们听到的声音,学会判别目标、动作、时间、位置、曲种、乐器、说话人的名字,并能通过这些名字检索其声音。这些机器应该可以在现实生活中听声音并做出反应,能够对值得注意的听觉事件做出适当的反应,能够参加到诸如工厂、音乐会或电话交流的活动中去。”
    “我们的计算机目前基本是聋的,因为它们对自己存储和处理的声音几乎没有概念。”
    “难道我们不应该让计算机听例如大量视频资源中的音频并能够分类、组织和检索吗?不仅仅是知道说话的内容,而更要知道这是什么音乐,知道发生了什么?几年来,基于内容的图像和视频分析已经得到了稳步发展,然而对于声音的分析还有些滞后。”
    “与机器视觉相比,机器听觉还处于婴儿期。”
    “我们希望和期待机器听觉能发展为一级的学术界和工业界的领域,就像机器视觉和机器学习那样。”
该文正文的主要内容对目前的机器听觉系统的构成进行了介绍,最后Lyon的结论是:
    “机器听觉领域正在开始起步。已经有了大量的相关应用,并且许多应用可以通过已知的听觉前端配合上特征提取、机器学习技术(这些技术已经在机器视觉领域得到了成功应用)来实现。”用于机器听觉的信号处理技术很多但并不十分复杂。非线性滤波器、相关器、矢量量化器和在线学习算法等已被采用,但目前还较为简单,仍有很大的空间进行研究和改进。听觉心理学和听觉生理学领域的合作将在两个方面起到很大作用。”
    “要治愈机器的耳聋问题,需要我们充实对于哺乳动物耳蜗神奇功能理解的知识,是我们努力的目标,这个目标将在未来的一段时间吸引很多领域的研究者参与进来。”
对于人类听觉系统的研究一直是我们实验室所关注的重点,这将为机器听觉大厦的构建添砖加瓦。

参考文献:
[1]. Richard F. Lyon. Machine Hearing: An Emerging Field. IEEE Signal Processing Magazine. Sept. 2010.

Copyright © 2010 - 2017 中国科学院声学研究所东海研究站-仿生耳与声音技术实验室 All Rights Reserved

地址:上海市嘉定工业区新徕路399号   邮编:201815   电话:021-67084688-6181

Designed by MOU Hongyu