华盛顿大学的人工智能技术可让耳机佩戴者选择特定的声音来听

华盛顿大学的人工智能耳机技术只允许特定声音通过。(图片来源：YouTube 上的保罗-艾伦学校）

华盛顿大学领导的一个团队开发出了人工智能耳机技术，允许佩戴者选择特定的声音来听，同时屏蔽所有其他声音。这种先进的降噪技术可以针对从动物到机器的任何声音，创造出一种名为语义听觉的新型声音定位技术。

David Chien (translated by Ninh Duy), Published 11/15/2023 🇺🇸 🇪🇸 ...

AI Audio Wearable

华盛顿大学（UofW）计算机科学研究人员领导的一个团队为耳机开发出了AI 软件，允许佩戴者选择特定的声音。与简单过滤掉除声音以外一切声音的降噪耳机不同，新的神经网络允许用户选择特定的声音，如鸟鸣声。

索尼 INZONE 耳机（亚马逊有售）等耳机使用DSEE Extreme、Speak-to-Chat 和 AI DNN。和AI DNNAI 技术来改善音乐和语音质量，同时在开始对话时自动让声音降噪。西弗吉尼亚大学的研究成果在此基础上更进一步，允许听者从 20 种不同类型的声音中进行选择，如鸟鸣声、海洋声、敲门声和厕所冲水声，同时过滤掉其他所有声音。这种方法被称为语义听觉，可以让用户在公园里欣赏鸟鸣，而听不到人们的谈话或汽车驶过的声音。

目前，华盛顿大学的应用程序利用双耳麦克风捕捉外部声音的实时位置，然后将过滤后的声音发送到耳机。由于该软件在智能手机上运行，他们的应用程序可以利用比耳机更强大的 CPU，不过，降噪耳机内置语义听觉只是时间问题。

华盛顿大学人工智能语义听觉只允许特定声音通过，例如敲门声。(图片来源：YouTube 上的保罗-艾伦学校）

华盛顿大学的人工智能噪音消除技术能过滤 20 种不同类型的声音。(图片来源：ACM 上发表的华盛顿大学研究文章）

华盛顿大学的人工智能耳机技术利用神经网络过滤声音。(图片来源：YouTube 上的保罗-艾伦学校）

资料来源

华盛顿大学,ACM和Paul G. Allen School(YouTube)

▶ ▼ 新闻稿

2023 年 11 月 9 日

新型人工智能降噪耳机技术让佩戴者选择听到的声音

斯特凡-米尔恩

华盛顿大学新闻

大多数使用过降噪耳机的人都知道，在正确的时间听到正确的声音至关重要。有人在室内工作时可能想消除汽车喇叭声，但在繁忙的街道上行走时却不想。然而，人们无法选择耳机能消除哪些声音。

现在，华盛顿大学研究人员领导的一个团队开发出了深度学习算法，让用户可以实时选择哪些声音可以通过耳机过滤。该团队将这一系统称为 "语义听觉"。耳机将捕捉到的音频流传输到连接的智能手机上，智能手机会消除所有环境声音。通过语音指令或智能手机应用程序，耳机佩戴者可以从警报声、婴儿哭声、说话声、吸尘器声和鸟鸣声等20类声音中选择他们想要的声音。耳机只会播放选定的声音。

研究小组于11月1日在旧金山举行的UIST'23大会上展示了他们的研究成果。未来，研究人员计划推出该系统的商业版本。

"资深作者、华盛顿大学保罗-艾伦计算机科学与工程学院教授希亚姆-戈拉科塔（Shyam Gollakota）说："理解鸟的声音并将其从环境中的所有其他声音中提取出来需要实时智能，而目前的降噪耳机还无法做到这一点。"挑战在于耳机佩戴者听到的声音需要与他们的视觉感官同步。你不可能在别人跟你说话两秒钟后就听到他的声音。这意味着神经算法必须在百分之一秒内处理声音。

由于时间紧迫，语义听觉系统必须在联网智能手机等设备上处理声音，而不是在更强大的云服务器上。此外，由于来自不同方向的声音在不同时间传入人们的耳朵，该系统必须保留这些延迟和其他空间线索，以便人们仍能有意义地感知周围环境中的声音。

该系统在办公室、街道和公园等环境中进行了测试，能够提取警笛声、鸟鸣声、警报声和其他目标声音，同时消除现实世界中的所有其他噪音。当 22 名参与者对系统输出的目标声音进行评分时，他们表示与原始录音相比，平均质量有所提高。研究人员指出，在更多真实世界数据上训练模型可能会改善这些结果。

这篇论文的其他共同作者还有：Bandhav Veluri 和 Malek Itani，他们都是华盛顿大学艾伦学院的博士生；Justin Chan，他在完成这项研究时是艾伦学院的博士生，现就职于卡内基梅隆大学；以及 Takuya Yoshioka，AssemblyAI 的研究主管。

欲了解更多信息，请联系 [email protected]。