第一句子大全,网罗天下好句子,好文章尽在本站!

挑战“鸡尾酒效应” 三菱电机AI实现实时语音分离

时间:2023-12-15

这就是所谓的鸡尾酒效应我们可以不费劲地从嘈杂的环境中分离出其中一个人的发言

友情提示:本文共有 959 个字,阅读大概需要 2 分钟。

当我们在一个喧闹场所谈话时,尽管周边的噪音很大,我们还是可以听清朋友们说的内容,而当远处突然有人叫我们的名字时,我们也会马上注意到。这就是所谓的“鸡尾酒效应”——我们可以不费劲地从嘈杂的环境中分离出其中一个人的发言。

但是,当人们希望通过某种技术将目标人物的发言与其他人的发言分开时,结果往往和预期相差甚远,就像在一辆后座上都是小孩的轿车上使用免提电话一样。

不过,日本三菱电机日前表示,他们已成功解决这个问题。5 月 24 日,他们在东京举行的年度 R&D 开放日的公开演示会上展示了最新的语音分离技术。

在第一项演示中,两个人对着同一个麦克风演讲不同的内容。语音分离技术实时分离了两个句子(约 3 秒),然后以极高的准确性重新连续播放。但是,这次演示是在封闭的房间里进行的,而且所有观众都要求保持沉默,不能大声交谈。

第二项演示使用三个扬声器的模拟混合。不出所料,分离结果显然不尽人意。

三菱电机宣称,在低噪声环境和说话者都以相同音量交流这两个场景下,这项技术的准确度可达 90% 和 80%。而对于传统方法,即两个说话者使用单个麦克风,准确度只有约 50%。

这项语音分离技术采用了三菱自己的深层聚类技术,是一种基于人工智能的深度学习方法。

这个系统已经学会了如何检查和分离混合语音数,可以基于不同说话者的音调、音高、语调等对语音信号或元素进行编码,并对编码后的信号优化,使属于同一说话者的不同语音成份具有相似的编码,而属于另一说话者的语音成份具有不同的编码。聚类算法根据它们的相似性将编码分组,然后通过合成分离的语音成份来重构每个人的语音。

与分离语音信号和噪音不同,分离不同说话者的语音是非常困难的,因为它们有太多相似的特点。马萨诸塞州剑桥三菱电机研究实验室副主任 Anthony Vetro 说,“你可以在某种程度上做到,使用更精密的两个或更多麦克风来对说话者进行定位,但是只用一个麦克风的话的确很困难。”

他补充道,这个系统的优点在于在使用之前不用对说话者进行特殊的训练。同样地,它也不受语言本身的影响。

位于东京附近的三菱电机自然语言处理技术集团高级经理 Yohei Okato 表示,三菱电机将利用这项技术来提高语音通信的质量和自动语音识别(ASR)应用的准确性,例如使用ASR控制汽车和电梯,以及家里的小家电和小工具。

本文如果对你有帮助,请点赞收藏《挑战“鸡尾酒效应” 三菱电机AI实现实时语音分离》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(1)
  1. 那,年2023-12-29 08:10那,年[湖南省网友]203.34.251.169
    这个技术真厉害,期待未来能在我们生活中应用!
    顶9踩0
相关阅读
跨越沟通障碍 百度机器翻译重塑人类文明巴别塔

跨越沟通障碍 百度机器翻译重塑人类文明巴别塔

其中,大会全程使用的百度AI实时语音识别及实时翻译技术,让现场观众为之惊叹

2023-10-08 #经典句子

语音打字 实时翻译 动口不动手的时代来了!

语音打字 实时翻译 动口不动手的时代来了!

有时候就在想,要是动动嘴就能搞定这些文字稿,那岂不是美哉?拿到这款讯飞智能鼠标M110之后,我发现,动口不动手的办公时代来了!一、产品包装讯飞智能

2009-10-13 #经典句子

巨头暗战智能语音交互 实时翻译为何成又一个风口

巨头暗战智能语音交互 实时翻译为何成又一个风口

比如谷歌、百度在干着一件人工智能+汽车的大事,即无人驾驶;苹果、微软、搜狗等致力于将人工智能技术与语音服务场景结合,今年8月,搜狗推出全新语音交

2024-01-04 #经典句子

第二篇:语音识别&语音合成技术的概念 应用场景及原理解析

第二篇:语音识别&语音合成技术的概念 应用场景及原理解析

真是太神奇了!这里涉及到了语音处理技术

2023-12-14 #经典句子

鸿蒙AI字幕神器:日本片语音实时转中文字幕 打电话不用耳朵听?

鸿蒙AI字幕神器:日本片语音实时转中文字幕 打电话不用耳朵听?

我的频道主要聚焦数码、通信和潮流科技

2023-07-08 #经典句子

你还在把文字复制到浏览器翻译?苹果手机这个按钮 一键实时翻译

你还在把文字复制到浏览器翻译?苹果手机这个按钮 一键实时翻译

文字快速翻译:Spotlight负一屏搜索翻译Spotlight相信用过苹果手机的朋友都不陌生吧,这是苹果手机的搜索神器,使用它不仅能快速查找手机中的信息,还能

2018-11-26 #经典句子

中国工程师尝试复制巴别鱼 实现“实时语音翻译”

中国工程师尝试复制巴别鱼 实现“实时语音翻译”

新华社深圳4月26日电 记者 王丰科幻电影银河系漫游指南中,有一种神奇的巴别鱼,寄生在主人耳朵里,能自动将周围人群的脑电波转换成寄主那种类型的脑电

2014-07-20 #经典句子

AI同传的责难与正名 科技文明的进步与挑战

AI同传的责难与正名 科技文明的进步与挑战

而随着科技文明的前行,语言本身所具备的技能属性逐渐消退,新兴技术推进落地下的机器翻译乃至AI同传正走上舞台中央

2023-08-25 #经典句子