相关新闻
-
工业互联网正在改变什么?
2026-04-25 10:08随着新基建提速,工业互联网网站开发赋能效应不断凸显,为更多行业的数字化转型注入蓬勃动力。今天,随着业界对于工业互联网的关注度不断提升,越来越多跨行业、跨领域的工业互联网平台涌现,不仅助推传统
-
不知不觉中“互联网+体育”走进我们的生活
2026-04-17 10:33随着人们收入和生活水平逐渐提高,催生了对生活品质的更高追求。健身作为一项有益于身心健康的项目,正在被越来越多的人所选择和青睐。在国家政策的指引与扶持下,在全民健身热潮如火如荼的影响下,201
-
这些都是常见的网站设计误区,你注意到了吗?
2026-04-14 13:41网站的设计问题常常被人们提到,设计的趋势每年也都在发生着变化,设计时无止尽的。由于每个人的审美都有所不同,所以在设计上是没有的,很多人在进行网站设计时,会陷入某些误区。今天我们根据近几年的设
-
如何正确的拥抱产业互联网
2026-04-04 10:08回过头去,我们再去看待那个异常火热的消费互联网时代,依然是喜忧参半的。喜的是,我们并不需要投入太多,便可以掘得人生当中的第一桶金;忧的是,我们始终都无法找到深度改造行业的最佳模式。正是在这样
-
社交电商的顽疾,利用产业互联网利刃“去除”
2026-03-31 17:18虽然很多人都在说电商网站建设行业正在经历一场从未有过的大调整,但是,大调整的同时,电商网站建设行业并未停止进化,这个发展业已成熟的行业正在为寻找新的发展契机而努力。社交电商便是在这样的大背景
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。
15044853365
现在就想找顾问聊聊立即咨询