首页 > 资讯 > 正文

观焦点：MIT研究人员发明可以用声音模拟世界的人工智能系统

来源：cnBeta 2022-11-01 18:55:41

(资料图片)

计算机视觉是一个在过去几十年中被研究得相当多的领域，主要是因为它在建造自动驾驶汽车和其他可以像人类一样"看"世界的工具方面有着直接和明显的应用。然而，直到最近才看到这种水平的研究的一个领域是使用声音而不是视觉来模拟环境。现在，麻省理工学院（MIT）的研究人员已经撰写了一篇研究论文，涉及在这一领域训练的机器学习（ML）模型的构建。

麻省理工学院新闻网站上的一篇博文介绍说，MIT-IBM沃森人工智能实验室合作建立了一个ML模型，利用空间声学来观察和模拟环境。简单地说，这个模型通过弄清听众如何听到从某一点发出的声音并传播到不同的位置，实现了环境的映射。

这种技术有许多好处，因为它可以只用声音来确定环境物体的基本三维几何形状。然后，它可以呈现准确的视觉效果来重建环境。潜在的应用包括虚拟和增强现实，以及增强人工智能代理，使其能够利用声音和视觉来更好地可视化其环境。例如，与计算机视觉相比，水下探索机器人可以利用声学来更好地确定某些物体的位置。

图形显示的是房间的3D模型，下面是带有声音的热视图类型的概念

研究人员强调，建立这种基于声音的ML模型要比基于计算机视觉的模型复杂得多。这是因为计算机视觉模型利用了一种叫做光度一致性的属性，这意味着一个物体从不同角度看时看起来大致相同。这不适用于声音，因为根据聆听方的位置和其他障碍物，从一个源头听到的东西可能非常不一样。

为了解决这个问题，研究人员使用了另外两个特征，即互易性和局部几何学。前者基本上意味着，即使交换了说话者和听众的位置，声音也会完全相同。同时，局部几何映射涉及在神经声场（NAF）中结合互易性来捕捉物体和其他建筑组件。

为了让ML模型在测试环境中工作，需要向它输入一些视觉信息和光谱图，其中包含基于发端者和听众的指定位置的音频听起来会是什么样子。根据这些输入，该模型可以准确地确定当听众在环境中移动时，声音将如何变化。

该研究论文的主要作者Andrew Luo指出：“如果你想象自己站在一个门口附近，对你听到的声音影响最强烈的是那个门口的存在，而不一定是房间另一边离你很远的几何特征，我们发现这些信息比简单的全连接网络能更好地概括。”

展望未来，研究人员希望进一步加强该模型，使其能够将更大、更复杂的环境可视化，如一栋建筑甚至整个城市。

标签：研究人员计算机视觉麻省理工学院

编辑：

【全球时快讯】高性能高智能岚图追光能成为同级标杆吗

2022-12-16 10:14:17

岚图汽车在电动SUV热度高涨时凭借岚图FREE入场，收获了市场肯定后却并没有像某些企业一样一直执着于SUV车型

名爵将为Cyberster众筹用户提供新能源补贴

2022-12-16 10:15:58

我们从上汽名爵官方获悉，名爵将会为所有的Cyberster众筹用户提供“新能源补贴”。未来，用户在名爵Cyberster上市后三个月内完成购买，且订单

【全球热闻】比亚迪两款新能源车预计2023年墨西哥上市

2022-12-16 10:30:07

比亚迪近期在接受调研时表示，11月底，公司在墨西哥举行媒体试驾活动，并在该国首次亮相汉、唐两款新能源车型，这两款车型预计于2023年在墨西

Nikola将向Plug Power出售75辆氢动力卡车环球百事通

2022-12-16 10:17:48

据财联社报道，12月15日，电动卡车制造商Nikola周四表示，将在三年内向燃料电池技术开发商PlugPower出售多达75辆Tre氢动力卡车

【速看料】福特提高F-150 Lightning电动皮卡的价格

2022-12-16 10:23:53

据财联社援引路透社报道，福特汽车公司网站周四显示，该公司将其最便宜款的F-150Lightning电动皮卡的价格上调了9%，至55974美元

美媒欢呼！可控核聚变点火成功，在无限清洁能源领域真的抢先一步？

2022-12-16 10:22:48

肉体凡胎捧出的“太阳”，是否从一开始就被黑心所污染？年末常有大事发生，前几日，这一硕果降落在核聚变领域，即使只是不到一秒的突破也足以

特斯拉市值两年来首次跌破五千亿美元

2022-12-16 09:19:06

当地时间12月14日，特斯拉公司股价持续下跌，导致该公司市值自2020年11月以来首次跌破了5000亿美元大关。

加快能源布局广汽集团与南网科技达成合作

2022-12-16 09:22:31

12月15日，广汽集团与南方电网电力科技股份有限公司（简称“南网科技”）签订战略合作协议，旨在能源生态产业链领域开展合作。

远景动力英国第二座动力电池工厂破土动工_短讯

2022-12-16 09:07:50

12月9日，英国首个超级电池工厂、远景动力桑德兰第二工厂正式开工建设，首期规划年产能12GWh，将于2025年投入运营，预计每年可为全球超过10万

马恒达将投资建设新的电动汽车工厂

2022-12-16 09:29:19

据IT之家报道，12月14日，印度汽车制造商马恒达（Mahindra）和马恒达有限公司表示，将投资1000亿印度卢比（约84 4亿元人民币），在西部城市浦

传福特和宁德时代考虑在美国合建电池厂:世界最新

2022-12-16 09:10:15

据彭博社报道，福特汽车和宁德时代正考虑合作在美国密歇根州建立一家电池制造厂，以获得美国新的税收优惠。知情人士透露，密歇根州和弗吉尼亚

迅雷高速通道使用方法是什么？迅雷影音如何设置倍速播放？

2022-12-16 09:33:14

迅雷高速通道怎么用?1、打开迅雷后，在迅雷的左上角登录您的迅雷帐号。2、选中下载任务点击启用高速通道。3、建立新的高速通道任务。4、享

迅雷怎么设置免打扰模式？迅雷app设置密码锁步骤是什么？

2022-12-16 09:32:24

迅雷怎么设置免打扰模式?1、点击主页面上方的设置按钮，可以打开迅雷下载设置界面。2、在迅雷下载设置界面可看到很多迅雷下载软件的设置项

微信电脑版能抢红包吗？微信不能抢红包的原因有哪些？

2022-12-16 09:31:41

微信电脑版能抢红包吗?电脑版微信抢红包实际测试结果：苹果设备发出的红包不能显示出来提示收到不支持的消息，可在手机上查看。安卓用户发

百度杀毒自主查杀设置方法是什么？怎样彻底查杀电脑病毒？

2022-12-16 09:30:59

百度杀毒怎么自主查杀?自定义查杀：点击自定义查杀，我们可以选择自己要查杀的盘(包括U盘)闪电查杀：点击闪电查杀，百度杀毒会为你快速查杀

热图推荐

特斯拉市值两年来首次跌破五千亿美元

加快能源布局广汽集团与南网科技达成合作

远景动力英国第二座动力电池工厂破土动工_短讯

马恒达将投资建设新的电动汽车工厂

创世纪

win10开启休眠功能的步骤是什么？ Win10没有休眠选项怎么回事？

win10邮件应用80070032错误怎么办? win10邮件添加账户没反应的方法

firefox火狐浏览器怎么实现同步？火狐浏览器打不开解决方法是什么？

火狐浏览器中使用网银方法是什么？火狐浏览器怎么安装插件？

可牛影像拼图教程是什么？可牛影像拍照的使用方法是什么？

word没保存恢复方法是什么？ word如何找回以前的文档？

通信

最近更新

热点

近日，百度智能云发布5款云服务器BCC（Baidu Cloud Compute）实例，搭载第三代AMD EPYC 处理器（Milan），旨在面对更多元化的计算应用

12月2-4日，由福建省工业和信息化厅、福建省教育厅、福建省人力资源和社会保障厅、福建省商务厅、福建省科学技术厅、福建省总工会、共青团

经过二十多年的发展，国产品牌RTK设备厂商迅速成长。如今行业和地产等产业链增长放缓，长期由需求侧拉动的RTK设备市场想要得到进一步的发展

11月25日,开迈斯-支付宝充电站发布与落成典礼在杭州市滨江区智选假日酒店隆重举行,开迈斯新能源科技有限公司投后运营总监张震宇与会热烈致

11月13日，2022领克赛道嘉年华暨巅峰车手计划总决赛在宁波国际赛道圆满落幕。本次嘉年华以为速度+冕为主题，开展领克巅峰车手计划总决赛、

2022年是驱动人生走过的第15个年头，在这15年间有创业初期的摸爬滚打，有与困难你来我往的过招，有精益求精的技术迭代，也有一代代驱动成员