发布网友 发布时间:2024-08-28 02:59
共1个回答
热心网友 时间:2024-08-28 03:22
谷歌近来在增强现实(AR)领域的动作频繁,不仅为谷歌地图、谷歌搜索加入了AR功能,还通过收购Raxium和从微软、Meta挖角人才,以及有传言称重组的实验室有半数人在研发AR头显,显示出其在AR硬件和平台上的雄心。
谷歌的AR平台ARCore的动态同样值得关注。尽管苹果和谷歌分别拥有ARKit和ARCore,但这两家公司在AR领域的公开/秘密动作不断,新内容发布却渐少,值得关注的大更新较少。值得注意的是,ARKit支持LiDAR传感器,该功能提升了3D定位效果,为房间级AR体验带来可能。
谷歌对于ARCore的更新也较为缓慢,但今年的I/O大会展示了多项AR相关更新和展示,包括ARCore Geospatial API的发布,该API向AR开发者开放Live View AR定位技术,旨在推动AR在室内外导航、LBS AR游戏等丰富应用场景的开发。
Geospatial API的发布,为开发者提供了Live View的底层技术,包括大规模云锚点功能和全球视觉定位系统的访问权限,用于开发多人共享的AR应用。该技术基于谷歌地球3D模型数据和街景图像数据,能够将数百亿张街景图像转换为支持VPS定位的3D点云,共提取了数万亿个3D数据,只需不到一秒时间,便可根据3D点云数据定位设备的位置和方向。
此外,谷歌还推出了Cloud Anchors本地映射功能,允许开发者在物理位置固定AR内容,无需到现场或扫描物理空间,节省了LBS AR内容的开发时间和成本,同时在任何街景地图覆盖的地方,用户都可以用手机相机扫描周围环境,快速、准确地获取AR导航等内容。
谷歌鼓励开发者利用Geospatial API开发AR内容,并提出了“将世界变成自己的画布”的口号,旨在构建全球规模的AR内容。谷歌表示,Geospatial API包含了谷歌地图15年来对于现实世界的探索,可帮助开发者构建更身临其境、内容更丰富、更实用的AR应用。
目前,一些品牌和开发者已经开始采用该API,如NBA、Snap、Lyft等,他们将谷歌AR定位技术应用于教育、娱乐、公共事业等场景。共享电动车公司Bird和Lime利用AR导航指导用户正确停放电动车/滑板车,而Telstra和埃森哲则利用AR为体育迷/音乐会观众提供室内导航功能,帮助他们找到座位、摊贩和洗手间。此外,DOCOMO和Curiosity基于ARCore Geospatial API打造了一款交互式AR游戏。
谷歌还希望更多开发者基于Geospatial API为火车站、商场、机场等室内场景打造AR导航/地图。此外,谷歌的Niantic一直在开发LBS AR游戏,本月下旬的开发者大会上也将发布自己的VPS视觉定位系统,与谷歌合作的可能性也存在。
AR云、VPS定位一直是AR初创公司的红海项目,很多公司难以在这一领域取得有效成果。对于掌握大量街景视觉的谷歌来说,切入VPS视觉定位有着十足优势。谷歌此举一方面对众多初创公司构成沉重打击,另一方面为开发者提供了基于开放的VPS平台展开更多业务的机会。
此外,谷歌还推出了3D地图模式:“Immersive View”(沉浸视图模式),允许用户在谷歌地图上以更沉浸、更具互动性的方式探索城市、地标、餐厅、场馆、名胜古迹等地点。该模式利用计算机视觉和AI技术,将街景和航拍图融合成视觉立体的地图模型,并加入“时间滑块”功能,允许用户查看特定地区在一天中不同时间的外观变化,如在黄昏时可以看到月光。在查看建筑内部时,沉浸视图也可以让用户看到室内的大量细节和角度。
沉浸视图模式将于今年下旬在安卓和iOS系统推出,首发仅面向部分城市,包括洛杉矶、伦敦、纽约、旧金山和东京,未来还将陆续支持其他城市。
此外,谷歌还扩展了Google Lens智能镜头的“多重搜索”功能,加入了“附近搜索”功能,允许用户将视觉搜索结果连接到附近的地点。多重搜索是一种同时用文本和图像进行搜索的功能,允许用户进一步设定颜色、附近等关键词,来优化搜索结果。除了购物等日常生活场景,谷歌认为视觉搜索还可以解决社会上的问题,如帮助人们学习环保、帮助救灾人员快速整理捐款等。
在I/O大会上,尽管谷歌并未展示Google Lens在AR眼镜上运行的效果,但展示了AR眼镜的另一种场景:实时翻译,将自然语言转化为文字,帮助用户与周围的人更流畅沟通。未来谷歌在普通眼镜形态的AR硬件中实现强大功能的潜力令人期待。