从谷歌地图与华为Cyberverse来看AI视频技术
文库划重点:谷歌地图的“实时视图”会将所有指南针投射到外部,而不是通过摄像头和传感器的来实现定向。谷歌称该系统为“VPS”或“视觉定位系统”。手机的GPS缩小了用户的位置,用户的摄像头则收集周边的信息,而谷歌地图的AR模式将相机镜头视图与街景视图中的大量视觉数据相匹配,借助于人工智能AI进行比较分析,从而获得用户所处位置。
近日,谷歌地图向所有用户开放了AR导航功能。其实早在去年的I/O大会,谷歌便宣布将会在Google地图中集成这一功能,并已在今年年初向部分Pixel用户提供了Alpha测试版。
谷歌AR导航功能称为“实时视图”(Live View),它旨在帮助人更顺畅地进行步行导航。也就是说,这种导航并不适用于传统意义上的汽车导航。但是,当用户在走下汽车并需要步行这样的场景中,它可能会比传统的2D导航更为精准与形象。
众所周知,手机地图导航目前通常借助的是GPS与指南针的结合。利用GPS来进行位置确定,然后以指南针来指示方向。但这往往存在许多问题:比如地图上代表自身位置的蓝点发生了偏移,又比如指南针发生了bug。这些问题在发生时往往容易让人“误入歧途”,耽误了宝贵的时间。
因此,谷歌地图的“实时视图”会将所有指南针投射到外部,而不是通过摄像头和传感器的来实现定向。谷歌称该系统为“VPS”或“视觉定位系统”。手机的GPS缩小了用户的位置,用户的摄像头则收集周边的信息,而谷歌地图的AR模式将相机镜头视图与街景视图中的大量视觉数据相匹配,借助于人工智能AI进行比较分析,从而获得用户所处位置。在谷歌获得用户所在位置的数据基础上,VPS也将清楚到用户在三维空间中的位置和前进方向。这使得它比指南针更准确,从而可以判断用户的确切位置和面向。
巧的是,就在近期的华为开发者大会期间,华为罗巍也正式对外发布了“Cyberverse”。Cyberverse由cyber(Cyber数字)和verse(universe宇宙)构成,寄托了这一功能“开启数字新世界”的愿景,是一项结合AR技术的3D高精度地图服务。
Cyberverse共有4项核心能力,包括3D高精地图能力(HDMAP)、全场景空间计算能力、强环境理解功能和超逼真的虚实融合渲染能力。其中,全场景空间计算能力是全场景的、全天候的,不分室内、室外、白天、晚上等不同的光照条件,都可以提供空间计算定位定姿能力。结合华为的GPS、室内WiFi定位以及VPS定位、SLAM定位等技术组成,Cyberverse在AI的帮助下,可以让手机解算出自身的厘米级定位以及1度以内定姿的高精度位姿信息。而这一点,是Cyberverse能提供AR视觉体验的基础。
不论是谷歌地图还是Cyberverse,都不难看出他们是依托于目前强大的人工智能而存在的。虽然他们的最终目的存在一定的差异化,但其核心都是以AI来对视频中的内容进行识别,从而确定位置,调动后台的实地信息进行引领。
这已经不是人类第一次尝试AI视频识别技术的落地了。在经历了文字、图片的时代之后,能承载大量信息的视频逐渐进入公众的视野,并承担着新一代流量入口的重任。据网络公开数据报告显示,互联网流量70%以上来自视频,未来这个数据将超过90%。
可也正是因为视频的信息量过于巨大,以人力很难对其中的信息进行完整的分辨与解析,更遑论加之以应用。在这种前提下,将AI识别运用于视频之中的想法应运而生。许多企业与个人纷纷开始对此进行研究:比如谷歌去年举办的2018 Google地标识别挑战赛,其获胜者极链科技便是一匹视频AI领域的年轻黑马。它的目标之一,便是通过AI视频识别技术来进行精准的广告投放,从而推动视联网概念的打造。再比如目前风靡的人脸识别支付,也是依托人工智能才得已实现。这些实际应用的成功,充分说明了该技术对于人类的日常生活可以起到一个积极的推动作用。
回到Cyberverse来看,随着它的建设,一种与真实世界关联的全新的虚实融合的交互与视觉体验将出现在用户面前。借助于AI的强大能力,使用者可以看到物理空间的数字属性,如楼宇虚拟标牌、楼宇出入口的虚拟呈现和园区服务设施的虚拟标牌等;也可以看见智慧园区IoT信息,如室内温度湿度,空气质量和人数等楼宇智慧信息,以及会议室名称、预定情况与是否有人等会议室智慧信息等。可以说,Cyberverse不仅能进行3D步行导航,更能带来虚实融合的全新视频体验。
随着科技的发展,AI必将越来越智能化,视频也将演变成我们大部分的信息来源。届时如何去实现两者的结合,如何挖掘出它们更深层次的应用,必将是我们人类所要思考的问题。
收录于哈希力量,手机站省略本文固定网址