论文部分内容阅读
微软Streetside将挑战Google街景:必应地图的Streetside视图服务可以将整个城市图像化,帮助用户在陌生的城市里旅行。与Google街景相比,微软Streetside对隐私问题的处理更加谨慎。
Google街景视图的发布给用户带来了令人震撼的体验。但是,并非只有Google的街景车在城市的道路之间穿行,微软也发布了一个类似的项目——必应地图的Streetside服务。目前,该项目主要针对美国城市,今年,微软的Streetside车会开到欧洲大陆,搜集更多城市的视图信息。但是微软还没有给出确切的日期。
无论是Google还是微软提供“街景”服务的最大投入均花在了对海量数据的收集和整理上。相对而言,微软的Streetside视图更加丰富,可查看多种不同视角的视图,同时,微软Streetside谨慎地避开了任何可能引起隐私问题的情况,比如不会收集Wi-Fi信息和人脸的清晰图像等。
微软的Streetside专用车在扫描周围环境时,主要搜集3种数据:GPS坐标、照片和激光测距信息(通过Lidar:Light Detection and Ranging激光雷达)。被固定在车顶上的UltraCam包含6个镜头,可以同时拍摄6幅不同角度的2048×2048像素照片,然后合成一张周围环境的360°全景快照。这里用到的高性能UltraCam摄像头是由奥地利公司Vexcel开发的,这家专注于利用航拍卫星照片等数据创建地图的公司已经被微软收购,为微软的Streetside视图提供技术支持。其实Streetside的最大亮点是可以在浏览器里查看城市的三维立体全景图,这一特性通过Lidar激光雷达的实时激光测距功能实现。
Lidar激光雷达通过发射激光光束并计算激光被物体遮挡后反射回来的时间,来测量周围物体之间的距离。一般在比较狭窄的城市道路上,UltraCam摄像头会每隔4m拍摄一次周围环境的全景图。在比较宽广的道路上,只要每隔8m拍摄一次即可。Streetside专用车每向前行进1Km,就会拍摄到1500张照片,从而组成250张全景图像。另外,Streetside专用车的速度保持在10km/h~ 14km/h之间,而且需要尽量在晴朗的天气下工作,这样才能保证拍摄图像时能有比较好的光照条件。照片拍摄完成后,“满载着”图像的硬盘将被快递到位于科罗拉多州博尔德市的Streetside数据处理中心,所有搜集到的数据都由这个数据中心集中处理,该中心每周大约可以处理50TB到100TB的数据。
数据处理中心:由拼合的全景图像制作出完整的三维立体文件需要3个步骤
Streetside里的三维效果是由6幅独立的照片拼合而成的,简化的坐标由激光测距数据获得,并且对图像中的人物均做了模糊处理。
拼合6幅独立的图像
首先,微软利用自己开发的图片合成软件将在同一位置拍到的6张独立照片拼合为一副全景图像。这个技术借助几张照片中相似的部分实现拼接,再通过调整照片的色彩和亮度使之实现融合。然后,图像合成软件会将合成的全景图像裁剪为正方体的6个面,通常每张照片对应正方体一个面的图像。另外,该软件还会为每一面的图像生成多个低分辨率的版本,供载入清晰图像前过渡使用。
不同分辨率版本图像的整合和展示是基于微软开发的Seadragon技术实现的,该技术借助Silverlight工作,这也是查看Streetside视图服务时需要安装Silverlight浏览器插件的主要原因。最后一步,该软件以正方体的6面形式保存全景图像,以JPEG格式图片的形式展示给用户。
立体建筑的三维建模过程
1.激光雷达原始数据
激光扫描到的数据以“深度图”的形式存储,每幅全景图像最多包含150万个空间距离测试点。这一步可以形成简易三维模型。
2.简单的建筑轮廓
软件通过大量原始数据计算出简单的多边形建筑轮廓模型。这一步只需要考虑街道和房屋轮廓的相关数据。
3.建筑物的三维模型
软件标记出建筑和街道轮廓模型上的立体表面,然后将其与保存的全景图像整合后,用户就会有身临其境的逼真三维感觉。
对图像中的人物进行模糊处理
图像处理软件可以将全景图像上拍摄到的人脸和车牌进行“遮挡”。
为此,图像处理软件需要识别出人物和汽车,并且分辨出图片中的人物是真人还是广告牌中的照片又或者是人物雕塑,如果是后两者的话就不需要进行“遮挡”处理。这个图像处理软件是通过对人类典型的皮肤颜色进行判断来识别出人脸的。
三维视图浏览:
在线城市旅行新体验
在必应地图上选择Streetside模
式浏览,即可开始三维城市旅行。
打开必应地图,单击页面上的蓝色小人即可进入Streetside视图模式(国内用户需要使用代理服务器以美国IP来访问才可以看到该功能)。Streetside视图模式首先以较低的分辨率展示立体全景图,只有当你点击放大图像查看细节时才会展示相应的高分辨率图像。用户可以通过控制蓝色小人进行导航,画面底部的空间坐标标示了蓝色小人在街道上行进的方向。在街道上行进的过程,实际上就是一张张立体全景图呈现的过程,载入全景图的过程可通过图像由模糊到清晰的短暂变化识别出来。
每隔两周,数据处理中心会寄出一份包含新地点的“立体全景图像”包裹——由400块硬盘组成,包含大约100TB到160TB的数据。之所以使用快递而不是将其通过互联网传输,是为了保障这些数据的安全性。这些数据将通过一个在线数据处理中心发送并在全球的微软服务器上做节点镜像。当用户进入Streetside视图模式时,离他最近的镜像服务器节点将会自动为其提供数据。这种去中心化的分发网络保证了页面响应时间在20ms之内,如此一来,用户就可以获得极佳的浏览交互体验。
Google街景视图的发布给用户带来了令人震撼的体验。但是,并非只有Google的街景车在城市的道路之间穿行,微软也发布了一个类似的项目——必应地图的Streetside服务。目前,该项目主要针对美国城市,今年,微软的Streetside车会开到欧洲大陆,搜集更多城市的视图信息。但是微软还没有给出确切的日期。
无论是Google还是微软提供“街景”服务的最大投入均花在了对海量数据的收集和整理上。相对而言,微软的Streetside视图更加丰富,可查看多种不同视角的视图,同时,微软Streetside谨慎地避开了任何可能引起隐私问题的情况,比如不会收集Wi-Fi信息和人脸的清晰图像等。
微软的Streetside专用车在扫描周围环境时,主要搜集3种数据:GPS坐标、照片和激光测距信息(通过Lidar:Light Detection and Ranging激光雷达)。被固定在车顶上的UltraCam包含6个镜头,可以同时拍摄6幅不同角度的2048×2048像素照片,然后合成一张周围环境的360°全景快照。这里用到的高性能UltraCam摄像头是由奥地利公司Vexcel开发的,这家专注于利用航拍卫星照片等数据创建地图的公司已经被微软收购,为微软的Streetside视图提供技术支持。其实Streetside的最大亮点是可以在浏览器里查看城市的三维立体全景图,这一特性通过Lidar激光雷达的实时激光测距功能实现。
Lidar激光雷达通过发射激光光束并计算激光被物体遮挡后反射回来的时间,来测量周围物体之间的距离。一般在比较狭窄的城市道路上,UltraCam摄像头会每隔4m拍摄一次周围环境的全景图。在比较宽广的道路上,只要每隔8m拍摄一次即可。Streetside专用车每向前行进1Km,就会拍摄到1500张照片,从而组成250张全景图像。另外,Streetside专用车的速度保持在10km/h~ 14km/h之间,而且需要尽量在晴朗的天气下工作,这样才能保证拍摄图像时能有比较好的光照条件。照片拍摄完成后,“满载着”图像的硬盘将被快递到位于科罗拉多州博尔德市的Streetside数据处理中心,所有搜集到的数据都由这个数据中心集中处理,该中心每周大约可以处理50TB到100TB的数据。
数据处理中心:由拼合的全景图像制作出完整的三维立体文件需要3个步骤
Streetside里的三维效果是由6幅独立的照片拼合而成的,简化的坐标由激光测距数据获得,并且对图像中的人物均做了模糊处理。
拼合6幅独立的图像
首先,微软利用自己开发的图片合成软件将在同一位置拍到的6张独立照片拼合为一副全景图像。这个技术借助几张照片中相似的部分实现拼接,再通过调整照片的色彩和亮度使之实现融合。然后,图像合成软件会将合成的全景图像裁剪为正方体的6个面,通常每张照片对应正方体一个面的图像。另外,该软件还会为每一面的图像生成多个低分辨率的版本,供载入清晰图像前过渡使用。
不同分辨率版本图像的整合和展示是基于微软开发的Seadragon技术实现的,该技术借助Silverlight工作,这也是查看Streetside视图服务时需要安装Silverlight浏览器插件的主要原因。最后一步,该软件以正方体的6面形式保存全景图像,以JPEG格式图片的形式展示给用户。
立体建筑的三维建模过程
1.激光雷达原始数据
激光扫描到的数据以“深度图”的形式存储,每幅全景图像最多包含150万个空间距离测试点。这一步可以形成简易三维模型。
2.简单的建筑轮廓
软件通过大量原始数据计算出简单的多边形建筑轮廓模型。这一步只需要考虑街道和房屋轮廓的相关数据。
3.建筑物的三维模型
软件标记出建筑和街道轮廓模型上的立体表面,然后将其与保存的全景图像整合后,用户就会有身临其境的逼真三维感觉。
对图像中的人物进行模糊处理
图像处理软件可以将全景图像上拍摄到的人脸和车牌进行“遮挡”。
为此,图像处理软件需要识别出人物和汽车,并且分辨出图片中的人物是真人还是广告牌中的照片又或者是人物雕塑,如果是后两者的话就不需要进行“遮挡”处理。这个图像处理软件是通过对人类典型的皮肤颜色进行判断来识别出人脸的。
三维视图浏览:
在线城市旅行新体验
在必应地图上选择Streetside模
式浏览,即可开始三维城市旅行。
打开必应地图,单击页面上的蓝色小人即可进入Streetside视图模式(国内用户需要使用代理服务器以美国IP来访问才可以看到该功能)。Streetside视图模式首先以较低的分辨率展示立体全景图,只有当你点击放大图像查看细节时才会展示相应的高分辨率图像。用户可以通过控制蓝色小人进行导航,画面底部的空间坐标标示了蓝色小人在街道上行进的方向。在街道上行进的过程,实际上就是一张张立体全景图呈现的过程,载入全景图的过程可通过图像由模糊到清晰的短暂变化识别出来。
每隔两周,数据处理中心会寄出一份包含新地点的“立体全景图像”包裹——由400块硬盘组成,包含大约100TB到160TB的数据。之所以使用快递而不是将其通过互联网传输,是为了保障这些数据的安全性。这些数据将通过一个在线数据处理中心发送并在全球的微软服务器上做节点镜像。当用户进入Streetside视图模式时,离他最近的镜像服务器节点将会自动为其提供数据。这种去中心化的分发网络保证了页面响应时间在20ms之内,如此一来,用户就可以获得极佳的浏览交互体验。