生活中学习知识:大话ESRI之空间格式

编者按:如果集成特征行为(面向对象优势)并将所有数据存储在数据库来的益处超过数据转换工作之时,必然是Geodatabase大胜之时。又回到了起点,还是面向对象和数据库技术,所以只要这两项技术蓬勃发展,类似Geodatabase模式的空间地理数据库的发展空间真是不可估量。我们国产的GIS厂商们,你们准备好了吗?

对空间信息产业了解的人都清楚,数据之于GIS,好比血液相对人体,让我们再以西游中师徒四人性格做比,梳理下ESRI公司的众多空间数据格式。毕竟,这些格式长期盘绕在我们的身边,弃之不愿,来之不嫌。

沙和尚:向来出场低调的他,虽然没有太多的Feature,但勤勤恳恳,不求回报的态度还是满符合我们下面这种数据格式个性的——shapefiles

Shapefiles是ArcView2.0推出时推出的一种数据格式,该格式充分学习了传统CAD数据在表征地理数据的不足,率先将属性信息通过DBASE表的方式挂接到空间信息上,基本文件仅仅包含了空间数据文件(.shp),索引文件(.shx)和属性文件(.dbf)。如此简单的结构,促成了该格式的全球流行,伴随之的ArcView桌面软件也一度成为GIS的代名词,也促使ESRI公司成为GIS工业界的领头羊。目前shapefiles文件格式仍然是任何商业GIS软件必须首先支持的格式。但其无拓扑这一致命的软件,很难进行复杂完整的空间分析,这也为后来Coverage的大旺作下了铺垫。

唐三藏:E00,这个内部交换格式我相信大家都是看过的,虽然让大家看得明明白白,但是其烦琐程度一点都不亚于罗嗦的唐僧哦!

E00格式是以交换格式身份出现的,虽然Shapefiles文件格式后来也被ESRI公司以白皮书的形式公布,但相对而言E00还是更直接得多,也因此成为最流行的文件交换格式,目前我国的国土、测绘部分仍然把E00作为提交空间信息的必要格式。

猪八戒:老猪生性贪婪,好色,虽然在妖怪面前还能顶上一段,但是总会惹下不少麻烦。Coverage文件格式一直是让我感到恐惧的,文件种类之繁让我感觉到自己肯定是消化不了的,还是交给能吃的老猪吧!

Coverage在充分吸收Shape的优点的基础上,增加了拓扑等新特性并在ESRI公司ARC/INFO工作站中显示了其种种优点,用户可以基于该格式完成复杂的空间分析,实现高效的空间数据组织。也因此,ARC/INFO软件真正成为了企业级GIS平台的代表,几年前我们国家中大型GIS项目都是被ARC/INFO所垄断,也正是ARC/INFO软件的大卖更将ESRI公司推上了GIS头把交椅的位置。

孙悟空:神通广大,智慧无边,除了如来佛祖还真少有人能制服得了它,它就是Geodatabase.

Geodatabase是ESRI公司在ArcGIS 8引入的一个全新的空间数据模型,是建立在关系型数据库管理信息系统之上的统一的、智能化的空间数据库。它是在新的一体化数据存储技术的基础上发展起来的新数据模型。实现了Geodatabase之前所有(包括Coverageshape)空间数据模型都无法完成的数据统一管理,即在一个公共模型框架下对GIS通常所处理和表达的地理空间特征如矢量、栅格、TIN、网络、地址进行同一描述。同时,Geodatabase是面向对象的地理数据模型,其地理空间特征的表达较之以往的模型更接近我们对现实事物对象的认识和表达。ArcGIS 9.2中的Geodatabase更是分为三个不同的层次,基于Aceess管理的Personal GDB,基于文件管理的files GDB和基于ArcSDE和商业关系型数据库管理的Enterprise GDB。该体系覆盖了不同层次用户对数据管理的需求,Geodatabase逐渐显示出大家风范。

从上面数据格式的产生和发展来看,每一种数据格式的推出,ESRI公司都不是贸然的,都是在市场上有巨大需求和空缺的同时,技术上也同时具备的条件下以数据格式+软件包的形式推出的,因为一种数据格式必须有自己的母体,没有母体是很难体现出该格式的优势,通过在展现该数据格式的同时自己的软件包又一种商品的形式大获成功。从表面上看,ESRI公司的软件非常的昂贵同时其性能又非常的优越,但是其实质上真正昂贵和优越的是它的数据格式,而其ArcView 、PC ARC/INFO以及今日之ArcGIS都是以更好的表征其相对应的空间信息格式而来的。

这一点相信是我们国内的一些国产GIS厂商所没有关注的,目前国内传统的空间数据拥有者如国土、测绘、规划领域,它们大量的空间信息格式都是以CAD/Shape/Coverage格式存储,而GIS平台特有的格式+平台内在归一性自然决定了企事业单位在GIS项目选型的时候考虑对已有历史资源的整合和再利用,不愿意再次花费大量的成本来进行数据转移和数据格式的转换。另外,我们国家GIS平台起步相对较晚,对企业级、海量空间数据的管理仍然不太稳健,这个时候不得不继续对原由的ESRI等国外公司产品进行升级或重新购买,所以国产GIS的发展是需要时间的,是需要随着空间的更新,逐渐把数据格式的权利重新拿回到自己手中,这个时候我们国家自己的GIS软件才有能力对ESRI对巨头说再见。

如果能够看到这一点,我相信对于GIS这个行业,空间数据组织/数据库/数据模型的重要性要远大于GIS软件本身,所以要成为一个好的GIS研究者,其数据库水平以及对空间信息组织的认识水平要高于其软件设计的水平和能力。

再回到Geodatabase上来,因为它吸收了数据库以及面向对象等最新的技术,所以在考虑、理解以及设计一个Geodatabase的时候就应该重新回到数据库以及面向对象等技术本身,在充分理解了二者基本的理论的时候才能很好的将我们本身的Geo的东西加到上面,毕竟Geodatabase相对于以前的若干种数据格式而言更想一个八面镜,如果单从某一方面看它都是非常的美丽的,但只有将相关的基本原理理解透彻之时才能真正的跳出三界外,不在五行中,到那时才能看到它的全貌,才能真正领略到它的美。当然,所有的新事物接受起来我们都不能一口吃个胖子,也是需要时间,需要一个迭代的过程。

目前ArcGIS引入Geodabase,只是对Coverage等数据格式的补充和促进,而并没有立刻取代Coverage之意,当然也是不可能取代得了的,直至今日,仍然是CADSHAPECOVERAGE并存的时代,中国如此,美国也不例外吧?我们应该清醒的看到:CADSHAPECOVERAGE完全能够满足项目工程、各类应用的需要,也就是说还没有产生如当年CAD -> GIS当年的那种渴望的热情,但是这也类似于面向过程 -> 面向对象的程序设计一样,酒香不怕巷子深,在充分享受到其带来的种种优势之后,时代终究会接受强者,这绝对不是偶然。这是唯物主义发展观最基础理论应用。