淺析GIS多源資料整合模式論文

淺析GIS多源資料整合模式論文

  [摘要] 地理資訊系統的迅速發展和廣泛應用導致了空間資料多源性的產生,為資料綜合利用和資料共享帶來不便。本文探討空間資料多源性的產生和表現,指出多資料格式是多源空間資料整合的瓶頸;分析和評價了多源空間資料整合的三種模式,並展望了多源資料整合的發展方向。

  一、多資料格式是多源空間資料整合的瓶頸

  1、空間資料多源性的產生和表現

  空間資料多源性的產生和表現主要可以概括為以下幾個層次:

  (1)多語義性

  地理資訊指的是地理系統中各種資訊,由於地理系統的研究物件的多種類特點決定了地理資訊的多語義性。對於同一個地理資訊單元(feature),在現實世界中其幾何特徵是一致的,但是卻對應著多種語義,如地理位置、海拔高度、氣候、地貌、土壤等自然地理特徵;同時也包括經濟社會資訊,如行政區界限、人口、產量等。一個GIS研究的決不會是一個孤立的地理語義,但不同系統解決問題的側重點也有所不同,因而會存在語義分異問題。

  (2)多時空性和多尺度

  GIS資料具有很強的時空特性。一個GIS系統中的資料來源既有同一時間不同空間的資料系列;也有同一空間不同時間序列的資料。不僅如此,GIS會根據系統需要而採用不同尺度對地理空間進行表達,不同的觀察尺度具有不同的比例尺和不同的精度。GIS資料整合包括不同時空和不同尺度資料來源的整合。

  (3)獲取手段多源性

  獲取地理空間的資料的方法有多種多樣,包括來自現有系統、圖表、遙感手段、GPS手段、統計調查、實地勘測等。這些不同手段獲得的資料其儲存格式及提取和處理手段都各不相同。

  (4)儲存格式多源性

  GIS資料不僅表達空間實體(真實體或者虛擬實體)的位置和幾何形狀,同時也記錄空間實體對應的屬性,這就決定了GIS資料來源包含有圖形資料(又稱空間資料)和屬性資料兩部分。圖形資料又可以分為柵格格式和向量格式兩類。傳統的GIS一般將屬性資料放在關係資料庫中,而將圖形資料存放在專門的圖形檔案中。不同的GIS軟體採取不同的檔案儲存格式。

  2、多源空間資料整合的迫切性

  隨著Internet網路的飛速發展和普及,資訊共享已經成為一種必然的要求。地理資訊也不例外,隨著資訊科技以及GIS自身的發展,GIS已經從純粹地學技術系統的圈子跳了出來,正和IT行業完全融合,人們對空間資訊的需求也越來越多。GIS要進一步發展,必須完全融入大型MIS(管理資訊系統)中。1998年美國副總統戈爾提出數字地球的概念,更是將地理資訊科技推到了最前沿。然而地理資訊要真正實現共享,必須解決地理資訊資料多格式、多資料庫整合等瓶頸問題。隨著技術發展,GIS已經逐步走向完全以純關係資料儲存和管理空間資料的發展道路,這為GIS完全和MIS無縫整合邁出了重要的一步。但因為GIS處理的資料物件是空間物件,有很強的時空特性,獲取資料的手段也複雜多樣,這就形成多種格式的原始資料,再加上GIS應用系統很長一段時間處於以具體專案為中心孤立發展狀態中,很多GIS軟體都有自己的資料格式,這使得GIS的資料共享問題變得尤為突出。

  空間資料作為資料型別的一種,同普通資料一樣需要走過從分散到統一的過程。在計算機的發展過程中,先是資料去適應系統,每一個系統都為傾向於擁有自己的資料格式;隨著資料量的增多,資料庫系統應運而生;隨著時代的發展,資訊共享的需求越來越多,不同資料庫之間的資料交換成了瓶頸;SQL(標準結構化查詢語言)以及ODBC的出現為這一難題提供了比較滿意的解決方案。但是空間資料如何引進這種思想,或者說將空間資料也納進標準組織和標準協議進行規範和管理,從而使空間資料共享成為現實。

  二、 GIS多源資料整合模式比較

  由於地理資訊系統的圖形資料格式各異,給資訊共享帶來了極大的不便,解決多格式資料來源整合一直是近年來GIS應用系統開發中需要解決的重要問題。目前,實現多源資料整合的方式大致有三種,即:資料格式轉換模式、資料互操作模式、直接資料訪問模式。

  1 、資料格式轉換模式

  格式轉換模式是傳統GIS 資料整合方法(圖1)。在這種模式下,其他資料格式經專門的資料轉換程式進行格式轉換後,複製到當前系統中的資料庫或檔案中。這是目前GIS系統資料整合的主要辦法。目前得到公認的幾種重要的空間資料格式有:ESRI公司的Arc/Info Coverage、ArcShape Files、E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的dgn格式等等。 資料轉換模式主要存在的問題是:

  (1)由於缺乏對空間物件統一的描述方法,從而使得不同資料格式描述空間物件時採用的資料模型不同,因而轉換後不能完全準確表達源資料的資訊。

  (2)這種模式需要將資料統一起來,違背了資料分佈和獨立性的原則;如果資料來源是多個代理或企業單位,這種方法需要所有權的轉讓等問題。 美國國家空間資料協會(NSDI)確定制定了統一的空間資料格式規範SDTS(Spatial Data Transformation Standard),包括幾何座標、投影、拓撲關係、屬性資料、資料字典,也包括柵格格式和向量格式等不同的空間資料格式的轉換標準。許多軟體利用SDTS提供了標準的空間資料交換格式。目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模組,Intergraph公司在MGE產品系列中也支援SDTS向量格式。SDTS在一定程度上解決了不同資料格式之間缺乏統一的空間物件描述基礎的問題。但SDTS目前還很不完善,還不能完全概括空間物件的不同描述方法,並且還不能統一為各個層次以及從不同應用領域為空間資料轉換提供統一的標準;並且SDTS沒有為資料的集中和分散式處理提供解決方案,所有的`資料仍需要經過格式轉換複製到系統中,不能自動同步更新。

  2 、資料互操作模式

  資料互操作模式是OpenGIS consortium (OGC) 制定的規範。OGC是為了發展開放式地理資料系統、研究地學空間資訊標準化以及處理方法的一個非盈利組織。GIS互操作是指在異構資料庫和分佈計算的情況下,GIS使用者在相互理解的基礎上,能透明地獲取所需的資訊。OGC為資料互操作制定了統一的規範,從而使得一個系統同時支援不同的空間資料格式成為可能。根據OGC頒佈的規範,可以把提供資料來源的軟體稱為資料伺服器(Data Servers),把使用資料的軟體稱為資料客戶(Data Clients),資料客戶使用某種資料的過程就是發出資料請求,由資料伺服器提供服務的過程,其最終目的是使資料客戶能讀取任意資料伺服器提供的空間資料。OGC規範基於OMG的CORBA、Microsoft的OLE/COM以及SQL等,為實現不同平臺間伺服器和客戶端之間資料請求和服務提供了統一的協議。OGC規範正得到OMG和ISO的承認,從而逐漸成為一種國際標準,將被越來越多的GIS軟體以及研究者所接受和採納。目前,還沒有商業化GIS軟體完全支援這一規範。 資料互操作為多源資料整合提供了嶄新的思路和規範。它將GIS帶入了開放式的時代,從而為空間資料集中式管理和分佈儲存與共享提供了操作的依據。OGC標準將計算機軟體領域的非空間資料處理標準成功地應用到空間資料上。但是OGC標準更多考慮到採用了OpenGIS協議的空間資料服務軟體和空間資料客戶軟體,對於那些歷史存在的大量非OpenGIS標準的空間資料格式的處理辦法還缺乏標準的規範。而從目前來看,非OpenGIS標準的空間資料格式仍然佔據已有資料的主體。

  資料互操作規範為多源資料整合帶來了新的模式,但這一模式在應用中存在一定侷限性:首先,為真正實現各種格式資料之間的互操作,需要每個每種格式的宿主軟體都按照著統一的規範實現資料訪問介面,在一定時期內還不現實;其次,一個軟

  件訪問其他軟體的資料格式時是透過資料伺服器實現的,這個資料伺服器實際上就是被訪問資料格式的宿主軟體,也就是說,使用者必須同時擁有這兩個GIS軟體,並且同時執行,才能完成資料互操作過程。

  3、直接資料訪問模式

  顧名思義,直接資料訪問指在一個GIS軟體中實現對其他軟體資料格式的直接訪問,使用者可以使用單個GIS軟體存取多種資料格式。直接資料訪問不僅避免了繁的資料轉換,而且在一個GIS軟體中訪問某種軟體的資料格式不要求使用者擁有該資料格式的宿主軟體,更不需要該軟體執行。直接資料訪問提供了一種更為經濟實用的多源資料整合模式。

  目前使用直接資料訪問模式實現多源資料整合的GIS軟體主要有兩個,即: Intergraph 推出的GeoMedia系列軟體和中國科學院地理資訊產業發展中心研製的SuperMap。GeoMedia實現了對大多數GIS/CAD軟體資料格式的直接訪問,包括:MGE、Arc/Info、Frame、Oracle Spatial、SQL Server、Access MDB等(圖2)。SuperMap 2.0則提供了存取SQL Server、Oracle Spatial、ESRI SDE、Access MDB、SuperMap SDB檔案等的能力,在以後的版本中將逐步支援對Arc/Info Coverage、AutoCAD DWG、MicroStation DGN、ArcView等資料格式的直接訪問。

  三、多源空間資料格式整合的展望

  1 、檔案方式和資料庫方式

  傳統的空間資料往往採用檔案方式,隨著技術的進步,逐漸將屬性資料移植到資料庫平臺上;隨著技術發展,圖形資料也可以和屬性資料一起存放在關係資料庫中。檔案方式對資料管理安全性較差,存在著屬性和圖形分開管理的問題,不適合網路共享發展的需要;資料庫方式則實現了空間資料和屬性資料一體化儲存和管理,便於開發兩層、三層甚至多層網路應用系統。從發展趨勢來看,純關係資料庫方案取代檔案方案是發展的必然趨勢,這也是IT發展的主流趨勢。隨著對資訊量需求的增大以及資訊需求種類增多,資料倉庫的建立,將是GIS檔案系統向資料庫系統發展的主流。

  2 、OpenGIS、SDTS與DLG/F

  OpenGIS是目前的主流標準,但SDTS並不會停滯不前,相反筆者認為SDTS將會與OpenGIS走向一體化。SDTS 可以為OpenGIS提供一個轉換和存取空間資料的標準,該標準是不依賴任何一種特定GIS軟體格式的,該標準中利用標頭檔案描述格式的方式使得資料服務者不必專門提供格式說明,而資料客戶也不必專門學習該格式,只需讀取SDTS標頭檔案就可獲得資料服務者提供的資料格式。筆者認為利用SDTS做資料標準,利用OGC作資料互操作的標準(例如空間SQL標準),簡單地說就是如果說SDTS提供了資料格式的標頭檔案,而OGC標準則提供了讀寫這個標頭檔案的標準方法。如果再採用資料庫作後臺,利用空間資料引擎,空間資料引擎按照SDTS存取空間資料,按照OGC標準對客戶軟體提供操作介面,這將是空間資料整合的理想解決方案。 USGS還提供了一種稱作DLG/F的標準,該標準設計了空間資料在資料庫中的動態儲存結構,利用該結構可以將拓撲關係動態記錄下來,同時可以讓使用者新增自定義的空間資料型別。怎樣利用DLG/F完善SDTS和OpenGIS也將是OpenGIS以及SDTS發展的方向。

  3 、統一空間實體編碼

  多源空間資料據格式整合還有一個很重要的方面就是如何處理不同資料庫對空間實體採用的編碼方式不同的問題。從理論上來說,一個系統對同一空間實體的編碼應該是唯一的,實際上由於不同領域從不同視角對同一空間實體編碼並不一樣,甚至會出現不同空間實體具有相同編碼的情況,這些編碼放在同一系統中,就會出現空間實體標識的嚴重問題。從目前來看,OpenGIS和SDTS都是基於地理特徵(Feature)定義空間實體的,但都還不能真正提供一個通用的空間實體編碼體系。

  參考文獻

  1.On spatial database integration, Thomas Devogele ,Geographical Information Science, 1998,12(4)

  2.Issues and prospects for the next generation of the spatial data transfer standard (SDTS), DAVID ARCTUR, DAVID HAIR,GEORGE TIMSON, etc, Geographical Information Science, 1998,12(4)

  3.Towards integrated geographic information processing,DAVID J.ABEL, BENG CHIN COOI, KIAN-LEE TAN etc, Geographical Information Science, 1998,12(4)

  4.A framework for the integration of geographical information systems and modelbase management , DAVID A.BENNETT, Geographical Information Science, 1997,11(4)

  5. Overcoming the semantic and other barriers to GIS interoperability , YASER BISHR, Geographical Information Science, 1998,12(4)

最近訪問