關於土地資訊系統建立過程中的資料質量問題的探討
關於土地資訊系統建立過程中的資料質量問題的探討
摘要:資料對土地資訊系統(lis)來說是至關重要的,資料質量的好壞是土地資訊系統建設成敗的關鍵。本文將對土地資訊系統建立過程中有關資料質量問題進行探討。
關鍵詞:土地資訊系統、資料質量、誤差、解析度、座標變換、向量資料、柵格資料、拓撲
一、前言
土地是人類的寶貴財富,是人類社會進行物質生產所必需的基本條件和自然基礎。loCalHosT如何科學、合理地利用有限的土地資源,如何及時瞭解與掌握土地利用變化數量和空間特點,對於保持耕地總量動態平衡和土地持續利用具有十分重要的意義。
隨著社會經濟的日趨多樣化,土地部門的業務工作及範圍也在不斷擴大,原有的靠手工操作,圖紙管理的模式已經越來越不能滿足高效率的需求。為強化土地管理,滿足社會對土地資源資訊更多、更細、更完善的服務要求,各土地管理部門紛紛加入資訊化、數字化的改革大潮。特別是在市場經濟條件下,因土地管理部門工作的嚴肅性、準確性、科學性和規範化要求,管理中任何規定的確定和變更都需要完成大量的資訊收集、分析、綜合、決策和評估等工作,土地管理也只有強有力的資訊科技(it)的支援下,才能做到真正的科學決策和管理。
土地資訊系統(lis)是地理資訊系統的一個分支,是一種基於宗地[以宗地(地塊)為單位]的計算機管理資訊系統。是一種利用計算機技術及其屬性資料進行採集、處理、管理、查詢、分析、應用和維護更新的空間資訊系統,是土地管理的現代化工具,是土地規劃和管理定量化、科學化的方法、手段。但是,在土地資訊系統的建設過程中,還存在許多問題,給土地資訊系統的建設及發揮帶來一定困難。這裡僅對土地資訊系統建設中的資料質量問題進行探討。
二、對lis資料質量的認識
資料是一種未經加工的原始資料,是客觀物件的表示,它可以是數字、文字、符號、影象,資料是資訊的具體表達形式。一個lis系統包括空間資料、屬性資料、空間資料之間的關係以及空間資料與屬性資料之間的關聯。
人們往往以為計算機為基礎的資訊系統的資料質量是可靠的,很少懷疑利用資訊系統產生的分析結果在資料質量方面會有問題,但事實遠非如此。在某些情況下,由於多種原因,計算機分析的結果甚至會比手工分析的誤差更大。這裡除軟體、硬體的質量問題,計算方法上的問題,以及分類、編碼、輸入、操作的明顯疏忽外,資料本身的質量是重要的原因。
眾所周知,資料是lis的“血液”,是組成系統的重要元素。資料質量的好壞是土地資訊系統成功與否的關鍵所在;資料質量的高低優劣,都直接影響到土地資訊系統的經濟效益和社會效益,決定了系統應用價值的大小;資料的可靠,質量的好壞將直接影響到整個系統的成敗。系統如果不能提供正確、可靠的資訊,這個系統也就失去了存在的價值。
資料質量的好壞是一個相對概念,並具有一定的針對性。衡量其好壞主要有以下幾個指標:誤差、資料的準確度、資料的精度和不確定性[1]。資料質量是資料整體效能的綜合體現。
統而言之,資料的質量問題主要表現在兩個方面:一是資料是否及時反映了現實世界;二是資料是否保持了一致性和完整性。
土地資訊系統的資料量大,資料來源廣,資料採集的任務重,在資料庫建立過程中會出現許多人為和系統的誤差,甚至還有可能產生資料錯誤,最後採集的資料無法準確反映規劃和管理的實際狀況,建立在此資料庫基礎上的系統往往也就達不到管理自動化輔助決策的目的,而只不過是“看看而已”的一種“擺設”罷了。
資料庫(包括空間資料庫和非空間資料庫)是土地資訊系統最基本、最重要的組成部分,也是投資比重最大的部分。資料質量的好壞,直接影響系統的功能和應用。不僅要根據技術規程衡量資料質量,還要從資料使用角度分析資料質量問題。資料質量通常是指資料的可靠性和精度,它主要用資料的誤差來度量的。現就土地資訊系統建立過程中的資料質量問題作進一步的探討。
三、資料來源質量的問題
土地資訊系統的資料來源指建庫中所需要的各種資料型別的來源。它是土地資訊系統最基本、最重要的組成部份。土地資訊系統的資料來源多種多樣,主要包括有:地圖,地圖是系統最主要的資料來源,因為地圖是地理資料的傳統描述形式,是具有共同參考座標系統的點、線、面的二維平面形式的表示,內容豐富,圖上實體間的空間關係直觀,而且實體的類別和屬性可以用各種不同的符號加以識別和表示。土地資訊系統其圖形資料大部分都來自地圖,土地資訊系統的屬性資料主要有地籍圖、宗地圖、土地詳查圖、土地利用現狀圖、行政區劃圖、專題圖、乃至地形圖等各種圖件的向量化地圖資料。二是遙感影像資料,遙感影像資料是一個極其重要的資訊源。透過遙感影像可以快速、準確地獲得大面積的、綜合的各種專題資訊,航天遙感影像還可以取得週期性的資料,這些都為土地資訊系統提供了豐富的資訊。三是統計資料,包括土地的分類、面積、權屬、分佈及質量、等級狀況、利用狀況、非法佔地等統計資料。四是實測資料,包括gps點位資料、地籍測量資料等。五是數字資料,包括數字圖形資料和屬性資料。數字資料主要有地籍號、檔案卷宗號、地類號、圖號、手簿號、宗地界址點點號及座標控制點座標,宗地面積,面積中誤差、年代、日期等等。屬性資料包括圖形、影象以外的各種文字、數字資訊。其中文字資訊主要是與宗地檔案,檔案檔案組成相關的各種檢索和查詢資訊(如:土地權利人姓名或單位各稱、土地座落,檔案檔案的標題、發文機關、公文字號等等),以及土地登記、地籍調查、權屬稽核、登記發證各辦公流程中的各種鍵盤輸入資訊。六是各種立法檔案和文字檔案,主要有地籍檔案、檔案檔案等具有法律效力或需要經常查閱的原始檔案材料,它們是土地資訊的重要組成部分,在土地的規劃管理中起著很大的作用。
資料來源質量問題指資料的採集和錄入中可能產生的誤差,建庫所需的各種型別的資料的可靠性和精度。
從土地資訊系統建立的過程來看,它的主要因素有:各種測量資料,地圖和遙感資料等的誤差;調查和統計造成的屬性資料誤差,以及文件資料的錯誤等,數字化前的預處理、手扶踀自動化的解析度和向量化精度。
1、遙感資料
地理資訊系統、遙感和計算機輔助製圖是現代地理學的重要技術手段。遙感作為一種獲取和更新空間資料的強有力手段,能及時地提供準確、綜合和大範圍進行動態監測的各種資源與環境的資訊,因此遙感資料是土地資訊系統的一個重要資料來源。
所謂遙感(remote sensing)就是遙遠感知的意思,也就是不直接接觸目標物和現象,在距離地物幾公里到幾百裡、甚至上千裡的飛機、飛船、衛星上,使用光學或電子儀器接受地面物體或發射的電磁波訊號,並從影象膠片或資料磁帶形式記錄下來,傳送到地面,經過資訊處理,判讀分析和野外實地驗證,最終服務於有關部門的規劃決策 [2]。土地管理部門可以運用遙感技術快速獲取現狀空間的資訊。
儘管遙感技術有很多好處,
但因其自身特性,獲取的遙感資料可能存在一些誤差。如:不同的高度引起的問題,由於感測器的結構及穩定性產生的問題,對訊號進行數字化產生的誤差。感測器在航線、航向上出現的誤差,大氣輻射產生的誤差,地形和地貌等因素產生的誤差等等。在遙感資料的獲取時,有些誤差是可以控制的,有些則不可控。因此必須對原始資料進行預處理,包括利用地面控制對原始資料進行幾何校正,影象增強和分類。對獲取的遙感資料進行光譜校正,特徵提取,自動識別分類、自動成圖等處理[3]。
2、測量資料
各種原始的測量資料是土地資訊系統的主要來源之一。包括宗地的權屬界線、位置、形狀、數量、面積、各級行政界線、地形圖測量等。由於人和環境的因素,測量資料不可避免地受到人為誤差(對中、讀數、平分等誤差)、儀器、環境的影響。來源於地面測量的數字資料中含有控制測量和碎部測量誤差。其中控制點誤差又受控制網的參考基準、網形和觀測精度以及觀測費用等因素的影響。碎部點誤差除了繼承了控制點的誤差外,還受自身觀測方法,觀測精度和地界的人為判斷,以及地物地貌的取捨等因素的影響。當然原始資料誤差受觀測儀器、觀測者和外界環境三種因素影響。除此之外,還有測量資料的實時性以及資料老化,採集資料的密度不合理,或概括取捨不合理,選取測量規範標準不一致或精度等級不一致造成測量資料的不一致的影響。
地籍要素是構建土地資訊系統極為關鍵的一步,其測量資料的精度高低決定了系統功能能否得到正確和充分發揮。
從地籍測量成果的有效性和土地管理的可能性來考慮,為了保證各權屬單元之間的界線清晰,邊界無爭議,並且雙方都能接受而不損害他人和國家的利益,地籍測量要達到一定精度。因此,必須要有相應的資料採集方法作為保證。地籍要素的採集方法目前主要有兩種,一種是傳統的模擬式外業測圖方法,另一種是野外全數字化資料採集方法。傳統方法的主要作法是在地籍控制測量的基礎上,用解析法測量出權屬界址點座標,以控制點或以界址點為基礎施測成地籍圖,要形成入庫資料資訊,則要透過對原圖數字化來實現。用傳統資料採集方法形成地籍要素數字資訊其誤差影響因素較多,主要誤差來源為:測站點誤差m1,量距誤差m2,在測圖板上描繪方向線誤差為m3,刺點誤差m4,數字化儀採點誤差m5等。按有關專著論述,一般情況下,m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,這四項誤差為野外採集誤差。數字化m5的影響因素比較複雜,誤差產生首先與圖形要素有關,要素本身的複雜程度對數字化精度有顯著影響,數字化儀本身的精度更應引起重視。正常情況下,用常規數字化儀進行數字化時,精度一般可達到±0.13mm。綜合上述得,地籍要素採集精度m採 為:
m採 =±
=±
=±0.02mm
按1:500比例尺來考慮,實地誤差將達到±10cm,由此可見,按傳統方法施測,則擬入庫的地籍要素資訊很難達到規定的±5cm的精度標準[4]。
採用野外全數字化方法,界址點野外資料採集一般採用直接測定座標法,即將全站儀或測距儀置於測站點上,對界址點上的移動稜鏡進行水平角和距離測定,電子手薄記錄計算。此種方法的主要誤差來源為水平角測角誤差mβ和測距誤差md,測角中誤差角保守為±5″,測距誤差主要來自移動稜鏡偏離界址點位置誤差,其偏離值按2cm考慮。測距平均邊長取100m,按點位誤差精度估算公式m2=
3、調查、統計、文件資料問題
土地資訊系統的建設過程中,涉及大量的調查統計資料,這些資料尚存在許多不足之處,為土地資訊系統的建設帶來了一定困難。
建立土地資訊系統,必須首先進行土地基本資訊的蒐集,開展地籍調查工作,核實宗地權屬,掌握土地利用狀況,獲得宗地位置、形狀及其面積的準確資料,為建庫奠定基礎。
現就地籍調查工作加以探討,眾所周知,權屬調查的工作之一是填寫地籍調查表。由於權屬調查技術性強,工作量大,參與人員多且水平不同等原因,填寫後的地籍調查表或多或少會出現下面一些問題。在填土地使用者名稱時,單位本應填寫全稱,可出現了類似這樣的情況:某林業局有3宗地,而在3份地籍調查表上出現了xx林業局、縣林業局、林業局等名稱。按這樣的名稱錄入建立資訊系統,將導致不能正確地自動的歸戶。在填寫土地使用者性質時,本應該寫“全民”或“集體”或“個體”或“個人”,而出現了“國營”或“國有”或“私營”這樣的名詞。在填寫宗地四至時應說明權屬界線所經地物名稱及歸屬、位置、與誰接壤。但出現了東(南、西、北)至xx,而未填出接xx。且有的四至填寫錯誤,如兩宗地共用一堵牆時,則只能出現兩宗都至牆中,或一宗至牆內另一宗至牆外,但填出了兩宗都至牆外或牆內等情況。在填寫界址標示處的界址線位置時也有類似錯誤,有的表填寫字跡潦草,或使用簡化字,讓人難以辨認。有的內容還可以猜出,但戶主的姓名、調查員、勘丈員的簽名等內容實在難辯;有的表中該填的內容而未填,任意塗改。
共用宗的處理,一個地塊被幾
個權屬單位共同使用,而其間又難以劃清權屬界線,這樣的地塊稱為共用宗[5]。不少縣(市)是這樣處理的:有多少土地使用者就填多少份地籍調查表,表上的內容按各分宗填寫。這樣做的好處是所填的內容詳細,調查表和土地登記申請書、審批表形成一一對應的關係。但其弊端也是顯而易見的,其一較大地增大了填表的工作量,其二增大了複雜程度,在填寫四至時,如遇一個土地使用者使用幾個地塊則不得不寫清幾個地塊的四至;為填清界址指標,又得設定內部界址點,增加了宗地草圖和地籍圖的負荷量,填表時如不小心還會造成表與表之間的相互矛盾。為了和地調錶統一,有的在形成宗地界址點成果表時,除了有宗地界址點成果表外,還有分宗的界址點成果表。如果內部界址點是在紙圖上圖解的,則將該宗地的宗地界址點和內部界址點和計算機展點後,會出現界址線混亂的情況。在土地資訊系統建庫時,這些內部點是不能當界址點錄入進庫的。如進庫則在面積統計時,這種內部界址點所圍成的區域的面積就被多統計了一次。
建立完備的資訊系統,必須具備這樣的條件:大比例的地形圖或地籍圖;野外測量的界址點資料;宗地的屬性資料(土地登記申請書、地籍調查表、審批表等)。全省在進行大大規模的城鎮地籍時,由於受當時的條件限制,自動化程度低,各作業單位作業水平的不同,或多或少出現一些問題。在建庫時所發現的問題主要是界址點的座標成果與地籍上的位置不吻合;相鄰宗的同一界址點座標不同;界址邊長、宗地面積計算有誤。某些縣(市)為了進行土地登記,由於多方面的原因,在進行初始地籍調查時,只作權屬調查,不作規範的地籍測量。為了計算面積,用皮尺或鋼尺丈量界址邊長及相關尺寸,用幾何圖形法計算出宗地面積,而不測址點座標和地籍圖。這樣做不利於資訊化的管理。
4、圖形數字化
影響資料質量的因素是多方面的,有相當一部分來自於建庫過程中的數字化過程。建庫過程中的資料質量,包括數字化前的預處理,紙張變形、手扶跟蹤數字化精度或掃描數字化的解析度和向量化精度。
(1)數字化前的預處理
用於數字化作業的地形圖(工作底圖)一般採用聚酯薄膜圖,其變形一般小於0.2‰。採用紙質圖紙時,圖紙的尺寸隨溼度和溫度的變化而變化,溫度不變的情況下,溫度由0%增至25%,則紙的尺寸可能改變1.6%[6]。因為紙的膨脹率和收縮率不相同,即使溫度回到原來的大小,圖紙也不能恢復原來的尺寸。因此在數字化時要適當的比例因子,透過仿射變換進行幾何糾正,以減小工作底圖變形產生的位置誤差,達到相應的精度。
對不同種類和比例的工作底圖進行數字化時,應注意它的投影方式是否一致,比例是否匹配。對於不同投影方式應在數字化後及時變換為系統要求的投影方式。對於不同比例應將比例尺和精度記錄到元資料中,以便估記由此可能產生的誤差。
(2)跟蹤數字化
手扶跟蹤數字是一種自動化精度較低的數字化方式,其數字化精度也因操作員及其工作的疲勞程度而異,操作員的勞動強度較高。隨著大幅面掃描器的成本不斷降低,掃描和向量化技術不斷完善,這種數字化方式可能成為自動掃描數字化的一種補充。
手扶數字化是從地形圖輸入空間資料的最廣泛採用的輸入方法。把地形圖放置於數字化桌上,用手持裝置,跟蹤每一個地圖特徵、數字化裝置精確量測滑鼠的位置,產生資料形式的座標資料。
影響跟蹤數字化資料質量的因素很多;主要有:數字化底圖中地理要素的寬度、密度和複雜程度對數字化結果的質量有著顯著影響。數字化儀的解析度和精度對數字化資料質量有著直接的決定性的影響。《地形圖數字化規範》規定,數字化儀的解析度不能小於每釐米394線(約1000dpi),精度不低於0.127mm(0.005英寸)。常見數字化儀在解析度方面通常能滿足要求,而在精度方面卻有相當一部分不能達到要求。在選擇數字化儀時要特別注意其精度指標,以滿足lis工程的需要。數字化操作員的技能與經驗不同而引入的人為因素誤差是不同的,由於操作員視力、操作習慣,熟練程度和疲勞程度的不同,最佳取樣點位值判斷,十字絲與目標點重合程度的判斷會有一定程度的差異,影響數字化的質量。操作方式(如曲線採點方式和
採點數目)也會影響數字化資料的質量。
假定各種誤差影響符合誤差傳播規律,手扶跟蹤數字化的綜合精度應按下式求得:[7]
m數=±
其中:m數 表示手扶跟蹤數字化的綜合精度;m定 表示工作底圖定向誤差,m儀 表示數字化儀精度,m人 表示人為因素誤差。
(3)、掃描數字化
掃描數字化用高精度掃描器將影象等掃描並形成柵格資料檔案進行處理,將之轉化向量圖形資料。規範規定:圖形定位控制點掃描誤差不大於0.1mm,相對於工作底圖,向量化後的掃描點誤差不大於0.15mm,線劃誤差不大於0.2mm。影響掃描數字化質量的因素除原圖質量外,還包括:掃描精度、定向精度、向量化精度損失等。
①掃描器的解析度和精度
掃描器的解析度和精度對掃描數字化質量的影響是至關重要的。因此,要根據具體情況選擇適當的掃描器。目前,大幅面掃描器大致有,滾筒式(drum),平板式(flatebed),直進式(direct feed)3種。這些掃描器能夠輸出一種或多種形式柵格資料檔案(二值、灰度和彩色)。
滾筒式掃描器精度較高價格較貴,能以較高的解析度掃描ao或更大的圖紙。
平板式掃描器與滾筒式一樣精度高、價格貴、解析度很高,但一般幅面不會超過a1幅面。由於平板式掃描器幅面小,掃描後多需進行拼接,從而增加了工作難度,引入了更多的誤差源。lis工程一般不選用這種掃描器。
直接式掃描器精度較低,價格也較便宜。通常能夠滿足一般lis工程的需要。
目前,需要的大幅面掃描器品牌有:contex、vider、anatech等。
在選擇掃描器時,應注意其是否採用硬體消藍。光學解析度代表了掃描器的解析度能力,而經銷商往往只是給出插值分辨。同時,應注意掃描器的歪斜失真,歪斜失真的大小與掃描器的走紙方式有關。
②柵格資料向量化的精度損失
在土地資訊系統中,柵格資料與向量資料各具特點與適用性,為了在一個系統中可以相容這兩種資料,以便有利於進一步分析處理,常常需要實現兩種結構的轉換。
柵格的向量轉換處理的目的,是為了將柵格資料分析的結果,透過向量繪圖裝置輸出
,或者為了資料壓縮的需要,將大量的面狀柵格資料轉換為由少量資料表示的多邊形邊界,但是主要目的是為了能將自動掃描器獲取的柵格資料加入向量形式的資料庫。
在柵格資料向量的過程中的細化、跟蹤等均可能引入一些誤差。複雜圖形全自動化向量化效果極差,會產生眾多的交叉線,導致多邊形跟蹤錯誤。對此,應採用互動式向量化方法。因此在選擇向量化軟體時不應僅僅關心自動化程度(全自動向量化軟體價格往往很高)。還要特別注意是否具有以下功能:智慧去斑,裁剪,扭曲較正,比例控制,水平校正,光柵編輯和互動式向量化等。
③掃描數字化方法誤差
掃描數字化的幾何解析度是掃描數字化方法誤差中最重要的誤差源,減小這種誤差的唯一方法就是提高掃描器的幾何解析度。但是,隨著解析度的提高,柵格資料量以平方級速度增長。這往往造成計算機儲存資源耗盡,資料處理時間平方級延長。以300dpi(約每mm12個點)的解析度掃描時,獨立點間距離的相對精度為1.4/1000左右。全自動向量化細化過程所產生的點位誤差為1~2個畫素點,而互動跟蹤向量化最大點位誤差可以控制在一個畫素點。按300dpi計,每個畫素點相當於圖上0.01mm。掃描數字化綜合精度可按下式計算:
m掃=±
其中:m掃 表示掃描數字化的綜合精度;m定 表示底圖定向誤差;m儀 表示掃描器精度;m矢 表示向量化誤差。這裡,m定取±0.12mm,按300dpi計算m儀取±0.09mm,m矢取±0.1mm。則m掃=±0.180[8]。
四、資料處理質量
土地資訊系統的資料庫建立後,其中已經包含了資料來源和資料庫建庫所引入的誤差。資料庫中的多源資料,經過系統的各種分析處理後,在形成新的資料和最後產品的過程中還會產生新的資料質量問題。這些問題包括:幾何改正,座標變換和比例變換,幾何資料的編輯、屬性資料的編輯、空間分析,資料格式的轉換等。
1、空間分析
空間分析是對分析空間資料的技術的通稱。從客觀上區分,可歸納為:空間的圖形資料的拓撲運算;非空間屬性資料的運算;空間和非空間屬性的聯合運算等[9]。空間分析賴以進行的基礎是空間資料庫,土地資訊系統的空間資料分析,是實現土地資源資訊系統的實際運用的重點途徑。
空間分析中的疊加分析是土地資訊系統中十分常用的一種分析方法,是使用者經常用以提取資料的手段之一。透過同一地區不同內容的多幅地圖的疊加組合,產生新的圖形和屬性資訊。在這個過程中往往產生拓撲匹配、位置和屬性方面的資料質量問題。由於疊加時多邊形的邊界可能不完全重合,從而產生若干無意義多邊形。對這些無意義多邊形進行處理的結果往往會改變界線的位置,疊加後形成的新的多邊形的屬性值也可能存在由於屬性組合帶來的誤差。
2、座標變換
土地資訊系統資料來源較多,各種資料輸入
資訊系統應便於系統對資料進行圖形顯示,疊加查詢,統計分析處理。lis要實現這些功能,一個首要和基本的前提就是各種不同來源的資料在系統內必須在一致的`地形圖座標系下。但是,在實際的資料採集過程中,大量的資料座標並不一定屬於系統使用者所要求的座標系,原始資料為一種座標系,系統要求的資料為另一種地圖座標系,有的資料座標根本沒有地理意義,對此情況,必須提供從一種地圖座標系到另一中座標系的座標變換。
在具體的操作過程中,有可能產生新的誤差。在不同比例尺下對座標資料的重新設立產生誤差,進行投影變換和/或基準面變換時產生的誤差。生產實踐中為提高資料質量,確保系統的資料精度和可靠性,通常用仿射變換和相似變換等模型來進行資料處理,以減小或消除誤差。
座標變換的實質是建立兩個平面點之間的一一對應關係,現有一般gis(lis是gis的專題)軟體大都提供了以下兩種模型實現座標變換。
一是仿射變換:仿射變換也稱六引數變換,其變換公式為:[10]
x=ax+by+c (ⅰ)
y=dx+ey+f (ⅱ)
其中,x、y為地圖輸出座標系中的座標點對;x、y為輸入座標中的座標點時;a,b,c,d,e,f為方程引數。引數在座標系空間上的幾何意義為:a和a分別確定點(x,y)在輸出座標中x方面和y方向上的縮放尺度。b和d確定旋轉角度,c和f分別確定在x方向和y方向上的水平移尺寸。
二是相似變換:當式(ⅰ)、(ⅱ)中的引數滿足條件a=e=scos@,b=-d=ssin@時,則得到四引數的相似變換公式:
x=ax+by+b (ⅲ)
y=-bx+ay+d (ⅳ)
式中,x、y為輸出地圖座標系中的座標點對;x、y為輸入地圖座標中的座標點對;a、b、c、d為方程引數,相似變換實質上也是座標系間的平移,旋轉和縮放尺度的變換,式中c和d分別為座標在x軸和y軸上的平移大小,
為了求出以上公式中的引數,建立兩種座標之間的仿射(或相似)轉換關係,至少需要三個(或兩個)已知的控制點座標。而實際上,應選擇多於三個(或兩個)控制點,方能按照最小二乘法原理進行平差,得出係數值,代入上述方程即建立輸入和輸出座標系之間的仿射(或相似)變換數學模型。
可以看出,仿射變換和相似變換都為線性函式變換模型,可實現對原圖形的平移、旋轉和縮放,相比較而言,相似變換不能進行x軸
、y軸不均勻縮放的變換,而仿射變換能保證更高的資料精度。
3、資料變換
(1)cad向gis的轉換
目前我國土地管理中存在一個較為普遍的問題是土地資訊系統的構建與圖形資料採集較少作用一個整體來通盤考慮,地籍測繪大大超前於資訊管理系統構建。中小城市這種問題表現得更為突出。為滿足土地確權發證,土地定級估價等需要,1995年前測繪的地籍圖等圖件因受技術條件的限制絕大部分是採用傳統白紙測圖方法完成的。隨著計算機技術的發展和在測繪工作中的普及應用,1995年之後數字地圖逐漸取代傳統測繪。但一個不容忽視的事實是,絕大多數測繪圖軟體是在autocad上進行二次開發完成的。有些甚至是採用低版本的cad,有些測繪圖軟體雖然測的是數字圖,但只有非編碼的圖形檔案,不保留資訊,或者圖形編輯以後,返不成資訊。這種數字圖說到底僅僅是從傳統的白紙圖過渡到計算機驅動繪製的白紙圖。本質上與傳統測繪沒有什麼區別。有些雖然採用了較高版本的cad基礎軟體二次開發成數字測圖軟體並採用了數字編碼技術,但由於較少考慮cad與gis的資料共享問題(土地資訊系統屬於專題gis)。在著手考慮構建土地資訊系統時,遇到的突出問題則是如何充分,有效利用已有數字資訊資料,並確保資料轉換質量。
對於傳統模擬圖或難以返成資訊的所謂數字圖只能採用原圖數字化,形成數字資訊後方可加以利用,但其精度丟失是不可避免的。
對於採用了編碼技術,也能返成資訊的數字圖,其數字資訊可以透過資料轉換來實現資料共享,但由於 cad與gis圖形資料之間其資料格式,資料內容甚至資料概念都有很大差異,資料轉換時應注意以下三個方面:[11]①資料格式轉換。不同的軟體有不同的資料格式,有些可以透過通用資料格式如dxf實現轉換,但轉換過程中的資料丟失也的確令人煩惱。②資料元素轉換。cad與gis兩者之間的圖形元素不是一一對應關係,cad圖形中的圖形元素種類要比gis圖形檔案中的圖形元素種類多,gis中只有點、線、面三類基本圖形元素,而cad中包括有點、線、面、註記、矩形等多種圖形元素,在具體轉換中,cad的圖形元素哪些轉換成gis的點,哪些元素轉換面面,什麼元素需要轉換成gis的屬性資料,什麼元素則不需要轉換到gis中去等。cad與gis圖形元素之間的對應關係,都需要認真細緻地加以技術處理,使空間資料和屬性資料在輸入系統後正確地連線起來。③拓撲關係的形成。因為cad的圖形元素之間沒有拓撲關係,實現cad向gis資料轉換的一個重要內容就是要將轉換後的圖形資料按照一定的技術要求經過編輯,在gis環境下建立幾何元素的拓撲關係。
在實際轉換中,還會出現許多意想不到的技術問題,會影響資料轉換質量,有待進一步解決。
(2)向量資料結構向柵格資料結構的轉換
土地資訊系統的建設中,許多資料如行政邊界,交通幹線,土地利用型別、土壤型別等都是用向量數字化的方法輸入計算機或以向量的方式存在計算機中,表現為點、線、多邊形資料。然而,向量資料直接用於多種資料的複合分析等處理將比較複雜,特別是不同資料要在位置上一一配準,尋找交點並進行分析。相比之下利用柵格資料模式進行處理則容易得多。加之土地覆蓋的疊置複合分析更需要把其從向量資料的形式轉變為柵格資料的形式。
向量資料的基本座標是直角座標(x,y),其座標原點一般取圖的左下角。網格資料的基本座標是行和列(i,j),其座標原點一般取圖的左上角。兩種資料變換時,令直角座標x和y分別與行與列平行。由於向量資料的基本要素是點、線、面,因而只要實現點、線、面的轉換,各種線劃圖形的變換問題基本上都可以解決[12]。
向量資料變成柵格資料的原理與方法並不困難,但由於向量資料的記錄方式各不相同,也會產生一些問題。如多邊形之間公共邊原來只有一條交界線,轉變成網格後成為有一定寬度的界線,產生了一定的近似性。特別是幾條線交叉處,一個網格元素中包括了相鄰的幾種類別,轉換時只能用其中的一種類別作為交叉點所在的元素的類別,這種誤差應在允許的範圍以內。而減小網格尺寸,雖提高了精度,但大大提高了資料的冗餘量。
柵格資料結構需要大量的計算機記憶體來存貯和處理資料,才能達到與向量資料結構相同的空間解析度,而向量結構在某些特定形式的處理中,如象多邊形疊置,空間均值處理等尚有大量的技術問題來解決。值得注意的是,無論採用哪種轉換方法,轉換的結果都會不同程度地引起原始資訊的損失。
4、空間資料的編輯
透過向量數字化或掃描數字化所獲取的原始空間資料,都不能避免地存在錯誤或誤差。屬性資料在建庫時,也難免會存在錯誤。諸如:空間資料的不完整或重複,空間點、線、面數據的丟失或重複,區域中心點的遺漏,柵格資料向量化時引起的斷線等,空間資料位置的不準確、線段過長或過短,線段的斷裂、相鄰多邊形結點的不重合及空間資料的變形等。因此,必須對圖形資料和屬性資料進行一定的編輯。
土地資訊系統資料編輯是消耗時間的互動處理工作,對空間資料不完整或位置的誤差,主要是利用lis圖形編輯功能,如刪除(目標、屬性、座標),修改(平移、複製、連線、分裂、合併、裝飾)、插入等進行處理。對空間資料比例尺的不準確和變形,可以透過比例尺變換和糾正來處理。
在資料的編輯過程中,由可能產生一些新的問題。如:線段的相關與延伸出現的問題,圖形的平移與旋轉出現的問題,刪除“細部多邊形”時產生的誤差,數值計算與變化的誤差;檔案的合併以及形成新檔案的問題;屬性資料的重新定義和更新的問題。有的問題時可能避免的,有的問題則無法避免。因此,必須進行檢核。透過耐心細緻的檢查,主要誤差都能從資料中尋找出來,並有效消除誤差。一般採用疊合比較法,目視檢查法和邏輯法。
疊合比較法是空間數字化正確與否的最佳檢核方法,按與原圖相同的比例尺把數字化的內容繪在透明材料上,此後與原圖疊合在一起,在透光桌上仔細的觀察和比較。一般。對於空間資料的比例尺不準確和空間資料的變形馬上就可以觀察出來,對於空間資料的位置不完整和不準確則須把遺漏、位置錯誤的地方明顯地標註出來。目視檢查指在螢幕上用目視檢查的方法,檢查一些明顯的數字化誤差與錯誤,包括線段過長或過短,多邊形的重疊和裂口、線段的斷裂等。
5、由計算機引起的問題
在計算機中,資料是由一定字長的編輯數碼錶示的,由計算機字長可能引起一種誤差。這種誤差出現在各種數值運算和模型分析中,由這種誤差引起的問題很多[13],例如lis空間資料庫中整數編碼對面積和周長計算的影響,比例尺變換和旋轉變換對拓撲關係的影響等。削弱誤差影響的主要方法有:改變資料在計算機中的表示方式,採用合適的演算法等。
除了資料處理精度外,資料儲存精度也與計算機字長有關。16位的計算機在儲存低解析度的柵格影象時不會出現問題,但儲存高精度的控制點座標或點位精度要求高的地理資料時,則不能勝任。
五、資料應用質量
土地資訊資料在使用過程中往往出現一些質量問題,這些問題包括資料的完備程度,時間的有效性,拓撲關係的正確等。
1、資料的完備程度
資料的完備程度指地理資料在範圍、內容、及結構方面滿足所有要求的完整程度。包括資料範圍、空間實體型別、空間關係分類、屬性特徵分類等方面的完整性。
一般來說,空間範圍越大,資料的完整性就越差。在土地資訊系統的建庫過程中,資料不完整最簡單的例子是缺少資料。如計算機從gps接收機傳輸位置資料時,由於軟體受干擾或其它因素的緣故,只記錄下經度而丟失緯度,以至造成資料不完整。另外由於gps接收機無法收到四顆或更多的衛星訊號而無法計算高程資料也會造成資料的不完整。又如某個應用專案需要1:5000的基礎底圖,但現在的地圖資料只覆蓋專案區的一部分,底圖資料便不完整。
在土地資訊系統底建庫中,涉及大量的地籍檔案。地籍檔案來源於土管機關的地籍部門,數量大、形式多、浩繁、零亂,隨著時間地推移,以及人為和自然的各種因素地影響,有可能遭到損壞。如檔案老化,書寫材料低劣、地籍檔案變到汙染,變色、蟲蛀等現象,進而影響到整個系統的質量。
2、資料的現勢性
資料的現勢指資料反映客觀現象目前狀況的程度。資料的現勢差,反映的客觀現象就可能不準確。不同現象的變化頻率是不同的。如地形的變化一般來說比人類建設要緩慢,地形可能會由於山崩、雪崩、泥石流、人工挖掘及填海等原因而在區域性區域改變。但由於地圖製作週期較長,區域性的變化往往不能及時地反映在地形圖上,對那些變化較快的地區,地形圖就失去了現勢性。城市地區土地覆蓋變化較快,這類地區土地覆蓋圖的現勢性就比發展較慢的農村地區會差些。地形圖上記錄著所用航空像片獲得的年代。若又用其他資料進行過修改(一般是較新的航空像片),也應記錄於上。
在土地資訊系統建庫中,要求地籍資訊和地籍圖必須具有現勢性。地籍資訊變更比較頻繁,如土地利用型別,權屬或宗地的重劃,合併等。由於受自然因素和人為作用的影響,土地資源的數量、質量、分佈和使用情況都處在經常變化之中。基於這一特點,土地管理部門提供的資料很難保證現勢性,這也是影響資料質量的一個重要方面。
3、拓撲關係
在lis中,為了真實地反映地理實體,不僅要包括實體的位置、形狀、大小和屬性,還包括必須反映實體之間的相互關係,這些關係就是指它們之間的鄰接關係,關聯關係和包含關係,拓撲關係。拓撲關係的核心是建立點、線、面的關聯關係。通常有以下幾種空間關係:點-點關係、點-線關係、點-面關係、線-線關係、線-面關係、面-面關係。空間資料的拓撲關係,對資料處理和空間分析具有非常重要的意義[14]。
利用拓撲關係,可以確定一種空間實體相對於另一種空間實體的位置關係。利用拓撲關係,可以確定某縣有多少耕地,分析土地利用型別及對土地適宜性做出評價等。
在拓撲關係的建立中,拓撲過程中伴隨有資料所表達的空間特徵的位置座標的變化,拓撲關係的不正確等情況,導致空間分析的結果錯誤,給土地管理決策帶來一定的影響。
六、結論
資料是lis最基本和最重要的組成部分,同時也是一個lis專案中投資比重最大的一個部分。資料質量的好壞,會直接影響到lis的系統功能和應用質量問題的三個方面(資料來源的質量問題、資料處理質量問題、資料應用質量問題)著手,對lis的資料質量問題進行了一定的歸納總結和初步的探討。眾所周知,lis的資料質量是影響lis的一個瓶頸環節,lis資料量大、資料種類多、資料結構複雜。因此,在lis的建設過程中,如何在資料採集與建庫中實施質量控制,保證資料質量對土地資訊系統建設來說顯得尤為關鍵。
七、總結與體會
畢業論文的撰寫是一次再學習和鍛鍊的機會,是對所學知識的一個融會貫通的過程。透過畢業論文的撰寫,我對所學的知識有了更深層次領悟和掌握,對自己所學的土地管理專業有了一個整體認識。畢業論文不僅是對所學知識的總結,也是運用所學知識探求新知的方法、手段。既是一次再學習的過程,也是一次深入學習的機會。同時,畢業論文寫作,為今後的學習工作奠定了一定的基礎。透過畢業論文的寫作,我真正懂得理論聯絡實際的重要性。在撰寫畢業論文中,我運用所掌握的基本知識、方法和技能,研究探討了土地資訊系統建立過程中資料質量的有關問題。透過畢業論文的撰寫,我進一步完善了自己的知識結構,學習了更多的知識。不僅如此,我對土地資訊系統資料質量控制措施與方法方面有了更進一步的認識。
透過畢業論文的寫作,不僅強化了我的學習素質、研究素質和創業素質,而且培養了我的創新意識,激發了我探求新知的慾望。認真寫作畢業論文,不僅能進一步鞏固所學的理論知識,而且還能進一步提高自己的各項基本技能,實踐能力和解決問題的能力。
八、謝辭
在論文的寫作過程中,玉文龍老師給予了很大的支援和幫助,為論文的寫作提出了許多寶貴性的意見和建議;在他的指導下,這篇論文得以順利完成。在資料的蒐集過程中,圖書館工作人員為我們提供了很大幫助,本組同學也給予了很多支援,在此表示衷心感謝。
參考文獻
[1] 錢樂祥,餘明全.土地資訊系統的幾個基本問題.測繪通報,1999(10).
[2] 張 超等.地理資訊系統.北京:高等教育出版社,1995.
[3] 閻 正等.城市地理資訊系統標準化指南.北京:科學出版社,1998.
[4] 範愛民,景海濤.地圖數字化質量問題.測繪通報,20xx(4).
[5] 嚴 星,林增傑.地籍管理.北京:中國人民大學出版社,1999
[6]-[7]郝向陽等. 地圖掃描數字化點位精度分析.測繪學報,1995,25(1).
[8] 毛 鋒等.地理資訊系統建庫技術及應用.北京:科學出版社,1999.
[9] 湯國安,趙牡丹.地理資訊系統. 北京:科學出版社,20xx.
[10] 徐建剛.城市規劃資訊科技開發及應用.南京:南京大學出版社,20xx.
[11] 司少先.地籍資訊系統源資料質量問題探討.測繪通報,1999(4).
[12] 邊馥苓主編.gis原理與方法.北京:測繪出版社,1996.
[13] 郭達志.地理資訊系統基礎與應用.北京:煤炭工業出版社,1997.
[14] 朱 光等.地理資訊系統基本原理及應用. 北京:測繪出版社,1997.