淺談紙質標準文獻的數字化過程及其管理措施論文

淺談紙質標準文獻的數字化過程及其管理措施論文

  前言

  在資訊化社會,如何利用先進的計算機網路技術有效地管理紙質標準文獻,開發和利用紙質標準資源,提高紙質標準文獻的綜合利用和服務水平,已成為數字化標準館建設和發展所面臨的一個重要課題。紙質標準文獻的數字化管理作為開發和利用標準資訊資源的基礎和前提,作為數字化標準館建設的一項重要的、基礎性的工作,已被提上了重要日程。

  1對紙質標準文獻的數字化與數字化管理的理解

  1.1數字與數字化

  數字的特點是最簡單、最客觀、速度快、國際化。所謂數字化,是指用計算機技術將模擬訊號轉換為數字訊號的處理過程。

  1.2紙質標準文獻的數字化的含義

  所謂紙質標準文獻的數字化,是指採用掃描器或數碼相機等數碼裝置對紙質標準文獻進行數字化加工,轉換成數字訊號或數字編碼,將其儲存在磁碟、光碟等載體上並能被計算機識別的數字影象或數字文字的處理過程。

  1.3紙質標準文獻的數字化管理的含義

  紙質標準文獻的數字化管理是指利用計算機、通訊、網路等技術,透過數字訊號或數字編碼來操縱管理物件、控制管理行為,實現標準文獻的採集、整理、加工、儲存、備份、利用、服務等的管理活動和方法。隨著管理過程資訊化程度的提高,採用標準文獻的數字化管理系統,實現數字資訊系統來輔助質量管理並與實現跨時空、同步性的資訊化溝通。

  2紙質標準文獻的數字化

  2.1軟硬兼施是前提

  紙質標準文獻的數字化要實現文字在不同載體之間自由轉換,涉及掃描技術、OCR技術、資料壓縮技術、資料庫技術、多媒體技術、儲存技術等多種技術,才能完成數字化的標準文獻目錄資訊、數字化的標準文獻全文資訊和數字化的標準文獻資料庫資訊。這些數字化技術和工作,依賴於必要的裝置設施。因此要大力加強數字化工作的硬獻、軟獻建設,為實現紙質標準文獻的數字化提供物質保障。如,軟獻方面,要準備資料庫SQL SERVER、標準文獻的數字化管理軟獻,實現功能模組的管理,能夠對不同定義的標準文獻資訊進行查詢、管理。硬獻方面,要添置高速掃描器、平板掃描器、燒錄機、光碟等。

  2.2要分類實施

  紙質標準文獻的數字化,不能一蹦而就。筆者認為,一是要實行“存量數字化”,大力推進已有的紙質標準文獻的數字化,實現存量的紙質標準文獻100%數字化二是要實行“增量電子化”,全面開展新增的新標準文獻的數字化工作。

  2.3紙質標準文獻的數字化流程

  紙質標準文獻的數字化,主要流程一般包括紙質標準文獻的整理、掃描、影象處理、影象儲存、資料處理、資料驗收、資訊儲存、目錄建庫、資料掛接、資料備份等工序。

  2.3.1紙質標準文獻的整理

  紙質標準文獻在掃描之前,要根據情況,按步驟進行適當整理,並視需要作出標識,確保數字化質量。一是做好目錄資料準備。主要是規範目錄內容,包括確定目錄的著錄項、欄位長度和內容要求。如標準文獻的中英文標準名稱、標準編號、釋出者、釋出時間、實施時間、起止頁號和頁數、附獻等。二是拆除裝訂。在不去除裝訂物(如釘書針等)情況下,影響掃描工作進行的標準文獻,應拆除裝訂物。拆除裝訂物時應注意保護標準原獻不受損害。三是整理登記。製作並填寫紙質標準文獻數字化加工過程交接登記表單,詳細記錄標準文獻整理後每份文獻的起始頁號和頁數。四是還原裝訂。掃描工作完成後,拆除過裝訂物的標準文獻應重新裝訂。恢復裝訂時,要注意保持標準文獻的排列順序不變,做到安全、準確、無遺漏。

  2.3.2紙質標準文獻的掃描

  主要是選擇掃描方式、掃描色彩模式、掃描解析度和標準文獻掃描,包括根據標準文獻幅面的`大小(A4, A3等)選擇相應規格的掃描器進行掃描,選擇黑白二值、灰度、彩色等掃描色彩模式,選擇掃描解析度(需要進行OCR漢字識別的標準文獻,掃描解析度宜選擇大於或等於200dpi),核對每份文獻的實際掃描頁數與標準文獻整理時填寫的文獻頁數是否一致。

  2.3.3影象處理

  主要是檢查影象偏斜度、清晰度、失真度等影象資料質量、是否漏掃、是否需要糾偏、去汙、分割槽掃描形成的多幅影象的拼接、裁邊處理去除多餘的白邊等。

  2.3.4影象儲存

  包括儲存格式和影象文獻的命名。採用黑白二值模式掃描的影象文獻,一般採用TIFF (G4)格式儲存。採用灰度模式和彩色模式掃描的文獻,一般採用JPEG格式儲存。儲存時的壓縮率的選擇,應以保證掃描的影象清晰可讀的前提下,儘量減小儲存容量為準則。提供網路查詢的掃描影象,也可儲存為CEB, PDF或其他格式。紙質標準文獻目錄資料庫中的每一份文獻,都有一個與之相對應的唯一編號,以該編號為這份文獻掃描後的影象文獻命名。多頁標準文獻可採用該編號建立相應文獻夾,按頁碼順序對影象文獻命名。

  2.3.5目錄建庫

  包括資料格式選擇、建立目錄資料庫和目錄資料質量檢查。目錄建庫應選擇通用的資料格式。所選定的資料格式應能直接或間接透過XML文件進行資料交換。建立標準文獻目錄資料庫,並以人工校對或軟獻自動校對的方式,對目錄資料庫的建庫質量進行檢查。核對著錄專案是否完整、著錄內容是否規範、準確,發現不合格的資料應要求進行修改或重錄。

  2.3.6圖文轉換

  將掃描的以TIFF (G4) , JPEG, CEB, PDF或其他格式的影象文獻透過OCR文字識別軟獻或PDF轉換器轉換成WORD文件。並按標準原獻的格式式樣排版好。

  2.3.7資料掛接

  主要包括彙總掛接和資料關聯。標準文獻數字化轉換過程中形成的目錄資料庫與影象資料庫 (或轉換好的WORD文件庫),檢查無誤後,透過網路及時載入到資料伺服器端彙總。透過每一份影象文獻(或轉換好的WORD文件)的文獻名與標準文獻目錄資料庫中該份文獻的編號的一致性和唯一性,建立起一一對應的關聯關係,以實現標準文獻目錄資料庫與影象文獻(或轉換好的WORD文件)的批次掛接。

  2.3.8資料驗收

  以抽檢的方式檢查已完成數字化轉換的所有資料,包括目錄資料庫、影象文獻、轉換好的WORD文件及資料掛接的總體質量並經分管領導稽核、簽字。

  2.3.9資料備份

  經驗收合格的完整資料應及時進行備份。為保證資料安全,備份載體的選擇應多樣化,可採用線上、離線相結合的方式實現多套備份,並實行異地儲存。備份資料也應進行檢驗。備份資料的檢驗內容主要包括備份資料能否開啟、資料資訊是否完整、文獻數量是否準確等。資料備份後應在相應的備份介質上做好標籤,以便查詢和管理。

  3紙質標準文獻的數字化管理

  3.1紙質標準文獻的數字化管理的優點

  紙質標準文獻的數字化管理與傳統紙質標準文獻的管理具有無法替代性和優越性:

  3.1.1效益大大提高

  紙質標準文獻的數字化管理是對以增加人力和辦公費用為主的粗放型管理模式的變革。它解決了人力資源增加和管理成本上漲的難題,並且使紙質標準文獻的資訊物件轉化為機讀標準文獻資訊,既節約了保管費用,又節省了保管空間,更為有利的是查閱起來極為方便、快捷,也避免了反覆影印標準文獻而造成的人力成本的增加和紙張的浪費。

  3.1.2效率大大提升

  紙質標準文獻的數字化管理使標準文獻能及時歸檔,並方便、快捷、及時提供利用。紙質標準文獻的數字化管理可遠端提供詳細、即時的資料資訊提供服務。紙質標準文獻的數字化管理使查詢標準文獻變得非常簡單,真正做到足不出戶。基於標準資訊的超時空、遠端化傳送,數字化的標準文獻就成了“無牆界的紙質標準文獻”,數字標準文獻的標準庫也從紙質標準實體的保管變成了提供利用方便、快捷的數字化標準資訊中心。而且標準是否更改、是否廢止、是否是最新的可一次性族性檢索出來,效率大大提升。

  3.1.3有力地保護了紙質標準文獻的原獻

  將紙製紙質標準文獻轉變為數字化電子標準文獻後,紙質標準文獻的使用更加安全。另外,透過紙質標準文獻的數字化處理後,防止了部分紙質標準文獻的篡改的行為。

  3.2紙質標準文獻的數字化管理措施

  3.2.1“服務為先”,實施標準文獻管理平臺的建設

  要牢固樹立服務理念,堅持服務為先,在服務中實現管理,在管理中體現服務,進一步在標準文獻檢索利用平臺、載體、機制和手段創新上下功夫,建立服務主體多元、資源最佳化配置、供需對接的服務供應方式,建立“標準文獻管理系統”,集標準文獻採集、標準文獻管理、標準文獻利用於一體的綜合管理軟獻,實現對標準文獻的收集、鑑別、整理、保管、轉遞、統計、檢索、查閱利用、列印等日常工作的數字化管理。

  3.2.2“保障有力”,建設標準文獻管理網路

  一是建立梯次的人員管理網路,設定管理員管理許可權,明確管理員管理職責;二是伺服器和服務終端建設,建設一套系統連通區域網絡,實現伺服器與客戶端資料的雙向透明傳輸。

  3.2.3“安全第一”,建設標準文獻管理防火牆

  標準文獻管理安全保障要覆蓋事前、事中、事後,覆蓋標準文獻應用安全、維護安全、使用安全和儲存安全。除了前面已提到的資料備份保安全之外,還要重點確保資料庫安全。資料庫安全包含兩層含義:第一層是指標準文獻管理系統執行安全。系統執行安全通常受到的威脅如下,一些網路不法分子透過網路,區域網等途徑透過入侵電腦使系統無法正常啟動;第二層是指標準文獻管理系統資訊保安。駭客對資料庫入侵,並盜取想要的資料。資料庫系統的安全特性主要是針對資料而言的,包括資料獨立性、資料安全性、資料完整性、併發控制、故障恢復等幾個方面。我們加強對紙質標準文獻數字化成果的管理,確保其安全、完整和長期可用。

  結語

  紙質標準文獻的數字化及其管理是一項長期的、複雜的、細緻的、系統性的工作,必須貫徹“統一規劃、分步實施、逐步完善”的工作思路,採取得力措施,紮紮實實地進行,才能取得滿意的成效。

最近訪問