計算機資訊處理技術論文範文

  大資料時代的計算機資訊處理技術主要是針對海量資料儲存、管理、備份、處理、提取以及有效保障資料安全、有效、保密的資料處理技術。下面是小編給大家推薦的,希望大家喜歡!

  篇一

  淺析大資料背景下的計算機資訊處理技術

  摘要:該文主要簡單分析了大資料背景下的計算機資訊處理技術,從大資料的定義入手,分析了大資料的產生對計算機資訊處理技術帶來的挑戰,在此基礎上,說明了分散式儲存、資料探勘、資訊保安等大資料背景下的計算機處理技術,並詳細介紹了資料探勘的C4.5決策樹演算法思想、k-means聚類演算法思想以及資訊保安中的加密演算法的基本機制。

  關鍵詞:大資料;分散式儲存;資料探勘;資訊保安

  1概述

  隨著科學技術的不斷快速發展以及國民經濟的快速增長,基於網際網路絡的計算機應用逐漸在社會的各個行業中得到廣泛應用,我國社會正朝著數字化、網路化、資訊化的方向快速發展。由於計算機技術以及互聯網路技術的廣泛應用,在網際網路絡中產生的資料非常大,可以說人們在享受資訊時代為社會生活帶來無限便利和快捷的同時,也逐步向資料時代步入,而海量資料的生成,對傳統的IT資訊處理技術和計算機結構框架來說,雖然沒有致命的威脅,但是人們時時刻刻都需要對海量的資料進行儲存、處理、傳輸、計算、搜尋等任務,這對於當前網際網路絡和計算機系統快速響應終端使用者的請求以提升服務質量來說,也是非常巨大的挑戰。所以,對於當前大資料時代的計算機資訊處理技術技術的研究與分析,對於提升IT系統執行效率,優化企業生產效率來說,具有非常重要的現實意義。

  2大資料時代的資料資訊處理挑戰

  大資料***Big Data***的定義需要從兩方面理解,第一是從數量方面,是指需要處理或儲存的物件的資料量非常之大,是傳統資訊處理技術在適當的時間內難以完成資料處理任務的;第二就是這些資料中包含了很多有用的資訊,可以通過專門的將這些資訊提取出來以指導和決策人們未來的行為。大資料是當前網際網路絡和計算機資訊系統的大量應用的必然結果,而這樣的必然結果,並不意味著是一種累贅,如果取捨得當,反而是一種非常重要的資源和無形財富。所以,大資料的產生對於現代的社會是一種機遇,對於經濟的促進和發展也是良好的催化劑,如果一個企業能夠抓住對大資料資訊處理技術的核心技能,那麼必將在未來IT市場上佔據一席之地。那麼,大資料對資料資訊處理帶來了哪些挑戰?

  首先,大資料帶來了巨大的儲存壓力。可以以海量來稱謂的資料量,對於當前的資料儲存技術是非常大的挑戰,傳統的觀念或者資料管理系統對於大資料的儲存與管理已經捉襟見肘,如何良好地將這些海量資料有序地儲存,並且選用優越的資料管理機制進行資料壓縮、備份、管理等都是當前大資料背景下所需要考慮的問題。其次,資料查詢問題。傳統的直接查詢的資料庫管理系統已經很難應對海量資料的查詢,一個儲存量在GB級別的資料表的遍歷查詢都需要十幾個小時來完成,所以如何快速地實現對大資料的查詢和提取也是當前繼續解決的問題。最後,資料安全問題。網際網路絡中各種系統層出不窮,各式各樣的資料都需要相互傳輸,這些都為網路惡意攻擊者提供了可乘之機。各種社會工程學攻擊、病毒、木馬、系統後門等惡意行為都時時刻刻威脅著大資料資訊的安全,如何能夠保證大資料中有效資訊不被洩露或惡意篡改,這也是當前大資料時代亟須解決的問題。

  3 大資料背景下的計算機資訊處理技術

  大資料的發展推動了計算機資訊處理技術的快速發展,當前計算機資訊處理技術為了能夠滿足大資料量的資料資訊處理需求而得到快速更新。

  3.1 分散式儲存技術

  分散式儲存技術是當前專門應對大資料儲存的問題而發展起來的。由於大資料的海量資料使得傳統模式的單個數據庫很難儲存,同時應對管理以及備份等工作,分散式儲存技術打破了傳統的思維,利用網路專線或者高速網路將多個數據庫儲存伺服器搭建在一起,形成一個總分形式的分散式儲存系統,而上層的總與下層的分的特殊結構之間則是通過資料之間的邏輯關係串聯起來。在結構上看,分散式系統中同一個資料鏈中大資料可能隨機分配到不同的資料庫伺服器中進行儲存,而由於資料庫儲存伺服器彼此之間特殊的資料邏輯關係,看似分離的資料卻又在邏輯上得到統一。分散式儲存技術,不僅解決了海量資料的儲存問題,而且多個伺服器的共同服務還提升了大資料的高通併發性,解決了資料序列處理反應時間長的問題,大大提升資料處理效能。

  3.2 資料探勘技術

  資料探勘技術是主要應對大資料資料處理的而興起的、體現人工智慧處理的計算機處理技術。資料探勘技術多采用仿生學的手段,按照人類思維的方式,將海量的大資料進行處理,最終從海量資料中過濾出對企業生產或決策有用的資訊,進而指導人們的行為。資料探勘的主要流程包括資料選取、資料預處理、資料探勘、資料分析與評估。首先對大資料的有效部分進行選取,然後採用資料預處理的技術對資料中的無效資料、冗餘資料、零資料等進行清洗和刪除,然後採用資料探勘的技術方法對有效資料進行挖掘,最後將有用的資料,通過專門的應用系統進行分析與展示。其中,資料探勘技術是採用人工智慧的思維方式而設計的資料處理技術,主要包括決策樹、聚類、神經網路等多種資料處理技術,通過資料探勘的處理,最終對清洗後的資料進行有效地分類,最後通過專門的應用系統對分類的資料進行分析、處理、展示,從而使用形象直觀的方式展示有價值的資料資訊。

  在整個資料探勘過程中,真正體現人工智慧資料探勘分析的是資料探勘環節,資料選取、資料預處理以及後期的資料分析與評估都是資料探勘之前的準備工作以及資料探勘之後得到有用新的常規資料處理工作。資料探勘技術包含了很多技術和演算法,例如以二叉樹原理為模型的決策樹技術以及智慧分類的聚類技術,這些都是以資料分類為核心的資料探勘技術。決策樹是以二叉樹為基本模型,所有的資料都需要通過決策樹的根節點,然後按照固定的演算法分析,流向其子節點,依次計算指導最終的子節點。

  某個資料經過該模型是,首先按照固定的演算法進行計算,分析出該資料與父節點的差異度,然後根據結果流向其子節點。例如,一個對電子產品非常喜愛的人,在經過決策樹模型之後,其會流向“購買”的子節點一類中。在資料探勘過程中,經過選取和預處理的資料,都要經過決策樹模型進行分類,最終落到其相關的區域中。決策樹的模型相對比較簡單,關鍵環節就是如何判斷一個數據歸屬於哪一個節點。在決策樹的C4.5演算法的具體實現中,在對資料分類分析環節加入了資訊增益比的概念,即待挖掘的資料通過計算資訊增益比,比值比較高的進入到相應的節點中。簡單地理解就是,源資料落入兩個子節點的概率計算,概率高的即進入該分類節點中的可能性就比較大。

  聚類技術則是另一種資料探勘分類技術,與決策樹專門比值計算不同,聚類演算法是無目的分類。即採用聚類演算法分析資料時,只需要將其定義分為幾個簇群即可,並不用指定分成什麼樣在簇群。在聚類技術中,k-means演算法是常見的一種演算法,其核心思想就是通過指定的簇群個數,將源資料的資料生成對應個簇群中心,然後離該中心較近的即為該簇群資料。那麼,在k-means演算法的核心向就是如何生成簇群中心以及如何判斷源資料與該簇群中心的距離。K-means演算法採用歐式距離作為源資料與簇群中心距離的計算公式,首先按照分類個數任意選取對應個數的資料,然後將該資料作為每個簇群中心,然後將源資料與簇中心計算,在限定距離範圍內的資料即可劃分到相應簇群中直至結束。最後將每個簇群的資料計算其平均值,並且與原有簇群中心進行比較,如果不符合要求,則將該平均值作為新的簇群中心,再次從頭迴圈分類源資料,直到簇群中心值與新的平均值比值符合一定的要求,即可結束演算法處理過程。經過k-means演算法的聚類過程,最理想的結果就是平均地得到了對應個數的簇群,從而實現限定簇群個數的聚類過程。

  3.3 資訊保安技術

  資訊保安技術是大資料時代對資料保護的一道屏障,是保障大資料有效保密的處理技術。一般的資訊保安技術包括資料加密、身份認證技術、隧道技術的網路等。當然,這些資訊保安技術都是在一定程度上保障了資料資訊的安全,並不能完全杜絕例如由於應用系統的自身安全漏洞而引起的安全問題。所以,在大資料時代下,首先要加強IT網路自身安全體系框架的構建,加強運維部門或相關部門的監控運維力度,同時要加強IT網路框架安全測試的理念,採購良好的、穩定的IT安全運維方案,從而有效地保障大資料時代的資料資訊的安全。

  在資訊保安技術中,資料加密演算法是一直以來都在廣泛應用的演算法,不同的加密演算法在不同的資料環節中有不同的應用,例如在資料儲存時,常用MD5演算法對資料進行加密儲存,該演算法常應用於儲存資料驗證型的加密儲存,例如使用者密碼。MD5演算法是一直不可逆的演算法,即按照原始資料新增、資料分解、資料初始化以及處理的過程,將任意長度的字元按照固定的MD5演算法,經過多次的迴圈計算,變成128位長度的儲存資料。在身份認證環節,當系統使用者輸入登陸憑證之後,系統的應用會將該字串進行MD5加密處理,生成固定128位元組的字串進行傳輸,並與資料庫中的儲存字元進行對比,從而完成系統使用者身份驗證。MD5演算法只是單向加密,一般情況下,不可能通過逆演算法得到原始資料。而惡意攻擊者則通過各種方法來破解講過MD5演算法機密的雜湊值,例如彩虹表對比、密碼嗅探等等。而在資料傳輸過程中,加密的資料是需要在接收端呈現出原始資料值的,那麼就需要有解密演算法對加密值進行解密處理,不同的演算法,加解密的計算過程不一樣,關鍵是在在加解密的金鑰處理上。之前,一般的加解密演算法採用的是對稱金鑰,即加密演算法和解密演算法的加入金鑰是相同的,但是這樣在具體實現上也存在一定的安全風險,對於金鑰的管理工作卻成了困擾系統設計人員的核心問題。現在的不對稱金鑰的加密演算法,通過公鑰和私鑰的金鑰管理機制,極大地提升了資料加密的資訊保安程度,為當前大資料時代資訊資料的安全保密性帶來了極大的保障。

  4 總結

  大資料時代的計算機資訊處理技術主要是針對海量資料儲存、管理、備份、處理、提取以及有效保障資料安全、有效、保密的資料處理技術,只有資訊處理技術順應時代發展的需要,才能使人們在大資料時代享受更高質量的服務。

  參考文獻:

  [1] 張允壯,劉戟鋒. 大資料時代資訊保安的機遇與挑戰:以公開資訊情報為例[J]. 國防科技, 2013***02***.

  [2] 趙英偉,郭凱. 淺談資訊處理技術的發展[J]. 資訊通訊, 2014***12***.

  篇二

  試論大資料時代背景下基於雲端計算的未來圖書館數字資訊資源建設

  摘要:大資料時代的到來為圖書館服務提出了挑戰,圖書館的傳統業務受到衝擊和壓力,在大資料環境下使用雲端計算技術發展業務將成為圖書館未來的發展趨勢。本文介紹了大資料和雲端計算的概念和特性,闡述了現階段圖書館資訊資源建設所面臨的問題,分析了雲端計算在未來圖書館資訊資源建設中的應用,最後探討了雲端計算在數字圖書館中應用需注意的問題。

  關鍵詞:大資料;雲端計算;圖書館;資訊資源建設

  1 大資料

  1.1 "大資料"的含義和分類

  大資料之所以被稱為大資料首先因為它的資料是海量的,而且目前隨著科技發展,隨著人們對網際網路的依賴程度不斷提高,這個海量的資料正在超速增長。其次,大資料是海量的資料被整理納入大資料倉庫裡,然後對其進行分析挖掘,再利用有價值的結論進行下一步行動的決策[1]。

  大資料從資料內容結構上可分為結構化資料、半結構化資料和非結構化資料。結構化資料即行資料,儲存在資料庫裡,可以用二維表結構來邏輯表達實現的資料,在形式上有諸如文字、數字、符號,能夠用統一的形式加以標識。非結構化資料包括所有格式的辦公文件、文字、圖片、XML、HTML、各類報表、影象、音訊和視訊資訊等等,這些內容無法用簡單的邏輯表達實現,分析起來也需要特別的硬軟體。半結構化資料,就是介於結構化資料和非結構化資料之間的資料,它一般是自描述的,資料的結構和內容混在一起,沒有明顯的區分。

  1.2 圖書館的"大資料"

  圖書館的大資料首先包括書目資料。這些資料一般屬於圖書館穩定的結構化資料,目前這些資料的使用多用SQL工具分析。對於結構化的資料,小規模的資料,目前的分析工具足可以用了。對這些數字化書目資料做分析可以反映出一個圖書館館藏的級別、服務的物件、服務的傾向和服務的質量。

  圖書館的大資料雖然以結構化資料為主,但隨著圖書館新服務的開展,圖書館與讀者的互動資訊,以及讀者面對圖書館的各種資訊行為都會被記錄,這些資訊將成為圖書館大資料中的非結構化資料。這些動態的非結構化資料可以來自圖書館業務內容,也可以來自讀者服務體驗。

  2 雲端計算

  2.1 雲端計算的概念

  雲端計算是平行計算***Parallel Computing***、分散式計算***Distributed Computing***和網格計算***Grid Computing***以及Internet 結合起來的新的網路資源提供模式。雲端計算是以虛擬化技術為基礎,以網路為載體,以提供基礎架構、軟體、平臺等服務為形式,整合大規模可擴充套件的計算、資料、儲存、應用等分散式計算資源,進行協同工作的超級計算模式[2]。它不僅是資源的簡單彙集,而且為我們提供了一種管理機制,讓整個體系作為一個虛擬的資源池對外提供服務,並賦予開發者透明獲取資源、使用資源的自由。

  2.2 雲端計算的特點

  2.2.1超強的計算能力

  雲端計算由成千上萬臺伺服器組成的叢集能賦予使用者前所未有的能力。使用者可以擁有超大的儲存和管理空間,以及超強的計算能力。

  2.2.2海量的儲存空間

  雲端計算為資料的儲存提供了廣闊的空間,它是將大量的伺服器叢集共同組合在一起,形成巨大的空間,所有的資料通過雲端計算中心運算處理後返回給使用者。

  2.2.3可靠的安全保障

  雲端計算使用了資料多副本容錯、計算節點同構可互換等措施來保障服務,儲存在雲裡的資料資源丟失或硬體崩潰都不會受到影響,雲端計算技術儲存資料安全可靠。

  2.2.4便利的資源共享

  由於是將大量的資訊匯聚成一個整體,對於同一資源可以供多方共同使用,從而避免了資源不必要的重複,進而提高了資訊資源的共享程度。同時,雲端計算可以針對不同應用即時應對,規模可以動態伸縮,雲端計算下的資源可以根據應用和使用者規模增長的需要隨時進行動態擴充套件和配置。

  2.2.5良好的系統相容

  對於不同的作業系統,不同的資料格式,不同的資料庫之間的資料,雲端計算可以通過一站式檢索不同系統中的相同資訊,系統之間可以無縫連線和訪問。

  3現階段圖書館資訊資源建設面臨的問題

  圖書館的數字資源包括圖書館引進或自建的,擁有磁、光介質或網路使用權的數字形態的文獻資源。根據數字資源的種類可分為:電子書、電子刊、二次文獻資料庫和其他資料庫。根據數字資源的存在形式可分為:線上資源和本地映象資源。根據數字資源的來源可分為:購買的資料庫、自建資料庫、試用資料庫和免費資料庫[3]。現階段圖書館都是各自為政,在建設的過程中存在著很多問題。

  3.1 數字資源重複建設問題

  目前,館與館之間數字資源的建設都是相互獨立的,在建設過程中都是按照學校經費多少和專業的需求進行資源建設,一般都不會考慮其他館的建設情況,只埋頭建設自己的數字資源。這樣勢必造成了大量的人力、財力的浪費,從巨集觀的角度看不利於高校圖書館的發展。

  3.2 儲存及檢索技術問題

  隨著數字圖書館的發展,圖書館的數字資源海量增加,而其資料管理、備份、儲存裝置能力都十分有限。同時,數字資源的圖片檢索技術、多語言檢索、不同資料標準之間的資料交換、人機互動技術、數字圖書館所需的軟體和工具等都還有待於技術上的進一步發展[4]。

  3.3 資訊資源共享問題

  目前,圖書館資源的共享往往侷限在一些對口的、介面相同的資料資源上。由於數字圖書館平臺技術不統一,各館間有的資料無法相通,這樣就談不上共享。

  4 雲端計算在未來圖書館資訊資源建設中的應用

  圖書館資訊資源建設的最終目的是為了滿足使用者的需求,提高服務質量。雲端計算的出現使分佈在網際網路中各個圖書館的資源和服務整合成為一個整體,使其服務的時間、空間、服務方式等有了無限擴大完善的可能。分析雲端計算的特點和它所提供的服務形式,我們可以看出,雲端計算的模式也適用於圖書館的數字資訊資源建設。

  4.1 雲端計算可提供圖書館海量資訊資源資料儲存的能力和提升資料安全。

  圖書館的基本功能之一就是儲存資源。隨著時代的發展和科技的進步,各種資訊資源呈爆炸性的增長。目前圖書館通過增加儲存能力來滿足日益增長的資源空間已經力不從心。雲端計算採用分散式儲存的方式儲存資料,資料不再儲存在本地硬碟,而是通過網路儲存在雲端計算系統中,可以容納海量資料,並且不斷更新和增加,為數字圖書館不斷增加的電子資料提供海量的儲存空間。同時,雲端計算採用冗餘儲存的方式來保證儲存資料的可靠性,即為同一份資料儲存多個副本。在資料管理方面,雲端計算使資源更加高速、高效地存取,使資料的操作頻率遠大於更新頻率[5]。

  4.2 雲端計算可實現圖書館的數字資訊資源整合以及共建共享

  雲端計算的一個核心內容就是對"儲存內容"的整合與應用。雲端計算技術為數字資源的整合鋪平了道路,它不僅為實現多種資源的全面共享創造了統一的資訊資源平臺,而且遮蔽了資訊資源的不同格式,解決了各類資料庫的資料標準化和介面問題。基於雲端計算的數字圖書館將異構分佈環境下不同來源的海量資料資源進行統一整合,可以極大地提高資訊資源的利用率,實現數字資訊資源的共建共享[6]。

  4.3 雲端計算可提高圖書館資訊資源的利用率和資訊服務的能力

  雲端計算通過對各種資源、格式使用統一的管理平臺,共享應用和資料,實現更大的網路效益。圖書館的電子資源將儲存在"雲"裡無數伺服器中,而不是儲存在單獨的某臺計算機中。利用雲端計算整合跨資料庫、跨地區資料能力,實現對各型別資料庫的雲整合,形成各型別資訊資源服務雲,提高資訊資源的利用效率。同時,利用雲端計算,使用者可以在圖書館任意一個角落隨時隨地使用已有的"雲"中的資源與計算服務,這樣簡化和壓縮了圖書館資訊組織、資訊服務以及資訊獲取的過程,提高了圖書館資訊資源的利用效率和社會價值。

  5 數字圖書館使用雲服務需注意的問題

  5.1 資料安全性與保密性

  圖書館中哪些資料置於雲端,哪些資料需放在本地是圖書館需研究考慮的問題。圖書館書目資訊、讀者個人資訊、電子資源資料庫等資訊資源需進行梳理,然後再研究確定如何存放。關於圖書館讀者資訊等個人隱私方面資訊,更多是政策層面的問題。

  5.2 資訊資源共享中的版權問題

  "雲"模式的數字圖書館之間通過有關協議共享彼此的資訊資源,在提高資訊資源共享的同時,可能因為版權問題而引發糾紛。隨著資料探勘、系統共享、資訊共享技術的不斷開發,置於公共雲端的數字資源有可能成為資訊資源共享使用中的物件而產生版權問題。所以,雲端計算環境下資訊資源中的問題,既要保障資訊資源的共享性,又要達到內容不受侵犯等智慧財產權問題,值得關注[7]。

  5.3 網路質量問題

  搭建數字圖書館的雲端計算服務平臺時,需要考慮到網路通訊能力的好壞。由於使用者的訪問和應用都取決於圖書館的雲端服務,網路的高頻寬和流暢性至關重要。雲端計算是客戶端效能最小化、在雲端計算網路中完成的高效資訊處理,這對雲端計算叢集伺服器的效能有較高的要求,同時,網路中通訊設施也需要高效能,才能保證將雲端計算的服務高質量地傳給需要的使用者。

  6結論

  "大資料"是高校圖書館未來發展無法逃避的發展趨勢。雲端計算模式的出現,給數字圖書館的發展提供了更多的技術和服務支援,把雲端計算運用到圖書館中,不僅可以提高資源的利用率,節約圖書館的資源,也可以給雲端計算帶來一個新的應用領域。以資訊服務工作為己任的高校圖書館,如何以"大資料"的思維重新認識高校圖書館,如何利用雲端計算技術將已有的資料資源進行有序組織、深入挖掘與開發,如何進一步推動數字圖書館的發展,成為高校圖書館未來發展的關鍵。

  參考文獻:

  [1]郝志剛,大資料、雲端計算與圖書館[J].新世紀圖書館,2014***6***:36-39.

  [2]朱勇,淺談雲端計算與圖書館資料中心[J].科技情報開發與經濟,2010***24***:72-74.

  [3]於健,雲端計算與圖書館未來數字資源建設[J].情報探索,2012***6***:63-65.

  [4]盧曉娟,雲端計算與未來圖書館數字資訊資源建設[J].四川圖書館學報,2009***2***:23-24.

  [5]蔡惠霞,淺議雲端計算與圖書館資訊資源建設[J].內蒙古科技與經濟,2012***14***:36-37,39.

  [6]尚武,楊湧,雲端計算與數字圖書館的發展[J].中華醫學圖書情報雜誌,2013***1***:48-49,56.

  [7]高曉燕,雲端計算在圖書館中的應用探究[J].高校圖書情報論壇,2010***2***:49-52.

  篇三

  談計算機文字資訊處理技術的發展歷程及影響

  傳統模式的文書處理技術,無論是從字樣整體的辨別率、模組的調整還是使用的範圍來說,都已不能滿足現代生活的需要。而現代文書處理技術採用的是曲線模式的調整,通過對外圍輪廓與內部輪廓不同幅度的調整,使文字的彎曲程度以及辨別率都具有較大的提高。

  1 計算機文書處理技術發展歷程及分類

  1.1 文書處理技術發展歷程

  隨著現代科技技術的不斷髮展,文字表現形式凸顯模式多種多樣。主要是以“非黑即白”的演化模式表現現有文字,在技術上主要以點陣、向量以及曲線,字型分為點陣模式,點陣包括左右結構、上下結構,文字排序結構按照字型模式把單個結構進行解體。向量主要是以字型的筆畫順序連線而成,向量既有大小又有方向,在文書處理技術上,向量技術主要對文字平面設計進行處理,文字內的橫和豎的排列關係都是按照向量模式進行配比的,假設沒有合適的向量關係,就使文字失去了原有的價值觀念,沒有整體性的方向感。曲線技術處理文字的效果主要是顯示文字整體的量化性,使文字整個筆畫連續起來,這樣才能保證文字在後期處理效果上,顯現出的不只是流線形的整體美感,而更重要的是文字能夠在顯示螢幕上正確地表示出來,這樣才是文字最終的處理技術。

  1.2 文書處理技術之點陣字

  文字點陣字處理技術是採用0和1點陣的圖形來描述文字畫素效果,點化成面、面化成體,這種拼湊的技術效果在文書處理上顯得尤為重要。點陣式利用電平之間的跳變,畫出文字的點陣符型。假設在處理文字“周”的點陣結構上,在電平跳變模式上打出0和1畫素的包含點,在外邊框進行電平0的跳變,在半包圍結構內進行1的跳變,畫素點化成型模式便能根據不同的電平點進行處理,這樣在後期列印排版時節省搜尋畫素的時間,通過0和1畫素分配點的不同對文字進行整體控制,加大了文字的解析度,根據800×624點畫素的解析度對文字進行識別,文字在組合上不會出現因識別率低造成不能識別的現象。但這種技術也具有一定的弊端,資料流量大,在文字整體邊緣模式易產生鋸齒,文字在組合上不能進行有效地旋轉和移相。

  1個畫素點含有2個位元組數,每個位元組含有的資訊資料量為8bit,這樣在整合畫素點空間資料流量上就增大了儲存空間。產生鋸齒是由於畫素點排布均勻造成的,文字整合的畫素點比較多,計算機在掃描過程中對2um範圍內的空白處,都進行了畫素點的整合,造成在後期曲線成型上出現的鋸齒較多。文字的旋轉和移相,文字的旋轉需要點陣模板的轉換,轉換過程中使畫素點的電平發生突變,0電平會因為瞬時的轉置,造成在畫素點的偏移,該位置處不會出現畫素點,產生區域性化的空白。變形是根據點陣字相位的偏移進行整合的畫素,變形時需要把文字進行放大或縮小,在放大過程中,會把畫素從中心點位置處向邊緣化擴張,使點陣圖的偏置隨著偏移量的變化變大,假設文字在放大過程中,由於點陣圖偏移量的變化幅度控制在0.4um~0.6um範圍內,點陣圖對應的畫素點便會擴大至原來的2.5倍。點陣圖的縮小也是這樣進行的。

  1.3 文書處理技術之向量字

  向量字處理技術是一種利用有向線段來描述文字的外圍輪廓,每個文字的組成部分都包含有筆畫的結構部分,假設文字結構沒有筆畫結構,整體效果便會顯得很複雜化,加大後期文字簡化的難度。向量處理的文字技術採用多線段的方式拼湊文字的外圍結構,每個文字都是由多個線段構成,並且線段分為有向線段和無向線段,有向線段在文書處理技術上被廣泛採用,在有向線段處理的技術上添加了向量協議,保證整體線段的構造既有大小又有方向,在文字外圍輪廓上還有具體的座標點。假設處理問題“量”字的結構模型時,向量的有向線段會把整體結構分為上中下三部分結構,每部分結構含有向量的有效值不一樣。上半部分為“曰”,該字整體結構為全包圍結構,在向量線段處理上,上下線段在數值上大小相等,方向相同,在左上點標記座標原點,進行向量線段的繪製,設左上點的座標為***0,0***,右上角的座標值變為***2,0***,便能拼湊出上半部分的整體結構。再統計左半邊的座標數值,分為負半軸結構,表示的座標點為***0,-2***,這樣便能有效地確定出左半邊的字畫結構。通過這種模式的描繪與計算,設計下半部分結構根據座標值序號之間的連線,便能很快把整個字型的模式有效地折射在座標軸上。

  向量欄位文字的處理技術具有以下優點:檔案資訊量少,與點陣式相比,不用進行文字的打點。而是採用整體繪製的方式,佔用整體的資訊量少,對於一般的筆畫數,含有的資訊量為4bit,整個文字包含的資訊量與點陣式的畫素點相差甚多。向量採用的是整體結構,流程簡化,在原有的基礎上便可操作。但從複雜角度進行分析,向量的彎曲度很難掌控,線段彎曲程度與折線的條數有關,折線的條數越多,則彎曲程度的複雜性就越大,使文字在整體表現效果上很難達到平整的自然過渡。假設計算機文字向量處理技術在某欄位彎曲部分的筆畫數較多,存有折線的複雜性較大;向量在整合點處存有的位元組片段較多,彎曲程度加大。

  1.4 文書處理技術之曲線字

  曲線文書處理技術採用的是正交曲線的變化關係,在一次線性代數關係式中y=kx+b與二次線性代數式y=ax EMBED Equation.3+bx+c中未知函式變化的幅度不一致,在後期字模成型的樣本也不一致。假設利用曲線文書處理技術在處理“圖”字時,首先利用一次函式關係式y=kx+b對外圍輪廓線進行描繪,確定文字各點的不同位置。再利用二次曲線函式關係式y=axEMBED Equation.3+bx+c對內輪廓線的精確度進行細緻化的調整,統一對各部分的線型關係進行規劃。這種處理技術精確度高,採用不同的線性函式關係對文字的內外輪廓線進行統一調整,這樣在無極倍數上可擴大無限次。並且,這種文書處理技術的印刷度高,一次可成形多個版本的字型,通過調節函式內外輪廓的對比度進行放大和縮小。假設對字型模式的變換中對一次函式y=kx+b中,k的取值進行變化,通過調節幅值的變等關係,使外圍輪廓幅度的誤差降值6%左右。

  2 計算機文書處理技術對人類文化的影響

  文書處理技術對人類文化發展具有積極的影響,首先確立了不同的感官字型。通過處理技術中點陣字、向量字以及曲線字的演進,在產生文字邊沿的鋸齒、資訊量的大小以及整體的外觀形象都具有非常大的發展。例如,文字邊沿的鋸齒的磨合,早期利用點陣字的處理技術,由於畫素點偏振集中性強,使在文字的外邊沿產生大量的畫素整合點,在後期點成線的規劃階段時,各個畫素點模糊性強,不能連成有效的整體部分。後來利用曲線式文字的處理技術,為文書處理的過渡提供了有力的平臺。曲線成型的文字字模接近完美的飽和度,利用一次曲線成型外圍看輪廓,利用二次曲線對文字內部的勾畫進行合理的調整,使文字整體的美觀感受接近理想狀態。原有文書處理技術出現的誤差率非常大,並且文字成型版塊沒有固定的模式。在印刷處理上,文字的外圍輪廓與內部結構之間的結構幾乎相連,造成文字的辨別率差。

  由於現有技術的不斷髮展,原有處理文字的技術被淘汰,採用現代化計算機處理技術,對人類文化的發展具有積極的影響。傳統印刷處理上還是採用的是人工印刷,效率低、辨別率差、整體美感達不到人類的要求標準。但採用計算機文書處理技術,這種現象有大幅度的改善,其中包括文字的字樣、辨識率、流線性、字元模組的版面都具有人性化的設定,字樣包括宋體、楷體、微軟雅黑、仿宋等,滿足人們在計算機上處理文字的要求。

  3 結語

  人類文化的發展過程中,文書處理技術的演化包括多個階段,每個階段的變革對文書處理技術都具有積極的一面。計算機文字資訊處理技術滿足了人類對字樣的分析標準,擴寬了使用者文字種類使用上的範圍,對各種字型的字號、模組也可隨意調整,這樣的文書處理技術將會帶來更多的發展前景。