資料探勘技術下數字化油氣藏研究論文

資料探勘技術下數字化油氣藏研究論文

  摘要:油氣藏在勘探開發及其研究與決策過程中,形成巨量的成果及資料。為了更加科學開發與管理油氣藏,充分運用和發揮好這些巨量資料的資訊作用成為關鍵,資料探勘作為一種有效的資訊處理技術,可以在海量資料中快速找出有用資訊,為研究與決策提供強有力的資料支援。長慶油田在油氣藏研究與決策支援系統(RDMS)建設中充分利用各專業資料庫及多種資料探勘方法,構建了一個滿足勘探、開發、儲量管理、評價等綜合應用的資料管理、資料操作及視覺化展示的一體化平臺,為油氣藏研究與決策人員提供全方位的資料處理與可靠決策,極大地提升了油氣藏的研究效率和決策質量。

  關鍵詞:數字化油氣藏;研究與決策;資料探勘

  油氣藏研究包含了從地質勘查到石油產品終端使用者的複雜工藝流程,傳統的油氣藏研究方法存在工作效率低、準確性不高、過度依賴人工經驗等問題。決策者需要從海量的資料中找出有用的關鍵資訊;論證現場中研究人員攜帶和使用的各類圖件無法充分展示其研究成果,也不能在論證現場短時間內消化大量資料並做出正確的決策,更不能使資訊資源的共享和成果的互動上得到充分實現。資訊落後的資訊處理方法與單一的研究手段不但花費大量的精力與時間,更是造成大量寶貴的研究成果無法應用與共享。近年資訊科技的快速發展,催生了數字化油藏,促進了數字油田的發展產,資料探勘等資訊科技與油氣勘探開發資料資源的融合不斷加深,能夠提供更智慧化的資料分析功能,更好地支援油氣藏勘探開發決策,開創了一種全新的油氣藏研究工作模式,降低了決策風險,提升開發決策水平。長慶油田針對具有數量龐大的、結構不完整的、內容不清晰且含有干擾資訊的油氣藏研究工作資料,開發了包括特徵提取、規則劃分分類分析、關聯規則挖掘、聚類分析、模式分析及生成趨勢分析等[1-2]系列資料探勘技術,從中提取出包含在內部的、不被人們知曉的、卻又含有有用的、重要的資訊和知識[3-4],為長慶油田的高效開發、快速發展提供了有效的資料資訊支援。

  一、油氣藏研究與決策支援系統

  透過借鑑國內外著名油氣公司在油氣勘探計算機軟體研發方面的經驗[5-6],依託長慶油田豐富的資料資源,利用先進的軟體研發技術,長慶油田研發出了一套數字化油氣藏研究(RDMS)系統。它以油氣藏研究為主線,業務驅動,資料鏈為手段,由協同工作平臺、資料整合平臺、資料視覺化平臺等組成的一體化多學科協同工作環境。數字化油氣藏研究系統從功能架構上可劃分為資料服務、基礎工作、協同研究、決策支援和雲軟體五大平臺。基礎工作平臺是以油氣藏資料鏈技術為基礎建立的系統底層框架,為各應用場景的協同工作提供基礎環境;協同研究平臺面向科研人員,透過對不同業務崗位定製不同工作場景和工作內容,為研究人員提供便捷的資料組織、共享和知識應用平臺;決策支援平臺面向技術主管和普通技術人員,為一體化技術交流及方案決策提供環境,並實現遠端異地協同決策;雲軟體平臺基於虛擬儲存技術將勘探開發主流軟體統一部署在雲中心伺服器,實現專業軟體介面統一升級、許可動態排程和集中維護管理。目前,基礎工作平臺、研究工作平臺(29個研究主題)和決策支援平臺(16個決策主題)已基本開發完成,在勘探開發研究院、油氣工藝研究院、採油(氣)廠已推廣執行。圖1展示了數字化油氣藏研究與決策支援系統功能模組的細分情況。

  二、數字化油氣藏的資料探勘技術

  長慶油田建設的數字化油氣藏研究與決策支援系統,為油田生產的勘探部署、產能建設等決策提供輔助。在決策支援系統的建設中採用了資料探勘技術,在資料分類的'過程中使用了神經網路技術,在資料關聯過程中使用了決策樹方法,在預測過程中使用了迴歸分析和貝葉斯網路。由勘探井的資料結合模型庫系統和資料倉庫系統,為井位部署、產能預測、生產方法等決策提供支援。在圖2的結構中有一個模型庫系統,它由模型庫、方法庫、資料庫、格式庫、衍生資料庫及其管理系統組成。該系統可被抽象為六元結構,即S={ModelD,methodD,FormD,ParaD,D,DeriveD}。其中,ModelD={model1,model2,…,modeln},它是模型庫,用於整合各種模型。模型庫為整個系統提供支撐。它有包含模型庫管理子系統(MDBMS)對模型庫進行統一的管理,具有對模型定義、建立、儲存、查詢等功能。模型庫是系統的核心結構。用於油氣藏研究的各種資料庫在模型庫中統一管理、呼叫;MethodD={method1,method2,…,methodn},它是方法庫,整合各模型計算的引數獲取方法。方法庫系統為系統提供演算法模型支撐,它包含方法庫管理子系統(ADBMS)對方法庫進行統一的管理;FormD為資料格式庫,定義了每個資料的資料型別,資料格式;ParaD為引數庫,用於存放各種油氣藏分析程式運轉的各種引數;D為資料庫,用於存放計算數學模型所需的各種資料;DevriveD為衍生資料庫,存放油氣藏研究過程中產生的新資料。

  三、油氣藏資料探勘技術的實現

  1.建立資料倉庫建立資料倉庫是實現資料探勘的基礎。本系統中使用的是原型法,快速的實現資料倉,並根據反饋資訊修改油氣藏決策步驟中不合理的需求分析和主題情況,為後面的決策工作提供技術基礎和經驗積累。本系統主題是油田勘探井位佈置位置、測井實時資料、產能分析、儲量管理等主題。在對油氣藏決策系統進行分析之後,根據油氣藏決策系統中包含的油氣藏資料、決策內容進行邏輯分類。針對各個的分析主題,在油氣藏資料倉庫中建立關係表,用來描述與決策結果相關的各種資訊,關係表主要從油氣藏系統資料庫中的流程表中提取資料,包括地質圖、地理圖、地震資料等。在資料倉庫的建設過程中,對油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類開發生產單元、井等勘探開發圖形物件的轉換、載入入庫,建立完成地質資訊庫。

  2.油氣藏研究工作資料抽象和總結技術資料總結的最終結果是對油氣藏研究資料進行抽象模型化,給出油氣藏研究決策工作流程的總體綜合描述。透過對油氣藏資料的歸納抽象,資料探勘方法能夠將資料庫中的所有資料從較低的個體層次抽象總結到較高的總體層次上,從而實現對原始基本資料的總體把握。在本系統中使用的資料總結方法是目前最為成熟的數學方法,也就是利用數學方法計算出資料庫的各個資料項的統計學特徵,如總和、方差、最大值、平均、最小值等;或者透過利用數學中的統計圖形工具,對資料製作統計圖形,如直方圖、餅狀圖等。長慶油田的數字化油氣藏研究系統中利用了OLAP技術實現對油田井位的地質圖、地理圖、地震資料的多維查詢,分析了多種資料的統計特徵,同時用多個統計圖形描述了資料間的聯絡。最後對多個數據進行歸納,提取統計資訊。

  3.資料分類資料探勘中的分類是建立需要的分類函式或分類模型。透過這個分類模型可以將資料劃分到不同的組中。它的實現步驟一般是:首先分析工作資料的各種特徵,並找出或者建立出工作資料的屬性模型,確定資料的歸屬組別,然後利用這些模型來分析工作資料,最後預測後面的工作資料可能會屬的分組。分類應用的例項很多,本系統的採油井中,將油田井位出油量分為好、一般和較差三種類型,以此分析這三種類型井位的各種屬性,特別是位置、地質等屬性,並決定它們分類的關鍵屬性及相互間關係。此後就可以根據這些關鍵屬性對每一個預期的井位進行分析,以便決定預期井位屬於哪一種型別。

  4.關聯分析原始資料庫中各個工作資料都存在相互關聯、相互影響的聯絡。兩個或多個工作資料的取值之間存在某種邏輯聯絡。這種關聯關係主要有簡單關聯和時間關聯兩種。比如油田井位中的地質環境、地震資料和出油量存在關聯。關聯分析的目的是找出工作資料中隱藏的關聯網,描述眾多資料專案的密切度或關聯關係。由於事先往往並不知道工作資料的關聯是否存在,或者是否可以用精確的關聯函式描述。因此,關聯分析生成的規則通常都帶有置信度,置信度級別描述了關聯規則的強度。

  5.聚類與分析油藏工作資料往往缺少比較詳細的描述資訊,甚至是無法組織成任何分類模式時,通常可以採用聚類分析。透過聚類分析,按照約定的相近程度度量方法或者其他的標準,將工作資料分成許多有意義的子集合;每一個集合中的資料特徵相近甚至相同,不同資料集合之間的資料性質差異較大,容易區分。長慶油田的數字化油氣藏研究在實現過程中,使用了Fayyad過程模型,如圖3所示。在資料探勘的過程中,系統執行一個迴圈迭代過程。在每一步的執行中,從油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類開發生產單元等資料中,分析出勘探井位的位置資訊,如果發現某個階段產生的結果和預想的內容有出入。則重複前面階段步驟。

  四、結束語

  長慶油田針對油氣藏研究資料量大、資訊隱晦的技術現狀,建立了油氣藏研究與決策支援系統[7-10],並在其中開發和應用了系列資料探勘技術,取得了較大進展:

  (1)與眾多學科及技術相融合,形成了包括人工智慧、統計學、資料倉庫、線上分析處理、專家系統、資料視覺化、高效能計算等資料探勘技術,將原始資料庫轉化為有用的研究知識,為油氣藏決策了有力支援。

  (2)海量資料及其挖掘技術的開發為油氣藏研究與決策支援系統的高效應用打下了基礎,極大地提高了油氣藏的研究與決策水平,為長慶油田快速發展提供了強有力的技術支援。

  參考文獻

  [1]郭萌,王珏.資料探勘與資料庫知識發現:綜述[J].模式識別與人工智慧,1998,11(03):292-299.

  [2]胡侃,夏紹瑋.基於大型資料倉庫的資料採掘:研究綜述[J].軟體學報,1998(01):54-64.

  [3]GrossmanR,KasifS,MooreR,etal.Dataminingresearch:Op—portunitiesandchallenges[C].AreportofthreeNSFworkshopsonmininglarge,massive,anddistributeddata,1999.

  [4]Deogu*JS,RaghavanVV,SarkarA,etal.Datamining:Re—searchtrends,challenges,andapplications[J].RoughsSetsandDataMining:AnalysisofImpreciseData,1997:9-45.

  [5]王宏琳.油氣勘探計算機軟體:平臺體系結構框架[J].石油工業計算機應用,2004(02):3-8.

  [6](美)HohmannL著.藍莉,曾永和譯.超越軟體架構建立和維護優秀解決方案[M].北京:中國電力出版社,2005.

  [7]石玉江.數字油田中的勘探井位快速部署技術[J].石油工業計算機應用,2016(12):11-16.

  [8]王娟.數字油氣藏資料中心建設的關鍵技術[J].石油工業計算機應用,2016(1):16-18.

  [9]付金華,石玉江,王娟,等.長慶油田勘探開發服務型共享資料中心構建研究[J].中國石油勘探,2017,22(6):1-8.

  [10]王娟,姚衛華,石玉江,等.基於雲架構的油氣藏資料智慧管理技術[J].天然氣工業,2014,34(3):137-141.

最近訪問