圖片檢索技術論文

  影象檢索是網路資訊檢索中的重要的組成部分,小編整理了,歡迎閱讀!

  篇一

  Web影象檢索技術綜述

  【摘 要】多媒體技術的迅速發展,促進了Web影象檢索技術的創新和發展。針對目前的發展狀況,本文對Web影象檢索技術做了深入的分析和研究,包括基於文字檢索、基於內容檢索、語義檢索以及個性化Web影象檢索,並詳細介紹了這4種流行影象檢索技術的技術特點,最後指出了Web影象檢索技術的發展趨勢和研究方向。

  【關鍵詞】基於文字影象檢索 基於內容的影象檢索 基於語義檢索 個性化Web影象檢索

  一、引言

  目前,Web影象檢索技術和模型層出不窮,可大致分為基於文字的檢索、基於內容的檢索、語義影象檢索和個性化的Web影象檢索四種。下面分別對其進行介紹。

  二、基於文字的影象檢索

  20世紀70年代,基於文字的影象檢索技術TBIR得以發展。目前,該技術發展較為成熟,但需要較多人工參與,耗費大量的人力和時間,而且不同的人對同一張影象的理解也不相同,這就導致對Web影象標註沒有統一標準,因而檢索的結果不能很好地符合使用者的需求[1]。同時在網際網路環境中,Web影象資料不斷動態更新,採用人工方式對影象進行廣泛標註也無法實現。

  三、基於內容的影象檢索

  上世紀90年代,基於內容的影象檢索CBIR技術產生。它主要採用影象的視覺特徵來表示影象的內容,然後通過特徵匹配演算法進行影象檢索。

  一影象特徵提取

  影象的特徵主要包括底層特徵和語義特徵。目前的CBIR系統主要使用影象底層特徵來檢索影象。底層特徵主要包括影象的顏色、紋理、形狀等定量特徵。目前,顏色特徵主要有顏色直方圖、顏色矩和顏色相關圖等。紋理特徵有Gabor變換、塔式小波變換、灰度共生矩陣等。而形狀特徵表示主要有基於邊界表示法和基於區域表示法。此外,近些年許多學者也研究了基於文字和視覺兩種資訊在內的Web影象檢索,如文獻[2]中提出一種融合文字關鍵詞和影象視覺內容的Web影象檢索方法,在一定程度上提高了Web影象檢索質量。

  二影象相似性匹配

  影象檢索的匹配策略大致分為完全匹配和相似性匹配。完全匹配是指兩張影象的特徵完全相同時影象匹配成功;而相似性匹配是指兩張影象特徵間的距離在某一閾值內匹配成功。在基於內容的影象檢索中,影象底層視覺特徵對比的相似性檢索匹配佔據著主導地位。

  四、基於語義的影象檢索

  底層的視覺特徵不能代表影象豐富的內涵,使得基於內容的影象檢索效果並不理想。因此,出現了基於影象語義的檢索技術,主要包括語義層次模型、語義的提取方法和語義表示方法三方面內容。

  一語義層次模型

  影象語義是有粒度的,即具有層次性,所以可採用多層結構對影象語義進行分析。

  一般,根據影象內容可將影象分為特徵語義、物件和空間關係語義、高層語義3個層次。特徵語義利用影象的視覺特徵及其組合進行檢索。物件與空間關係語義,是分析影象中物件的視覺特徵、空間關係、位置等資訊,得到影象的語義描述。高層語義涉及到影象的場景語義、行為語義和情感語義,該層語義是根據人的知識理解而來,主觀性較強,提取工作較複雜。

  二語義提取方法

  影象語義的提取是由底層特徵向高層語義對映的過程,但現今的技術水平,直接根據底層的視覺特徵推理出影象高層語義很困難,目前主要方法有基於知識語義提取、基於人工互動語義提取和外部資訊的語義提取。

  三語義表示方法

  語義表示方法主要有文字表示法和基於人工智慧知識表示法。文字表示法是用文字對影象或影象區域進行解釋。基於人工智慧的知識表示方法,如語義網路、數理邏輯等,該方法能夠表達較為複雜的關係,具備較強的模糊匹配能力,但目前通用性的知識表示模型尚不存在。

  五、個性化Web影象檢索

  隨著多媒體技術的飛速發展,影象的數量急劇增加,為了得到更準確的符合個人需求的檢索結果,個性化Web影象檢索成為研究熱點。個性化的實質是針對不同使用者採用不同策略來提供不同的服務內容。個性化影象檢索則是根據使用者對檢索結果的反饋主動學習和記錄使用者的興趣資訊,推測出使用者的興趣需求。使用者興趣模型User Preference Profile是個性化影象檢索的核心,它用於儲存和管理使用者興趣資訊,通過收集使用者的反饋資訊,建立初始使用者興趣模型,經過長期地學習,不斷更新使用者興趣模型,最終可以得到使用者的興趣傾向,針對不同使用者提供個性化服務。

  由於獲取使用者興趣面臨低層特徵和高層語義之間的“語義鴻溝”問題,一些學者作了研究,如HE等人[3]提出了一種應用於個性化影象檢索的使用者興趣模型的構建方法,以彌補語義鴻溝。QIU等 [4]提出基於使用者多媒體資料管理模型的個性化影象檢索,建立使用者多媒體資料管理模型為使用者提供個性化影象檢索。文獻[5]為了在個性化搜尋過程中能夠準確地挖掘到使用者的潛在興趣並進行相應的聚類分析,提出採用潛語義空間的Zipf分佈的特性,並結合PLSA概率潛在語義分析來獲取全文的語義。

  六、總結和展望

  影象檢索從基於文字的檢索發展到語義檢索,經歷了簡單到複雜、低階到高階的過程。基於影象語義檢索,充分利用了影象的語義資訊,提高了影象檢索的速度和質量,應用前景廣泛,但仍存在如何改進語義提取方法以及語義描述方式等難題。目前,個性化Web影象檢索成為主要研究熱點,但如何更好地解決語義鴻溝,建立和改善使用者興趣模型成為一個值得深入研究的問題。

  參考文獻:

  [1]魯珂,趙繼東,曾家智.一種適合Web影象檢索的影象降維演算法研究.電腦科學.2006,335:255~260

  [2]黃鵬,陳純,王燦,卜佳俊,陳偉,仇光.使用加權影象標註改進Web影象檢索.浙江大學學報工學版.2009,4312:2129~2135

  [3]賀琳,張菁,沈蘭蓀.個性化影象檢索中使用者興趣模型的構建方法.計算機工程與應用.2009,4531:168~171

  [4]邱兆文,張田文.基於使用者多媒體資料管理模型的個性化影象檢索.電子學報.2008,369:1749~1749

  [5]陳冬玲,王大齡,於戈,於芳.基於PLAS方法的使用者興趣聚類.東北大學學報自然科學版.2008,291:53~56

點選下頁還有更多>>>