基于核矢量過濾的視頻檢索算法
發布時間:2008/5/26 0:00:00 訪問次數:549
    
    
    來源:電子技術應用 作者:華中科技大學 肖國強 羅國兵
    
    摘要:視頻檢索是高維空間中的計算。針對高維計算量大的特點,提出了構造一個核矢量的算法,將高雛空間轉換到低維空間,在低維空間逐維過濾不相似的數據集,縮小檢索范圍,提高檢索速度。
    
    關鍵詞:核矢量子域過濾候選集
    
    為了有效地從視頻媒體庫中找到所需的信息,必須對視頻信息進行有效的組織、索引,以提供快捷、方便的視覺檢索。視頻內容既包含與視頻內容直接相關的視覺信息數據,也包括與視頻不直接相關的數據(即內容無關的元數據),如格式、作者名、日期和所有權等。其中,與視頻內容直接相關的數據又分為兩類:(1)內容相關的元數據,即與感覺因素相關的低層或中層特征的數據.如顏色、紋理、形狀、空間聯系和運動等;(2)描述與視覺信息所表示的含義相關的高層語義的內容描述元數據,即描述圖像實體與客觀實體的關系,如視覺符號和場景的時間、事件、感受和意圖。
    由于與內容無關的數據不能有效地描述視頻,而高層語義信息在直接理解上存在困難,因此目前主要利用視頻內容的各種低、中層特征,或利用經過人工描述后量化的高層語義特征以及它們的組合構造描述視頻的特征矢量。這樣形成的特征矢量是高維矢量。在高維空間如何有效地建立索引,快速響應用戶的檢索要求是問題的關鍵。
    通常視頻檢索采用順序掃描算法ssa(sequent scanalgorithm),但是當媒體庫不斷擴大時,影響了此算法的檢索效率。因此常用樹結構來構造高維索引,包括η參數優化樹即η-樹(η parameter optimal tree),高度平衡r-樹(height-balanced tree)及其變種。分析表明,這些索引樹結構在低維矢量空間是有效的,而當矢量空間超過一定的維數時,這些索引樹結構比簡單的順序掃描還要差。
    本文提出一種示例視頻檢索的方法,首先根據每一類特征生成一個質心量,將多個質心量組合成一個核矢量,然后將模式集按核矢量的每一維過濾,生成一個較小候選集,在候選集內用ssa算法查找示例視頻的相似近鄰。
    
    1 特征的提取
    建立索引結構首先要抽取特征,構造模式集,每一個模式由一個特征矢量描述。
    
    1.1 中低層特征的選取
    在算法的實驗系統中選擇了顏色、紋理、形狀等特征。顏色特征采用36色非均勻量化算法的hsv顏色模型。hsv模型能較好地反映人對色彩的感知和鑒別能力,比較適合基于色彩的相似比較。紋理特征采用粗糙度、對比度和方向性這三個值組成的分量來表示。形狀特征主要通過矩來描述,計算速度快,比圖像分割方法的魯棒性好。
    
    1.2 其他特征
    系統還可以進行擴展,如加入運動特征(同組人員正在尋求相關算法)及物體之間的空間關系。此外,還可以采用注釋的形式形成高層語義特征,然后量化到系統中。
    
    2 檢索算法
    2.1 生成核矢量
    生成核矢量的主要步驟描述如下。
    
    
    
    2.2 生成算法的索引數據結構
    算法的主要思想可以描述如下。
    設模式集s中含有n個矢量,記為s={s1,s2,……sn},模式si在f上的投影記為{sif1,sif2,……sifn}。
    將模式集在每個投影分量上劃分成若干子域,并作如下定義:
    θmax為每個子域中允許的最大模式數。若某子域元素數多于此值,則分裂子域;θmin為每個子域中允許的最小模式數,若某子域元素數低于此值,合并相鄰子域;fimin為模式集在fi上的最小值;fimax為模式集在fi上的最大值;ki為模式集在fi上劃分的子域數;nif1為模式集在fi上投影的第i個子域的元素數。
    對模式集中的每個投影分量,尋找一組滿足如下關系的值:
    
    
    算法實質上相當于把模式集按其在核矢量的每個投影分量進行過濾,除去一些與示例矢量不在同一
    
    
    來源:電子技術應用 作者:華中科技大學 肖國強 羅國兵
    
    摘要:視頻檢索是高維空間中的計算。針對高維計算量大的特點,提出了構造一個核矢量的算法,將高雛空間轉換到低維空間,在低維空間逐維過濾不相似的數據集,縮小檢索范圍,提高檢索速度。
    
    關鍵詞:核矢量子域過濾候選集
    
    為了有效地從視頻媒體庫中找到所需的信息,必須對視頻信息進行有效的組織、索引,以提供快捷、方便的視覺檢索。視頻內容既包含與視頻內容直接相關的視覺信息數據,也包括與視頻不直接相關的數據(即內容無關的元數據),如格式、作者名、日期和所有權等。其中,與視頻內容直接相關的數據又分為兩類:(1)內容相關的元數據,即與感覺因素相關的低層或中層特征的數據.如顏色、紋理、形狀、空間聯系和運動等;(2)描述與視覺信息所表示的含義相關的高層語義的內容描述元數據,即描述圖像實體與客觀實體的關系,如視覺符號和場景的時間、事件、感受和意圖。
    由于與內容無關的數據不能有效地描述視頻,而高層語義信息在直接理解上存在困難,因此目前主要利用視頻內容的各種低、中層特征,或利用經過人工描述后量化的高層語義特征以及它們的組合構造描述視頻的特征矢量。這樣形成的特征矢量是高維矢量。在高維空間如何有效地建立索引,快速響應用戶的檢索要求是問題的關鍵。
    通常視頻檢索采用順序掃描算法ssa(sequent scanalgorithm),但是當媒體庫不斷擴大時,影響了此算法的檢索效率。因此常用樹結構來構造高維索引,包括η參數優化樹即η-樹(η parameter optimal tree),高度平衡r-樹(height-balanced tree)及其變種。分析表明,這些索引樹結構在低維矢量空間是有效的,而當矢量空間超過一定的維數時,這些索引樹結構比簡單的順序掃描還要差。
    本文提出一種示例視頻檢索的方法,首先根據每一類特征生成一個質心量,將多個質心量組合成一個核矢量,然后將模式集按核矢量的每一維過濾,生成一個較小候選集,在候選集內用ssa算法查找示例視頻的相似近鄰。
    
    1 特征的提取
    建立索引結構首先要抽取特征,構造模式集,每一個模式由一個特征矢量描述。
    
    1.1 中低層特征的選取
    在算法的實驗系統中選擇了顏色、紋理、形狀等特征。顏色特征采用36色非均勻量化算法的hsv顏色模型。hsv模型能較好地反映人對色彩的感知和鑒別能力,比較適合基于色彩的相似比較。紋理特征采用粗糙度、對比度和方向性這三個值組成的分量來表示。形狀特征主要通過矩來描述,計算速度快,比圖像分割方法的魯棒性好。
    
    1.2 其他特征
    系統還可以進行擴展,如加入運動特征(同組人員正在尋求相關算法)及物體之間的空間關系。此外,還可以采用注釋的形式形成高層語義特征,然后量化到系統中。
    
    2 檢索算法
    2.1 生成核矢量
    生成核矢量的主要步驟描述如下。
    
    
    
    2.2 生成算法的索引數據結構
    算法的主要思想可以描述如下。
    設模式集s中含有n個矢量,記為s={s1,s2,……sn},模式si在f上的投影記為{sif1,sif2,……sifn}。
    將模式集在每個投影分量上劃分成若干子域,并作如下定義:
    θmax為每個子域中允許的最大模式數。若某子域元素數多于此值,則分裂子域;θmin為每個子域中允許的最小模式數,若某子域元素數低于此值,合并相鄰子域;fimin為模式集在fi上的最小值;fimax為模式集在fi上的最大值;ki為模式集在fi上劃分的子域數;nif1為模式集在fi上投影的第i個子域的元素數。
    對模式集中的每個投影分量,尋找一組滿足如下關系的值:
    
    
    算法實質上相當于把模式集按其在核矢量的每個投影分量進行過濾,除去一些與示例矢量不在同一
上一篇:D類放大器的發展趨勢