公司:深圳市創寶來科技有限公司
聯系人:蘇先生
聯系方式:18923859947QQ:3005367043
公司網址:www.szcblic.com
專做進口原裝,誠信經營,大量現貨庫存,歡迎您隨時咨詢
決定機器視覺的兩大要素 國內外視覺芯片市場及發展前景
機器視覺之于人工智能等同于視覺之于人類,本文系統介紹決定機器視覺的兩大要素——視覺算法和芯片,重點介紹國內外視覺芯片市場及發展前景,包括重量級玩家及其產品。
機器能否比人眼看得更清楚?近年來,隨著CV (Computer Vision) 芯片產品不斷推出,這一疑惑正在慢慢變成現實。就如AlphaGo戰勝“圍棋天才”柯潔一樣,在某些應用場景,機器視覺因其準確性、客觀性、穩定性,比人類生理視覺更具優勢。
在我們通常的印象中,一個視力正常的人可以迅速且毫不費力地感知世界,甚至可以詳細生動得感知整個視覺場景;但其實這只是一個錯覺,人類生理視覺有著天然的局限,只有投射到眼球中心視覺場景的中間部分,我們才能詳細而色彩鮮明地看清楚。比起人眼來,CV其實具備了相當多的優勢(詳見表一),可以清楚的看到,CV的視力已經遠不止5.0了!
表一:機器視覺相對人眼的優勢
機器視覺的視力為何如此之強?關鍵在于芯片,核心是將一些特定圖像算法用芯片方式實現,同時融入了深度學習和神經網絡算法。
機器視覺原理——圖像處理和算法機器視覺或稱計算機視覺是用一個可以代替人眼的光學裝置和傳感器來對客觀世界三維場景進行感知,即獲取物體的數字圖像,利用計算機或者芯片,結合專門應用軟件來模擬人腦的判斷準則而對所獲取的數字圖像進行測量和判斷。該技術已廣泛用于實際的測量、控制和檢測中,隨著芯片技術發展,在人工智能各個領域應用也逐步展開。
圖一:機器視覺代替人眼抽象圖
一個典型的工業機器視覺系統包括:光源、鏡頭、相機 (包括CCD相機和COMS相機)、圖像處理單元 (或機器視覺芯片)、圖像處理軟件、監視器、通訊、輸入輸出單元等。系統可再分為主端電腦、影像采集與影像處理器、影像攝影機、CCTV鏡頭、顯微鏡頭、照明設備、Halogen光源、LED光源、高周波螢光燈源、閃光燈源、其他特殊光源、影像顯示器、LCD、機構及控制系統、控制器、精密桌臺、伺服運動機臺。
可見,從應用技術劃分,機器視覺是一門綜合了模擬、數字電子、計算機、圖像處理、傳感器、機械工程、光源照明、光學成像等跨學科的前沿技術;從應用學科劃分,機器視覺是一門涉及人工智能、神經生物學、心理物理學、計算機科學、圖像處理、模式識別等多個領域的交叉學科。
機器視覺技術的發展,歸功于計算機軟件技術使現有大規模集成電子電路技術發展的成果達到了極大化的利用,尤其是多媒體和數字圖像處理及分析理論方面的技術成熟,使得機器視覺技術不僅在理論,而且在應用上都得到了高速發展。
機器視覺之于人工智能的意義等同于視覺之于人類的意義,而決定著機器視覺的就是圖像處理技術。不同的應用領域需要不同的圖像處理算法來實現機器視覺。常用的機器視覺領域圖像算法有運動目標檢測算法、基于深度學習的人臉算法等。
下面介紹下機器視覺中的運動目標檢測圖像算法,該方法是運動物體識別和跟蹤的基礎。移動物體的檢測依據視頻圖像中背景環境地不同可以分為靜態背景檢測和動態背景檢測。由于篇幅有限,我們這里只介紹靜態背景檢測算法。常見的靜態背景目標的檢測算法包括幀間差分法、背景減除法、光流法等。這些背景不變算法的優缺點描述如下表二。
在上述檢測算法中,幀間差分法和背景減除法更加適用于如視頻監控、智能交通系統等圖像背景靜止的環境中。光流法則更加適用于背景不斷變化的動態環境中。下面我們來介紹以上三種常用算法的基本原理。
表二 各種機器視覺物體運動檢測算法比較
幀間差分法的適應環境能力強、計算量小、且穩定性好,是目前應用廣泛的一類運動檢測方法。其原理是將相幀或者三幀序列圖像像素點的對應灰度值進行相減,如果灰度差值大于閾值則說明此處物體發生了變化,它是運動的;如果像素的灰度差值小于給定閾值說明此處物體沒有發生變化,認為它是靜止的。將像素灰度值發生變化的部分標記出來,這些被標記的點就組成了運動目標區域。進一步對灰度圖像進行二值化分析,提取目標運動信息,區分出前景和背景圖像,進而分割出運動目標。
背景減除法其實是一種特別的幀間差分法,背景減除法根據將當前幀圖像與背景模型做差來實現對運動目標的檢測。這種方法首先獲取背景模型,并將其保存起來,當對某一幀圖像進行檢測時,用實時獲取的幀圖像與背景模型做差分運算,得到要檢測的運動目標。
光流法是當運動目標在監控場景中產生運動的時候,物體表面會形成位移矢量場,根據其變化可以得到運動目標。光流是指移動物體在其對應的灰度圖像上的表面運動,在光流場中,運動目標的速度矢量形成的平面投影構成了目標的運動信息。運動目標在投影上形成的速度矢量是比較均勻,運動目標速度不同形成的速度矢量也不相同,通過光流的計算結果就可以區分出速度不同的運動目標。
圖像處理算法一開始應用應該是采用服務器的軟件算法來完成,隨著互聯網技術的不斷成熟,會擴展到云端計算來完成,但是這樣對于網絡帶寬要求非常大,對于云服務器的計量量要求也非常高。筆者估計,視頻圖像處理技術算法的大規模產業化應用,必然是需要專業的芯片來完成,該芯片就是機器視覺 (CV) 芯片。芯片方式一定是能夠降低成本,同時提高運算能力。從近年的整個行業情況來看,計算機視覺作為人工智能領域最重要的方向之一,由于機器視覺芯片誕生和深度學習算法不斷發展,近幾年獲得了巨大的發展,各項應用在不同的行業里開始落地生根。