人工智能從0到1的發展狀態
發布時間:2015/12/14 10:19:29 訪問次數:309
過去和未來那些可能的里程碑
- 51電子網公益庫存:
- CTM1051L
- CTM8251AT
- CTM8251D
- CTM8251T
- CAT1021WI-25-GT3
- CAT1021WI-28-GT3
- CAT1021WI-30-GT3
- CAT1021WI-42-GT3
- CAT1021WI-45-GT3
- CAT1022WI-25-GT3
- CAT1022WI-28-GT3
- CAT1022WI-30-GT3
《超級智能:路線圖、危險性與應對策略》這書里提到一件有意思的事情:
20世紀50年代后期的一些專家認為:如果能造出成功的下棋機器,那么就一定能夠找到人類智能的本質所在。但結果通常是:這種機器一旦被造出來之后,人們就不稱其為人工智能了。隨后作者列出了人工智能發展史上一些里程碑性的事情(有刪節)。
1.西洋跳棋--超越人類,1952年,阿瑟?塞繆爾寫過一個跳棋程序,并在1955年吸收了機器學習技術,從而改良了該程序。這是第一個玩起游戲來比程序編寫者都好的程序。1994年,跳棋程序“奇努克”(chinook)打敗了人類衛冕冠軍,這是機器程序第一次在競技游戲中贏得官方世界冠軍。2002年喬納森?謝弗和他的小組“解決號”跳棋程序總是計算出最好的棋步,最終打了個平局。
2.黑白棋--超越人類,1997年,logistello程序跟當時的世界冠軍村上健的對戰結果是6戰6勝。
3.國際象棋--超越人類,1997年,深藍計算機打敗了當時的國際象棋世界冠軍加里?卡斯帕羅夫。卡斯帕羅夫承認見識到了人工智能在某些棋步上具備真正的智能以及創造力。從那時起,國際象棋程序就一直不斷進步。
4.橋牌--高手水平,2005年,訂約橋牌軟件就已經能夠同最好的橋牌高手對弈。
5.《危險邊緣》益智問答--超越人類,2010年ibm的沃森超級計算機在《危險邊緣》游戲中擊敗了了肯?詹寧斯和布萊德?拉特這兩名擂主冠軍。《危險邊緣》是以提問有關歷史、文學、運動、地理、流行音樂、流行文化、科學以及其他領域細節問題而著稱的電視益智節目。《危險邊緣》游戲的題目一般都需要猜字謎的方式來發現線索。
6.撲克--發揮不穩,電腦玩家在玩德州撲克時還沒能超越人類玩家,但是在一些類似的撲克游戲中卻超越了人類水平。
7.圍棋--很高的業余水平,2012年,zen系列圍棋程序能夠達到6段水平,這個程序主要運用了蒙特卡洛樹搜索法和機器學習技術。圍棋程序此后每年提升一段的速度向前發展。照這個速度看,圍棋程序可能在未來10年內擊敗人類世界冠軍。
這意味著從游戲的視角看,除了圍棋人工智能基本已經超越或者達到了人類的水平。這里更有意思的事情是,如果把這張表延伸到未來,領域也不局限在游戲,那究竟那些事情值得記錄在上面。按照我的推斷這種里程牌會是下面這個樣子:
1.自動駕駛--徹底的自動駕駛很可能在10年左右的時間里實現。根據報道到2015年為止,google的自動駕駛汽車已經安全行駛了百萬英里。各方預測在這樣的基礎上,再有5~10年自動駕駛應該可以獲得普遍應用,我們采用保守的數值。自動駕駛之所以必須被放到里程碑里是因為從智能的角度看人類日常的工作生活中比駕駛更復雜的事情其實不多,如果可以搞定駕駛,那理論上第一產業、第二產業甚至第三產業中的簡單工作都是可以通過人工智能搞定的。第三產業中的簡單工作是說類似餐飲、運輸行業中的各種工作。在那個時間點上,我們就可以更清楚的看到第一產業、第二產業中幾乎沒人的景象,雖然即使是今天這在局部也已經逐漸成為現實。
2.沃森類系統在醫療行業全面展開--ibm已經在做這件事情,所以這里的關鍵點不在于采用不采用,而在于什么時間點沃森這樣的系統可以成為醫療中必須的一個環節。這個點之所以有意義在于,沃森的全面展開意味著醫院里所有和數據相關的工作被人工智能接管。這個時間點之所以有意義在于它意味著人工智能成為真正的專家系統,隨后(或者同時)它就可以擴展到法律、管理、財務等領域。從沃森獲得危險邊緣冠軍這事來看,這件事的瓶頸很可能不在于技術,而在于接受程度。如果拿數據庫被接受的速度做類比,那這產品也可能在5~10年內走到各家醫院里去。
3.人人工智能成為所有金融公司的標準工具--這點可以更形象點的表述成類似palantir的服務滲透到所有金融公司。這意味著非行業的可數據化的各種工作已經可以在人與人工智能的配合下完成。只要能搞定金融,那就可以搞定幾乎所有其它企業。這事情已經有很多公司再做,并且已經有很大的規模,所以也可能在5~10年內達成。
4.類人機器人出現--很像電影《我,機器人里面》描述的那種正常的機器人,這種機器人沒有自我意識,但有足夠的智能和行動力可以完成所有所有人類需要完成的工作,甚至可以包括戰爭。如果說1~3主要消滅的是低端的以及和數據深度相關的工作,那這類機器人幾乎可以消滅所有的工作。人類到此理論上可以得到解脫。這個項目上差的比較遠,如果認為前幾項可以在10年內實現,那這項應該會在它們后面。至于后面多久確實難以推斷,但這種機器人是一定可以實現的,雖然我們不太確定是20年后,還是30年后,但它的技術脈絡與前三者一脈相承,所以說是一定可以實現的。
人工智能上的從0到1
很多人可能難以相信,但上面那些看著已經波瀾壯闊的里程碑其實只是人工智能從0到1過程中的產物。
很多技術的發展都要經歷從0到1,再從1到100的過程。比如說福特造出第一輛t型車可以認為是汽車從0到1的過程,此后100年直到現在可以認為是汽車從1到100的過程。此后的汽車雖然也有發動機、傳動系統和四個輪子,但其精密程度要遠高于當年的版本。計算機一樣有這過程,如前所述,其理論奠基于圖靈,圖靈之后馮?諾依曼真的設計了一套體系結構把這東西做出來了,到馮?諾依曼為止可以認為計算機走完了自己從0到1的過程。此后才有從電子管計算機到晶體管計算機,再到大規模集成電路使用后的計算機,其形態也就由比房子還打到現在手機那么大,但幾乎無所不能。
如果拿人工智能與上述兩者相類比,我們可以發現人工智能根本還沒走完從0到1的過程。人工智能既沒有清楚的理論基礎,大家也不知道智能究竟是什么,所以才有先達到某個目標,比如在下棋上戰勝人類,接下來就認為這也不算什么智能的情形出現。人工智能的內在發展思路也多次發生變遷,比如最開始人們認為這種智能依賴于一種物理符號系統,這種系統要通過處理符號組成的數據結構來起作用。人類似乎是這樣,但這顯然只是一種現象,在這層面上并不能產生真的智能。接下來也考慮過遺傳算法,這是按照生物進化的過程來做程序,讓程序有某種隨機變化,并用一個選擇過程(生物的優勝劣汰)來保持似乎有用的變化,但限于各種“如果怎樣,否則怎樣”的這種組合太多,在當時這也沒產生什么有價值結果。
再后來至少一部分人開始轉向神經網絡,這方向出現的很早在20世紀60年代就出現了,但那時是非主流,直到20世紀80年代才收到重視,jeffhawkings認為這和人工智能節節敗退有關。神經網絡研究者嘗試在連接中查找智能,因為大腦由神經元組成,這是顯然的事實。近來極其火熱的深度學習就在這方向上,但這方向也還沒完成從0到1的過程。只是在特定的領域取得了極為令人矚目的成績比如語音識別、圖像識別。這領域的大牛yannlecun在發表演講的時候曾經專門提到了深度學習的幾個關鍵限制,具體來講這包括:
缺乏理論基礎。沒這個深度學習方法只能常常被視為黑盒,大多數的結論確認都由經驗而非理論來確定。
缺乏推理能力。深度學習技術缺乏表達因果關系的手段,缺乏進行邏輯推理的方法。
缺乏短時記憶能力。與深度學習相比人類的大腦有著驚人的記憶功能。
缺乏執行無監督學習的能力。無監督學習在人類和動物的學習中占據主導地位,我們通過觀察能夠發現世界的內在結構,而不是被告知每一個客觀事物的名稱。
這是2015年6月演講中提到的內容,infoq對此進行了比較完整的報道。從這種現實來看,我們確實很難講人工智能完成了從0到1的過程,而只能說還處在一種盲人摸象的狀態,雖然摸到的面積越來越大。
但與汽車或計算機不同的是,一般大家認為人工智能從1到100的過程會發生的非常快,而不像汽車陸陸續續發展了100年,計算機發展了半個多世紀。如果我們真能搞定某些基礎問題,那人工智能的從1到100的過程確實可能在幾年,甚至幾天內實現。互聯網為此準備了充分的素材和基礎設施。
如果人通用型的強人工智能得以實現,那就會面臨下一個從0到1的過程,由無意識到有意識的過程。
大白到底會不會來?
所謂的人工智能從正常人的視角來看其實有兩個明顯不同的分支,這會導致兩種完全不同的大白:
一個分支更像黑客帝國路線,有一個萬能的矩陣,所有章魚都是是這個矩陣的載體。我們經常提到的人工智能由于是數據驅動的所以基本都是這個方向,比如ibm的watson。
一個分支則是大白的路線,每個機器人有自己的個性,雖然它可以從龐大的云端數據庫里獲得信息,但它是獨立的個體,有自己的個性和溫度。
后者更貼近人類的狀態,從本能上我們不太會喜歡前者,因為這樣一個東西如果有足夠的智能那會是一種完全超出我們理解的東西(經常說的超級智能就是指這個),雖然科學家可能喜歡。
理論上講,這兩者都是有可能的,畢竟人從懵懂無知到學富五車其實并不需要太多的數據,但很不幸的是如果按照當前的研究方向發展下去,那種有個性的大白是不太會來到現實里來的。現在各種機遇機器學習的人工智能都需要龐大的數據量做支撐,這樣一來即使做一個本地的版本放到機器人里去,那也更像是黑客帝國里的章魚而不是有個性有溫度的大白。
當然人工智能本身也還在不停的變動中,所以也許有一天,當前這條路碰到瓶頸,科學家們會轉而追求另一種形式,那樣的話,大白才有可能真的來到我們身邊。
要想認清這點有必要考察一下實現人工智能的實現方式以及人腦的基本運作方式。
現在實現各種人工智能的方法簡單的可以概括成建立可以進行學習的多層網絡,接下來用數據來訓練這網絡,數據越多這網絡處理圖像識別等的效果就越好。效果和數據量成正比。
但人腦卻并不是這樣,一般認為大腦皮層是人類智慧的來源,每一層有大概2毫米厚,一共有六層,和疊加的六層撲克牌厚度相類似。有一種觀點認為大腦各個區域實際上能起的作用是一致的,之所以會不同的區域能復雜不同的事情是因為不同區域使用的計算方法不同。這和電腦類似,雖然看著電腦能做的事情五花八門,但底層都是0和1的運算,但接下來就不一樣了。大腦里面的軸突建立各種輸入模式,于是我們看到了五光十色的世界。認知過程中和計算機很不同的是大腦似乎是記憶身邊這世界的本質特征,接下來看到新東西的時候先從記憶中提取這種本質特征,再加上些處理來應付各種各樣的情形。
這樣一比較我們就知道實現這大白和章魚背后所牽涉的東西不同。要實現大白,那其實需要有感知并且及時的對這種感知進行理解、記憶、學習,個體的獨立和發展非常重要。這和當前的主流發展路線很不一樣,所以按照數據驅動的思路,更可能的產品只會是黑客帝國里的章魚。http://jcd02.51dzw.com/
小結
人工智能實在是比較奇妙的技術,即使仍然處在從0到1的過程,其背后的波瀾壯闊已經隱約可見。它當然會帶給我們近乎等距的天堂地獄,但最終這智能什么樣,人類仍然還有選擇權。
過去和未來那些可能的里程碑
- 51電子網公益庫存:
- CTM1051L
- CTM8251AT
- CTM8251D
- CTM8251T
- CAT1021WI-25-GT3
- CAT1021WI-28-GT3
- CAT1021WI-30-GT3
- CAT1021WI-42-GT3
- CAT1021WI-45-GT3
- CAT1022WI-25-GT3
- CAT1022WI-28-GT3
- CAT1022WI-30-GT3
《超級智能:路線圖、危險性與應對策略》這書里提到一件有意思的事情:
20世紀50年代后期的一些專家認為:如果能造出成功的下棋機器,那么就一定能夠找到人類智能的本質所在。但結果通常是:這種機器一旦被造出來之后,人們就不稱其為人工智能了。隨后作者列出了人工智能發展史上一些里程碑性的事情(有刪節)。
1.西洋跳棋--超越人類,1952年,阿瑟?塞繆爾寫過一個跳棋程序,并在1955年吸收了機器學習技術,從而改良了該程序。這是第一個玩起游戲來比程序編寫者都好的程序。1994年,跳棋程序“奇努克”(chinook)打敗了人類衛冕冠軍,這是機器程序第一次在競技游戲中贏得官方世界冠軍。2002年喬納森?謝弗和他的小組“解決號”跳棋程序總是計算出最好的棋步,最終打了個平局。
2.黑白棋--超越人類,1997年,logistello程序跟當時的世界冠軍村上健的對戰結果是6戰6勝。
3.國際象棋--超越人類,1997年,深藍計算機打敗了當時的國際象棋世界冠軍加里?卡斯帕羅夫。卡斯帕羅夫承認見識到了人工智能在某些棋步上具備真正的智能以及創造力。從那時起,國際象棋程序就一直不斷進步。
4.橋牌--高手水平,2005年,訂約橋牌軟件就已經能夠同最好的橋牌高手對弈。
5.《危險邊緣》益智問答--超越人類,2010年ibm的沃森超級計算機在《危險邊緣》游戲中擊敗了了肯?詹寧斯和布萊德?拉特這兩名擂主冠軍。《危險邊緣》是以提問有關歷史、文學、運動、地理、流行音樂、流行文化、科學以及其他領域細節問題而著稱的電視益智節目。《危險邊緣》游戲的題目一般都需要猜字謎的方式來發現線索。
6.撲克--發揮不穩,電腦玩家在玩德州撲克時還沒能超越人類玩家,但是在一些類似的撲克游戲中卻超越了人類水平。
7.圍棋--很高的業余水平,2012年,zen系列圍棋程序能夠達到6段水平,這個程序主要運用了蒙特卡洛樹搜索法和機器學習技術。圍棋程序此后每年提升一段的速度向前發展。照這個速度看,圍棋程序可能在未來10年內擊敗人類世界冠軍。
這意味著從游戲的視角看,除了圍棋人工智能基本已經超越或者達到了人類的水平。這里更有意思的事情是,如果把這張表延伸到未來,領域也不局限在游戲,那究竟那些事情值得記錄在上面。按照我的推斷這種里程牌會是下面這個樣子:
1.自動駕駛--徹底的自動駕駛很可能在10年左右的時間里實現。根據報道到2015年為止,google的自動駕駛汽車已經安全行駛了百萬英里。各方預測在這樣的基礎上,再有5~10年自動駕駛應該可以獲得普遍應用,我們采用保守的數值。自動駕駛之所以必須被放到里程碑里是因為從智能的角度看人類日常的工作生活中比駕駛更復雜的事情其實不多,如果可以搞定駕駛,那理論上第一產業、第二產業甚至第三產業中的簡單工作都是可以通過人工智能搞定的。第三產業中的簡單工作是說類似餐飲、運輸行業中的各種工作。在那個時間點上,我們就可以更清楚的看到第一產業、第二產業中幾乎沒人的景象,雖然即使是今天這在局部也已經逐漸成為現實。
2.沃森類系統在醫療行業全面展開--ibm已經在做這件事情,所以這里的關鍵點不在于采用不采用,而在于什么時間點沃森這樣的系統可以成為醫療中必須的一個環節。這個點之所以有意義在于,沃森的全面展開意味著醫院里所有和數據相關的工作被人工智能接管。這個時間點之所以有意義在于它意味著人工智能成為真正的專家系統,隨后(或者同時)它就可以擴展到法律、管理、財務等領域。從沃森獲得危險邊緣冠軍這事來看,這件事的瓶頸很可能不在于技術,而在于接受程度。如果拿數據庫被接受的速度做類比,那這產品也可能在5~10年內走到各家醫院里去。
3.人人工智能成為所有金融公司的標準工具--這點可以更形象點的表述成類似palantir的服務滲透到所有金融公司。這意味著非行業的可數據化的各種工作已經可以在人與人工智能的配合下完成。只要能搞定金融,那就可以搞定幾乎所有其它企業。這事情已經有很多公司再做,并且已經有很大的規模,所以也可能在5~10年內達成。
4.類人機器人出現--很像電影《我,機器人里面》描述的那種正常的機器人,這種機器人沒有自我意識,但有足夠的智能和行動力可以完成所有所有人類需要完成的工作,甚至可以包括戰爭。如果說1~3主要消滅的是低端的以及和數據深度相關的工作,那這類機器人幾乎可以消滅所有的工作。人類到此理論上可以得到解脫。這個項目上差的比較遠,如果認為前幾項可以在10年內實現,那這項應該會在它們后面。至于后面多久確實難以推斷,但這種機器人是一定可以實現的,雖然我們不太確定是20年后,還是30年后,但它的技術脈絡與前三者一脈相承,所以說是一定可以實現的。
人工智能上的從0到1
很多人可能難以相信,但上面那些看著已經波瀾壯闊的里程碑其實只是人工智能從0到1過程中的產物。
很多技術的發展都要經歷從0到1,再從1到100的過程。比如說福特造出第一輛t型車可以認為是汽車從0到1的過程,此后100年直到現在可以認為是汽車從1到100的過程。此后的汽車雖然也有發動機、傳動系統和四個輪子,但其精密程度要遠高于當年的版本。計算機一樣有這過程,如前所述,其理論奠基于圖靈,圖靈之后馮?諾依曼真的設計了一套體系結構把這東西做出來了,到馮?諾依曼為止可以認為計算機走完了自己從0到1的過程。此后才有從電子管計算機到晶體管計算機,再到大規模集成電路使用后的計算機,其形態也就由比房子還打到現在手機那么大,但幾乎無所不能。
如果拿人工智能與上述兩者相類比,我們可以發現人工智能根本還沒走完從0到1的過程。人工智能既沒有清楚的理論基礎,大家也不知道智能究竟是什么,所以才有先達到某個目標,比如在下棋上戰勝人類,接下來就認為這也不算什么智能的情形出現。人工智能的內在發展思路也多次發生變遷,比如最開始人們認為這種智能依賴于一種物理符號系統,這種系統要通過處理符號組成的數據結構來起作用。人類似乎是這樣,但這顯然只是一種現象,在這層面上并不能產生真的智能。接下來也考慮過遺傳算法,這是按照生物進化的過程來做程序,讓程序有某種隨機變化,并用一個選擇過程(生物的優勝劣汰)來保持似乎有用的變化,但限于各種“如果怎樣,否則怎樣”的這種組合太多,在當時這也沒產生什么有價值結果。
再后來至少一部分人開始轉向神經網絡,這方向出現的很早在20世紀60年代就出現了,但那時是非主流,直到20世紀80年代才收到重視,jeffhawkings認為這和人工智能節節敗退有關。神經網絡研究者嘗試在連接中查找智能,因為大腦由神經元組成,這是顯然的事實。近來極其火熱的深度學習就在這方向上,但這方向也還沒完成從0到1的過程。只是在特定的領域取得了極為令人矚目的成績比如語音識別、圖像識別。這領域的大牛yannlecun在發表演講的時候曾經專門提到了深度學習的幾個關鍵限制,具體來講這包括:
缺乏理論基礎。沒這個深度學習方法只能常常被視為黑盒,大多數的結論確認都由經驗而非理論來確定。
缺乏推理能力。深度學習技術缺乏表達因果關系的手段,缺乏進行邏輯推理的方法。
缺乏短時記憶能力。與深度學習相比人類的大腦有著驚人的記憶功能。
缺乏執行無監督學習的能力。無監督學習在人類和動物的學習中占據主導地位,我們通過觀察能夠發現世界的內在結構,而不是被告知每一個客觀事物的名稱。
這是2015年6月演講中提到的內容,infoq對此進行了比較完整的報道。從這種現實來看,我們確實很難講人工智能完成了從0到1的過程,而只能說還處在一種盲人摸象的狀態,雖然摸到的面積越來越大。
但與汽車或計算機不同的是,一般大家認為人工智能從1到100的過程會發生的非常快,而不像汽車陸陸續續發展了100年,計算機發展了半個多世紀。如果我們真能搞定某些基礎問題,那人工智能的從1到100的過程確實可能在幾年,甚至幾天內實現。互聯網為此準備了充分的素材和基礎設施。
如果人通用型的強人工智能得以實現,那就會面臨下一個從0到1的過程,由無意識到有意識的過程。
大白到底會不會來?
所謂的人工智能從正常人的視角來看其實有兩個明顯不同的分支,這會導致兩種完全不同的大白:
一個分支更像黑客帝國路線,有一個萬能的矩陣,所有章魚都是是這個矩陣的載體。我們經常提到的人工智能由于是數據驅動的所以基本都是這個方向,比如ibm的watson。
一個分支則是大白的路線,每個機器人有自己的個性,雖然它可以從龐大的云端數據庫里獲得信息,但它是獨立的個體,有自己的個性和溫度。
后者更貼近人類的狀態,從本能上我們不太會喜歡前者,因為這樣一個東西如果有足夠的智能那會是一種完全超出我們理解的東西(經常說的超級智能就是指這個),雖然科學家可能喜歡。
理論上講,這兩者都是有可能的,畢竟人從懵懂無知到學富五車其實并不需要太多的數據,但很不幸的是如果按照當前的研究方向發展下去,那種有個性的大白是不太會來到現實里來的。現在各種機遇機器學習的人工智能都需要龐大的數據量做支撐,這樣一來即使做一個本地的版本放到機器人里去,那也更像是黑客帝國里的章魚而不是有個性有溫度的大白。
當然人工智能本身也還在不停的變動中,所以也許有一天,當前這條路碰到瓶頸,科學家們會轉而追求另一種形式,那樣的話,大白才有可能真的來到我們身邊。
要想認清這點有必要考察一下實現人工智能的實現方式以及人腦的基本運作方式。
現在實現各種人工智能的方法簡單的可以概括成建立可以進行學習的多層網絡,接下來用數據來訓練這網絡,數據越多這網絡處理圖像識別等的效果就越好。效果和數據量成正比。
但人腦卻并不是這樣,一般認為大腦皮層是人類智慧的來源,每一層有大概2毫米厚,一共有六層,和疊加的六層撲克牌厚度相類似。有一種觀點認為大腦各個區域實際上能起的作用是一致的,之所以會不同的區域能復雜不同的事情是因為不同區域使用的計算方法不同。這和電腦類似,雖然看著電腦能做的事情五花八門,但底層都是0和1的運算,但接下來就不一樣了。大腦里面的軸突建立各種輸入模式,于是我們看到了五光十色的世界。認知過程中和計算機很不同的是大腦似乎是記憶身邊這世界的本質特征,接下來看到新東西的時候先從記憶中提取這種本質特征,再加上些處理來應付各種各樣的情形。
這樣一比較我們就知道實現這大白和章魚背后所牽涉的東西不同。要實現大白,那其實需要有感知并且及時的對這種感知進行理解、記憶、學習,個體的獨立和發展非常重要。這和當前的主流發展路線很不一樣,所以按照數據驅動的思路,更可能的產品只會是黑客帝國里的章魚。http://jcd02.51dzw.com/
小結
人工智能實在是比較奇妙的技術,即使仍然處在從0到1的過程,其背后的波瀾壯闊已經隱約可見。它當然會帶給我們近乎等距的天堂地獄,但最終這智能什么樣,人類仍然還有選擇權。