谷歌三大法寶:知識圖譜、語音搜索和Google Now
發布時間:2015/1/19 10:37:55 訪問次數:637
美國網站medium.com日前刊登文章,講述谷歌為保持其在搜索領域的主導地位,不斷開拓革新,發展形成了知識圖譜、語音搜索和google now這三個重要的組成部件。以下為文章主要內容:
- 51電子網公益庫存:
- TL2843BDR-8
- CC1150RSTR
- MSP430F5438IPZR
- MSP430F415IPMR
- MSP430F2132IPWR
- MSP430F4152IPMR
- MAX9860ETG
- XC7K325T-2FF676I
- EP2AGX95EF29I3N
- EP2AGX65DF29I3N
- 5SGXMA4H2F35I3LNAB
- SC411223A
天空為什么是藍色的?這是小孩常常會提出的一個問題,而大部分家長都無法獨立解答。在不太久以前,尋找正確的答案至少需要求助于百科全書,甚至意味著跑一趟圖書館。在最近這幾年,父母只需要跑到電腦前,登陸谷歌(google),評估與該問題相關的鏈接,快速瀏覽解釋,深入理解這個問題,從而給孩子們滿意的答復。
但是到了2015年,即使這個看似已經提速的過程還是未能達到預期。一方面,問題不只是被拼寫到搜索框中,更多是直接向移動設備口頭提出。另一方面,雖然從經過排列的鏈接清單中選擇最具相關性的一條仍然是大部分問題的有效解決辦法,但那些獲得明確答案的提問者開始希望迅速得到答案。一旦谷歌不能做到,他們就感到失望,甚至生氣。
因此……“谷歌,為什么天空是藍色的?”(注:語音提問)
android手機只花了不到一秒鐘就對這個口頭問題作出回應——以一種可以讓人理解但又明顯自動化的音調。
“在晴朗、無云的白天,天空之所以是藍色的是因為大氣中的微粒對來自太陽的藍色光散射能力高于紅色光。”
谷歌搜索團隊負責人阿密特·辛格哈爾(amit singhal)利用這個解釋來幫助證明,迄今為止全球最受歡迎的搜索引擎在過去幾年是如何進行自我改革的。在過去幾年我對他進行的采訪中,辛格哈爾將推行重大調整比喻為在半空飛行過程中更換發動機,因為谷歌將其算法“飛行計劃”更改為改善排名、增加新的信息材料(如圖片、書本或者旅行),或者在用戶還沒有輸入完問題之前就開始進行搜索。不過,在過去幾年,谷歌不僅改變了飛機的發動機,還改變了駕駛艙的大部分。移動端不可阻擋的勢頭(在2015年手機和平板電腦搜索量可能超過pc搜索量)促成了一些更為重大的變革:鑒于出現如此重大的變化,需要對未來的使命進行重新考慮。
他表示:“我們都必須深入地考慮,在已經進入移動化的世界里,搜索真正意味著什么。想到這個問題的時候,我們頭都大了。”
不斷變革
在過去17年歷史里,谷歌搜索不斷進化,在這個過程中該公司經常發表慶祝性的博客文章并偶然進行新聞發布會(不過一旦要對這些變革進行量化,谷歌又恢復到一貫的“惜字如金”——多年來,該公司對其用于幫助排列搜索詞條的提示的數量描述為“超過200條”)。因為搜索仍然是該公司的旗艦產品——并且支持搜索廣告的平臺仍然是谷歌的主要收入來源——谷歌一直在努力改善這個數十億人用以尋找信息的途徑。在過去幾年,通過短期和長期努力,該公司加快了這種節奏,以期領先于競爭對手。
用戶不應錯過部分變革。搜索速度更快,內容更加新鮮,也更具社交性(不過這是在google plus推出后,當時該公司大力推廣“社交搜索”,現在大家已經很少聽到這個口號了)。谷歌搜索的頁面也不一樣了。谷歌搜索體驗負責人之一塔瑪爾·耶霍舒亞(tamar yehoshua)表示: “在早期,頁面較為簡潔——只有主頁面和搜索結果。現在,在搜索結果頁面上有很多不同的功能和產品。”
展望未來,谷歌一直在擴展人工智能的邊界,從而打造一個巨型“大腦”——能夠更好地理解用戶和世界、甚至在人們還沒提問之前就列出準確結果。
但是部分批評者指出,谷歌搜索正在走下坡路。他們埋怨垃圾結果太多,或者對較新信息的過分強調導致較早前出現但更具相關性的結果被阻擋。大家都聽說過,谷歌自夸的“10個藍色鏈接”( ten blue links)已經被大量令人迷惑和謀求私利的功能(如購物、新聞及多媒體結果)所污染(另一方面,谷歌在美國最大的競爭對手微軟必應吹噓稱,谷歌仍然非常依賴于10個藍色鏈接)。美國新聞聚合網站buzzfeed去年一則新聞的標題指出,“我們正進入現代歷史最糟糕的時期”,接著直接指責稱“谷歌的實用性正在降低”。
辛格哈爾對此作出嚴詞回應。“事實完全相反,”他表示。“我調查了這些投訴,發現當中存在一些懷舊情緒。我們現在的搜索遠好于去年或者兩年前。”
辛格哈爾的評論表明了谷歌搜索的關鍵人物現在所具有的自豪感和信心。在幾年前,盡管谷歌認為其搜索質量無人能比,但也存在真實的憂慮——擔心該公司的統治地位可能被削弱。谷歌當時處于facebook恐慌的陣痛之中。“我們不擁有這些聯系,”辛格哈爾在2011年告訴我,顯然他指的是facebook的網絡(facebook禁止谷歌抓取其數據)。“我不知道信息在這些網絡里如何流動。”在這種躁狂癥最嚴重的時期,辛格哈爾在谷歌擔當類似于兇事預言家的角色,在某個時刻攔住該公司的社交業務負責人維克·岡多特拉(vicgundotra),高聲指出這些封閉網絡可能會威脅谷歌的存在。辛格哈爾在接受采訪時跟我說,如果有人他向提出這種威脅與谷歌在搜索領域無人能敵的威力不可相提并論,他會回答說:“在我小時候,泛美航空公司(pan am,1991年倒閉)也是看起來非常強大的。”
不過實際上這些擔心有點過頭了;現在不可能有人將谷歌比喻為這家已經破產的航空公司。facebook的“圖譜搜索"(graph search)仍然是剛起步的產品,但發展勢頭緩慢,對谷歌造成的沖擊較小。必應雖然在搜索質量上可稱得上是受人尊敬的競爭對手,但所持市場份額仍然不足五分之一。雖然google plus的成績未及公司預期,未能最終形成一款轟動的社交網絡產品,但的確成功地吸引了很多搜索用戶注冊加入。
統治地位
谷歌現在面臨的威脅并不是由強勁對手所組建的封閉網絡,而是搜索現在似乎已經從網絡遷移至各款應用程序(向移動端轉移也代表了谷歌的搜索廣告收入受到挑戰)。谷歌認為這種應用內部信息的崛起是可以被其征服的——畢竟,移動開發者也希望自己的信息能夠被世人了解。自從2013年秋天以來,谷歌啟動了一個名為app indexing的項目,希望將移動應用程序內的數據集中到其總索引。不過應用索引目前并不包括ios應用,這是一個比較大的問題。app indexing產品經理勞倫斯·張(lawrence chang)表示:“仍然有一條很長的路要走。不過我們已經打造了基礎性的結構單元。”
不過現在,網絡應用世界的挑戰并沒有影響谷歌在搜索領域的統治地位。數據仍然大得令人驚訝。谷歌每天接受超過30億條搜索詞條。在美國,三分之二的搜索使用谷歌——在全球范圍內,該公司仍然享受類似的統治地位(最近市場份額降低主要不是因為搜索質量問題,而是雅虎與火狐達成協議,取代谷歌成為該瀏覽器的默認搜索引擎)。甚至更為令人印象深刻的是,谷歌處理超過80%移動搜索。2013年谷歌遭遇持續5分鐘的宕機事件,網絡流量減少40%。
沒有任何一家搜索領域競爭對手能達到谷歌的基礎設施、人才儲備或者經驗。沒多少企業能有谷歌的雄心壯志。因此盡管有關谷歌的新聞報道出現了監管問題、谷歌眼鏡的幸運與不幸以及youtube的青少年超級巨星,搜索一直進行著穩定且高強度的革新。
從某些方面看,這些革新只是延續谷歌自最初以來對搜索所進行的變革。在微觀基礎上,谷歌對其算法進行了一些細微調整,在每周一次的搜索質量發布會上對其大加稱贊。之后,每2年或3年,其排名系統會出現重大更新,從而在那些與關鍵字高度相關的企業之間產生贏家和輸家。最近一次是在2013年,推出代號為hummingbird的算法。過去10年,本·戈麥斯(ben gomes)一直在搜索部門擔任辛格哈爾的副手,他指出谷歌在過去3年對搜索排名進行的調整超過了此前13年。
從各個方面看,最大的挑戰一直在于針對從pc向便攜設備轉移的趨勢進行調整。正如很多互聯網企業一樣,谷歌搜索采用一種以移動為中心的辦法。谷歌搜索的主設計師瓊·威利(jon wiley) 表示:“移動端對我們如何考慮設計產生巨大影響。”在執掌搜索設計領導職位后,他首先做的一樣事情是將移動和pc團隊整合在一起。最初,這個想法是將大量努力投入到手機端——現在,他表示,完全是關于將搜索視為一種多設備的體驗。
知識圖譜
重大變革當中,哪項最為意義重大的?谷歌搜索團隊對此毫不掩飾。搜索業務負責人辛格爾明確表示:“當然是知識圖譜(knowledge graph),只要你開始進行打造,就能慢慢了解現實世界。第二是語音輸入——因為我不能在這里打字,”他一邊說著,一邊向手腕上的三星智能手表打手勢。“我們還意識到,除了預測外還需要一些科學,這樣的話人們就不必總是提出問題,因此我們開發了google now。”
知識圖譜將全世界的知識打造成一個廣大的數據庫。語音搜索將語音帶到搜索。google now在用戶提問之前就告知答案。所有這三項都與谷歌對移動端的關注密切相關。這些組成部分——以及它們運作的方式——已經在過去三年幫助對谷歌搜索進行改造:從一個“10個藍色鏈接”的投遞系統到某些幾乎超自然的東西——這個系統的行為并不像計算機,而是一個智能的知識儲備庫,能夠聰明地解譯和滿足你的信息需求。在你還沒有開始予以尋找的時候,它已經完成一切。
谷歌在2010年收購一家名為metaweb的公司,該消息并沒有引起太多關注。但事實證明這筆并購成為了谷歌搜索史上一項最意義重大的變革的關鍵。
metaweb在2005年由丹尼·希利斯(danny hillis)創辦,他是一位知名的計算機科學家和企業家。在經營他的公司applied minds時,希利斯構想了大量創造性項目,不過他認為metaweb項目非常意義重大,因而將其剝離出來成為一家獨立公司。metaweb公司在2007年成立,是所謂的semantic web的首批重大利用成果之一。semantic web實際上是一種處理多數據庫的辦法,經整合后數據庫中的信息可被輕松閱讀。希利斯說:“我們嘗試創造一個全球性的數據庫,包含全世界的信息。”由于metaweb可以掃描互聯網來回答問題,因而被廣泛視為是谷歌的競爭對手。不過在經過幾年的經營以及超過5000萬美元融資后,希利斯意識到只有加入一家規模更大的公司——即谷歌——這個想法才能開花結果。
當時,谷歌已經在向用戶提問提供一些直接的回答:如果你輸入“奧巴馬生日”,它會在搜索結果的頂部顯示“1961年8月14日”。不過,正如谷歌在2010年7月一篇宣布收購metaweb的博客文章上解釋說,谷歌的搜索引擎未能回答像“美國西岸學費低于3萬美元的大學”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”這樣的問題。該篇博客承諾metaweb將幫助谷歌提供這些答案。
產品經理艾米麗·莫斯利(emily moxley)從2011年就開始參與到metaweb項目,她表示:“谷歌收購metaweb的時候,知道‘物’的概念將成為搜索一個非常重要的部分。我們認為這是快速呈現一些簡要事實以及人們所關注事物的有關信息的良好途徑。”
在2012年5月,谷歌推出了這些metaweb材料,將其稱為“知識圖譜”(knowledge graph)。該項目從1200萬實體發展至5億。該產品可以在自認為合適的時候對搜索結果提供補充性的答案:多項有關所搜索主題的關鍵事實,其位置位于平常的搜索排名的右側。這看起來有點“手氣不錯”(i’m feeling lucky)的感覺。
在介紹谷歌如何考慮哪些詞條應該獲得知識圖譜結果時,莫斯利引用了弗吉尼亞州里奇蒙德(richmond, virginia)地區的洲際高速公路系統。從西北向佛羅里達州進發的游客應該非常清楚這種情況——在里奇蒙德背部,95號公路出現分叉,駕駛員可以選擇繼續沿南北主干道行駛并途徑市中心,或者選擇295號公路,在外圍繞過該城市并在里奇蒙德南部再進入95號公路。
她解釋說,如果用戶提供一個搜索詞條,谷歌將其擴展為替代性的形式以及同義詞等,之后提供一個算法測試,從而了解它是否與“知識圖譜”結果具有相關性。“然后,用戶可能會選擇295號公路的出口,說‘好,有什么可能的知識圖譜內容會對這個詞條有用?’——我們搜索所有的文件,給出相關的內容。之后用戶再次回到95號公路,我們說‘好,我們認為這些內容足夠有用,讓我們更顯著地呈現這些信息吧’。”
谷歌搜索與“知識圖譜”整合的2年多里,該公司繼續改善這款產品(谷歌并未正式公布設計“知識圖譜”回答的詞條比例,不過似乎大約為25%)。最初,“知識圖譜”較為動態。不過這款產品逐漸掌握谷歌搜索本身所具有的學習能力,能夠分析用戶的習慣。莫斯利舉了“誰在電影《太空炮彈》(spaceballs)中扮演barf?”作為例子,“知識圖譜”已經接觸了非常多詞條,因而知道如何提供涉及演員和電影的圖解——并且以非常快的速度完成。
“知識圖譜”也在另一個重要領域——新鮮度——取得較大進步。由于谷歌假定對一個問題提供一個正確答案,因此其信息必須與時俱進。否則,答案會是錯誤的,對用戶造成的影響會比沒有答案更糟糕。莫斯利表示,“知識圖譜”在2012年推出的時候,其中一個實體的變化——例如大眾汽車(volkswagen)決定聘請新的首席執行官——該系統可能要花長達2周來反映這種變化。現在該系統能夠在幾分鐘內處理這些新聞并進行調整。但是她承認,對“知識圖譜”而言,這種特定的“大眾汽車首席執行官”詞條既是成功也是失敗。新任首席執行官要幾個月后才會正式上任。“知識圖譜”仍然展示當前的領導人,不過很多在谷歌輸入“大眾汽車首席執行官”詞條的用戶可能尋求的是有關繼任者的信息。因此,盡管“知識圖譜”是正確的,其回復可能不會令用戶滿意。
谷歌還需要進行很多改進。首先是增加更多領域和行業;該項目最近增加了汽車、視頻游戲及雨果獎(hugo award)獲獎者的知識。不過她表示,谷歌正嘗試找出如何提供更加復雜的結果——不再只是快速事實,還提供更主觀、更模糊的聯想。“人們不只是對事實感興趣,”她說。“他們對一些主觀性的東西也感興趣,如該電視節目是否好看。這些東西能幫助將‘知識圖譜’提升至新的級別。”這就像谷歌并不希望讓用戶感覺自己在進行機械搜索,而是咨詢一位圣人,這位圣人不僅無所不知而且在文化方面還具有自己的獨立見解。
不過這還需要走很長的路,并且由于對“知識圖譜”所提供信息的預期提升,其所犯錯誤也不斷令用戶感到失望。莫斯利最近較為煩惱,因為她意識到“知識圖譜”雖然了解電視節目的信息,但是缺乏有關新節目以及何時播出的內容。她說:“我希望有這樣的提醒,能告訴我本周有新節目播出,我也想知道哪些網站有放映,從而可以登陸觀看,”承諾最終谷歌將穿越這個“中間階段”,雖然該項目還沒有將所有東西都收入到目錄中。
談到期望提升,可能“知識圖譜”最顯眼的錯誤是谷歌在2010年夏天收購metaweb時提到的兩個問題。4年后,其搜索引擎仍然未能對“美國西岸學費低于3萬美元的大學”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”等問題提供一站式答案。
語音輸入
在意識到移動技術將變得無處不在后,谷歌決定對搜索業務進行一項細微但意義重大的調整。該公司不再將搜索詞條視為向計算機系統提交的指令,而是把所有輸入的內容都當成是對話。“很顯然,一旦你擁有這種類型的設備(他舉起手機做例證),語音輸入將變得非常重要,”本·戈麥斯說,“同樣非常明確的是,用戶說話比打字更自然。”
這種調整不僅涉及改變搜索引擎處理詞條的方式。它意味著改變我們。我們現在可以將搜索框——不管在pc或在移動端上——視為可以進行對話的對象。塔瑪爾·耶霍舒亞(tamar yehoshua) 表示:“在谷歌出現前,人們并沒有詞條的概念,我們花了多年時間教會大家使用詞條。不過,如果你以平常的方式進行交流,不必進行很認真的思考,這樣不是更輕松嗎?這會是非常美好的情景。”
進行這種變革需要2個方面。首先,谷歌的搜索引擎必須加強,從而更仔細地傾聽,對輸入的語音內容進行分析。之后谷歌必須確保當用戶向手機發出語音指示——或者在搜索框通過文字進行交流,其系統會理解用戶在說什么。
的確,谷歌已經在語音識別方面進行了一段時間的努力。“在很多年前,我們當然知道這些基礎部分——語音、自然語言處理——將具有重要意義,”耶霍舒亞說。“我們知道那些都是投資,都是科技界未曾解決的問題,我們需要花多年時間才能收獲成果。”在20世紀初的幾年里,谷歌有一項服務名為google 411,所做的事情跟用戶撥打(付費)電話號碼查詢系統時電話公司所做的事情一樣。谷歌使用那數百萬的免費電話來學會如何正確地解譯不同語言和口音的語音。這一點非常有用,不過在其他一些地方,谷歌并沒有獲得分析語音輸入所需的大約2500個短語樣本。因此,該公司開始派遣小型團隊到多個不同的地區,并在此之前在谷歌網絡發布消息稱該公司希望收集語音樣本。在印度尼西亞進行的努力具有代表意義。谷歌語音專家林奈·哈(linne ha)說:“在第二天,有900人現身。”谷歌進行這些研究的時候,會選擇在與該地區相匹配的現場條件進行收集:如在香港的街道和巴黎的地鐵路里記錄物體。
這些努力獲得了回報——谷歌搜索支持159種語言,語音搜素(voice search)現在支持其中58種語言。谷歌聲稱該應用的“錯詞率”已經降低至8%。
戈麥斯自豪地指出谷歌發展過程中的一個里程碑:他現在親自進行語音展示。“我的口音非常不標準,”這位印度裔工程師說。“我的元音發音是美國的,不過我不發r的的音。”在這個語音項目前,戈麥斯從未親自去證明谷歌在語音識別方面的努力:相反,該公司使用一位內部的專家,他具有純正的美國口音,能夠與機器和諧共處。現在,戈麥斯已經與這位專家失去聯系。“他不再是對這份工作非常重要,”他說。“我可以親自進行展示。讓我坐在記者面前,親自進行語音輸入,我對此毫不畏懼。”
谷歌還必須考慮電話向用戶回應的方式。應該像siri那樣的擬人化形象,還是使用明顯的機器人語調從而讓用戶意識到自己在跟系統對話?谷歌選擇了后者。該公司搜索設計主管瓊·威利表示,為了成功實現與一個有意識個體對話這種錯覺,他們必須達到皮克斯(pixar)般故事自動敘述能力。“我認為從具有個性的計算機到人類與之自然交流還有很長的路要走。”
不過科技迅速發展,已經足以讓谷歌(當然,也包括其他一些公司)達到研究人員數十年來所幻想的語音互動級別。“我認為三或四樣東西推動實現了這種可能性,”戈麥斯說。“顯然,計算機變得更快且運算能力變得更強。硬件——麥克風——也變得更好。軟件算法方面也有進步。不過最大的變化是我們理解語言的能力。”
費爾南多·佩雷拉(fernando pereira)是搜索部門的“杰出搜索科學家”(distinguished research scientist),過去30年他一直從事自然語言處理(nlp)工作。他表示,這幾年來,谷歌變得非常善于找出如何接收搜索詞條以及將詞條與網絡及其他其他信息庫上的文件配對。他說:“當你進行搜索的時候,很有可能你在詞條中使用的詞語會出現在部分搜索結果中。”不過將“知識圖譜”這樣的數據庫增加到搜索引擎中會帶來新的挑戰和機遇。他指出:“要預期所使用的語言是否與數據庫所設計的方式配對變得更具難度。”
一方面,這并不容易。當谷歌收到像“巨人隊在哪里打比賽?”這樣的詞條,它必須知道很多東西:該詞條涉及體育,球隊所比賽的場館等。它還必須作出選擇——這是棒球聯盟的巨人隊還是橄欖球隊?用戶希望知道的是該球隊通常在哪里打比賽,如主場,還是該球隊下周的比賽在哪里進行?谷歌使用詞條中的信號以及用戶此前的習慣來確定答案。佩雷拉說:“所有這些思考,所有的推理,都是在幾年前不能做到的。”
一旦這些障礙被去清除,谷歌的nlp系統可以憑借“知識圖譜”而實現進一步提升。“我們開始理解世界上的事物,”戈麥斯說。這讓谷歌能夠正確地猜測用戶在詢問什么,甚至即使詞條的拼寫存在錯誤或者語言輸入不太正確。戈麥斯指出,例如有人向手機說“大衛·卡梅倫(david cameron)”,系統已經知道這兩個詞通常是配對在一起的,而且還是男性——因而可以使用替代詞“他”。即使麥克風沒有太聽清楚后面說到的姓,“知識圖譜”也可以想到指的是英國首相。
谷歌懂得的東西越多,對用戶就越了解。
google now
在2004年,我問拉里·佩奇(larry page)和謝爾蓋·布林(sergey brin)對于搜索的長期展望。佩奇表示,搜索將融入到人們的大腦中。“當你考慮某些東西并且對其了解不是太多,你會自動獲得信息。”布林指出,關鍵點是,“你可以讓與你進行交流的設備或者讓關注周邊事物的計算機,提出有用的信息。”
在2010年,兩位在android部門工作的工程師巴利斯·古爾特金(baris gultekin)和安德魯·基爾斯姆(andrew kirsme)著手一項與上述展望非常相符的課外項目,從而創辦了google now。
根據古爾特金(去年從google now調任至該公司其他項目),這款產品恪守他們最初的宣傳文件。“核心的聲明是,現在大家的手機并不智能,不過它們可以變得智能,”他說。“如果我們可以將這些具有各種功能、強勁和連接互聯網的設備的能力與谷歌的能力合并在一起,那會怎么樣?”
換言之,google now可以回答那些你沒有主動提出來的詞條。這意味著將多個領域的信息合并起來,解決某些重要的事情。古爾特金表示,最開始創造一個系統來這樣做是令人恐懼的,不過他和他的合作伙伴開始分解在計算領域內可以如何實現這個目標。即使某些類似具有限制性的東西也要求系統具有實質性的知識:家和辦公室的地理位置、最佳路線、交通信息等。如果google maps知道如何在路網中導航,肯定會有幫助作用——但這恰恰就是關鍵的地方。谷歌會使用其全部能力去放大這種搜索工具。很快,他們擁有了一款優秀的應用程序來幫助通勤者。“不過我們不希望它只是作為一款通勤應用,”古爾特金表示。“我們希望它成為一位主動的助手,可以處理很多事情。”因此他們在2012年7月推出了google now,主要關注幾個領域:通勤、航班、體育比賽、附近的場所、出游、公共交通運輸以及天氣。現在,它已經覆蓋超過70個領域,并且正迅速增加。古爾特金說:“我的遠大目標是,google now向用戶提供大部分所需的信息,而其他東西都只成為備用品。”
google now的有效性取決于將對世界的了解(所有這些都是谷歌搜索以及“知識圖譜”能夠提供的)與個人信息深度融合。這正是為什么有人可能指出,這個搜索的細分部門可視為是谷歌的替代品:每一次google now及時提供信息卡,都會利用大量谷歌服務。一張普通的信息卡會將來自個人電子郵件、日程表和通訊錄的信息與公交線路安排、交通信息及天氣進行整合。
很多時候,只有在google now行動后,人們才會準確知道它干些什么。例如,當你停好車后,google now會記錄你停車并記住你停車的位置——以防你忘記了。如果你的電子郵件告訴google now你在找房子,該項服務可能會向你推送你希望居住地區的待租售房屋的照片。
隨著google now進化,它從一個課外項目發展為一項全職服務。不過其最大的助推器可能出現在2011年,當時蘋果推出了siri,這在谷歌總部引起了一些擔憂情緒,也為這個以語音為方向的項目吸引了更多資源。它成為搜索部門的一個正式組成部分,盡管該團隊實際上受命于搜索和android兩個部門。古爾特金表示:“搜索和google now都值得贊美。我們希望在用戶搜索之前就為其提供信息,不過在很多情況里,我們不知道你的水管爆裂了,你需要水管工。”
(當然, 在未來,通過谷歌旗下智能家居企業nest,谷歌將知道你家的水管何時破裂,或者你家是否著火了。古爾特金表示,整合nest“可能會在將來,但不是現在”。)
與傳統版本的搜索不同的是,google now搜索只有在你全部采用谷歌產品的情況下才能起到效果。耶霍舒亞表示:“拉里(佩奇)曾說過,搜索應該理解你的意圖并提供你所需的信息。這是一個谷歌生態系統,如果你在手機端和pc上注冊登陸后,我們可以予以利用。如果你想要獲得航班信息并追蹤你的包裹以及任何來自gmail的信息,我們都會帶給你。如果你沒有使用gmail,你就不會得到信息——不過你還是可以利用我們的語音服務并獲得答案。”
沒有其他解決辦法——如果你想要使用google now但gmail不是你默認的郵箱,你不會得到google now甚至谷歌搜索的全部價值。“如果我們可以將這些信息分享給所有人,這會是非常美好的事情。我不認為這會在明天出現。當然,蘋果也會給我們帶來壓力。”
谷歌非常刻意地不將google now作為一款獨立的產品。相反,該公司將其視為搜索應用的一部分。該應用并不是以搜索作為名稱,而是冠名“谷歌”。這種命名法不僅顯示搜索非常密切地與谷歌聯系在以前,還顯示googe now對該公司非常重要。
盡管如此,googe now部件仍是可選部件。所有人使用的時候都會考慮隱私警告;該產品看起來無所不知,但也從側面提醒我們這家巨頭對我們是多么了解。隨著谷歌對個人信息的掌控引發更多麻煩,特別是在歐洲,當地政府正推動加強監管并實施罰款,甚至威脅將其分拆,該公司希望服務大眾的雄心壯志可能會被隱私擔憂所挫敗。即使對于那些信任谷歌的人士而言,斯諾登事件證明政府可以很輕松地訪問我們的信息。如果google now知道你把車停在哪里,當地的情報部門也是如此,對吧?
辛格哈爾認為,搜索的第一個時代是以人們想象在他們與某些遙遠機器之間進行互動為標志的。現在這個新時代清除了這個障礙。我們預期電話會明白我們的意思。我們預期搜索也同樣精通于提供涉及我們個人信息的答案,因為它正在發掘來自網頁、文件和公共數據庫的信息。
“我認為搜索是所有計算的界面,”辛格哈爾說。“當設備消失或者變小,你將如何與它們互動?因為在大部分時間里,你需要采取行動——可能簡單如播放音樂,或復雜如寫便簽來提醒自己經過附近雜貨店時買牛奶。或者你想知道妻子的航班是否準點?或者奧巴馬有多高?”http://feiyi.51dzw.com/
人們可能認為這是理所當然的——他們甚至可能抱怨說谷歌搜索不再像以前那樣了。不過辛格哈爾認為,搜索已經跨越了一個他在過去幾十年所對付的障礙。辛格哈爾說:“20年來,我作為研究員未能做到這一點”,他指的是他的團隊為谷歌搜索實現的成就。他承認,有很多問題還有待解決。不過在描述詞條后面的科學時,他充滿了自豪感。當有人提出“天空為什么是藍色”這樣簡單的問題時,谷歌能夠成功地進行回應。
美國網站medium.com日前刊登文章,講述谷歌為保持其在搜索領域的主導地位,不斷開拓革新,發展形成了知識圖譜、語音搜索和google now這三個重要的組成部件。以下為文章主要內容:
- 51電子網公益庫存:
- TL2843BDR-8
- CC1150RSTR
- MSP430F5438IPZR
- MSP430F415IPMR
- MSP430F2132IPWR
- MSP430F4152IPMR
- MAX9860ETG
- XC7K325T-2FF676I
- EP2AGX95EF29I3N
- EP2AGX65DF29I3N
- 5SGXMA4H2F35I3LNAB
- SC411223A
天空為什么是藍色的?這是小孩常常會提出的一個問題,而大部分家長都無法獨立解答。在不太久以前,尋找正確的答案至少需要求助于百科全書,甚至意味著跑一趟圖書館。在最近這幾年,父母只需要跑到電腦前,登陸谷歌(google),評估與該問題相關的鏈接,快速瀏覽解釋,深入理解這個問題,從而給孩子們滿意的答復。
但是到了2015年,即使這個看似已經提速的過程還是未能達到預期。一方面,問題不只是被拼寫到搜索框中,更多是直接向移動設備口頭提出。另一方面,雖然從經過排列的鏈接清單中選擇最具相關性的一條仍然是大部分問題的有效解決辦法,但那些獲得明確答案的提問者開始希望迅速得到答案。一旦谷歌不能做到,他們就感到失望,甚至生氣。
因此……“谷歌,為什么天空是藍色的?”(注:語音提問)
android手機只花了不到一秒鐘就對這個口頭問題作出回應——以一種可以讓人理解但又明顯自動化的音調。
“在晴朗、無云的白天,天空之所以是藍色的是因為大氣中的微粒對來自太陽的藍色光散射能力高于紅色光。”
谷歌搜索團隊負責人阿密特·辛格哈爾(amit singhal)利用這個解釋來幫助證明,迄今為止全球最受歡迎的搜索引擎在過去幾年是如何進行自我改革的。在過去幾年我對他進行的采訪中,辛格哈爾將推行重大調整比喻為在半空飛行過程中更換發動機,因為谷歌將其算法“飛行計劃”更改為改善排名、增加新的信息材料(如圖片、書本或者旅行),或者在用戶還沒有輸入完問題之前就開始進行搜索。不過,在過去幾年,谷歌不僅改變了飛機的發動機,還改變了駕駛艙的大部分。移動端不可阻擋的勢頭(在2015年手機和平板電腦搜索量可能超過pc搜索量)促成了一些更為重大的變革:鑒于出現如此重大的變化,需要對未來的使命進行重新考慮。
他表示:“我們都必須深入地考慮,在已經進入移動化的世界里,搜索真正意味著什么。想到這個問題的時候,我們頭都大了。”
不斷變革
在過去17年歷史里,谷歌搜索不斷進化,在這個過程中該公司經常發表慶祝性的博客文章并偶然進行新聞發布會(不過一旦要對這些變革進行量化,谷歌又恢復到一貫的“惜字如金”——多年來,該公司對其用于幫助排列搜索詞條的提示的數量描述為“超過200條”)。因為搜索仍然是該公司的旗艦產品——并且支持搜索廣告的平臺仍然是谷歌的主要收入來源——谷歌一直在努力改善這個數十億人用以尋找信息的途徑。在過去幾年,通過短期和長期努力,該公司加快了這種節奏,以期領先于競爭對手。
用戶不應錯過部分變革。搜索速度更快,內容更加新鮮,也更具社交性(不過這是在google plus推出后,當時該公司大力推廣“社交搜索”,現在大家已經很少聽到這個口號了)。谷歌搜索的頁面也不一樣了。谷歌搜索體驗負責人之一塔瑪爾·耶霍舒亞(tamar yehoshua)表示: “在早期,頁面較為簡潔——只有主頁面和搜索結果。現在,在搜索結果頁面上有很多不同的功能和產品。”
展望未來,谷歌一直在擴展人工智能的邊界,從而打造一個巨型“大腦”——能夠更好地理解用戶和世界、甚至在人們還沒提問之前就列出準確結果。
但是部分批評者指出,谷歌搜索正在走下坡路。他們埋怨垃圾結果太多,或者對較新信息的過分強調導致較早前出現但更具相關性的結果被阻擋。大家都聽說過,谷歌自夸的“10個藍色鏈接”( ten blue links)已經被大量令人迷惑和謀求私利的功能(如購物、新聞及多媒體結果)所污染(另一方面,谷歌在美國最大的競爭對手微軟必應吹噓稱,谷歌仍然非常依賴于10個藍色鏈接)。美國新聞聚合網站buzzfeed去年一則新聞的標題指出,“我們正進入現代歷史最糟糕的時期”,接著直接指責稱“谷歌的實用性正在降低”。
辛格哈爾對此作出嚴詞回應。“事實完全相反,”他表示。“我調查了這些投訴,發現當中存在一些懷舊情緒。我們現在的搜索遠好于去年或者兩年前。”
辛格哈爾的評論表明了谷歌搜索的關鍵人物現在所具有的自豪感和信心。在幾年前,盡管谷歌認為其搜索質量無人能比,但也存在真實的憂慮——擔心該公司的統治地位可能被削弱。谷歌當時處于facebook恐慌的陣痛之中。“我們不擁有這些聯系,”辛格哈爾在2011年告訴我,顯然他指的是facebook的網絡(facebook禁止谷歌抓取其數據)。“我不知道信息在這些網絡里如何流動。”在這種躁狂癥最嚴重的時期,辛格哈爾在谷歌擔當類似于兇事預言家的角色,在某個時刻攔住該公司的社交業務負責人維克·岡多特拉(vicgundotra),高聲指出這些封閉網絡可能會威脅谷歌的存在。辛格哈爾在接受采訪時跟我說,如果有人他向提出這種威脅與谷歌在搜索領域無人能敵的威力不可相提并論,他會回答說:“在我小時候,泛美航空公司(pan am,1991年倒閉)也是看起來非常強大的。”
不過實際上這些擔心有點過頭了;現在不可能有人將谷歌比喻為這家已經破產的航空公司。facebook的“圖譜搜索"(graph search)仍然是剛起步的產品,但發展勢頭緩慢,對谷歌造成的沖擊較小。必應雖然在搜索質量上可稱得上是受人尊敬的競爭對手,但所持市場份額仍然不足五分之一。雖然google plus的成績未及公司預期,未能最終形成一款轟動的社交網絡產品,但的確成功地吸引了很多搜索用戶注冊加入。
統治地位
谷歌現在面臨的威脅并不是由強勁對手所組建的封閉網絡,而是搜索現在似乎已經從網絡遷移至各款應用程序(向移動端轉移也代表了谷歌的搜索廣告收入受到挑戰)。谷歌認為這種應用內部信息的崛起是可以被其征服的——畢竟,移動開發者也希望自己的信息能夠被世人了解。自從2013年秋天以來,谷歌啟動了一個名為app indexing的項目,希望將移動應用程序內的數據集中到其總索引。不過應用索引目前并不包括ios應用,這是一個比較大的問題。app indexing產品經理勞倫斯·張(lawrence chang)表示:“仍然有一條很長的路要走。不過我們已經打造了基礎性的結構單元。”
不過現在,網絡應用世界的挑戰并沒有影響谷歌在搜索領域的統治地位。數據仍然大得令人驚訝。谷歌每天接受超過30億條搜索詞條。在美國,三分之二的搜索使用谷歌——在全球范圍內,該公司仍然享受類似的統治地位(最近市場份額降低主要不是因為搜索質量問題,而是雅虎與火狐達成協議,取代谷歌成為該瀏覽器的默認搜索引擎)。甚至更為令人印象深刻的是,谷歌處理超過80%移動搜索。2013年谷歌遭遇持續5分鐘的宕機事件,網絡流量減少40%。
沒有任何一家搜索領域競爭對手能達到谷歌的基礎設施、人才儲備或者經驗。沒多少企業能有谷歌的雄心壯志。因此盡管有關谷歌的新聞報道出現了監管問題、谷歌眼鏡的幸運與不幸以及youtube的青少年超級巨星,搜索一直進行著穩定且高強度的革新。
從某些方面看,這些革新只是延續谷歌自最初以來對搜索所進行的變革。在微觀基礎上,谷歌對其算法進行了一些細微調整,在每周一次的搜索質量發布會上對其大加稱贊。之后,每2年或3年,其排名系統會出現重大更新,從而在那些與關鍵字高度相關的企業之間產生贏家和輸家。最近一次是在2013年,推出代號為hummingbird的算法。過去10年,本·戈麥斯(ben gomes)一直在搜索部門擔任辛格哈爾的副手,他指出谷歌在過去3年對搜索排名進行的調整超過了此前13年。
從各個方面看,最大的挑戰一直在于針對從pc向便攜設備轉移的趨勢進行調整。正如很多互聯網企業一樣,谷歌搜索采用一種以移動為中心的辦法。谷歌搜索的主設計師瓊·威利(jon wiley) 表示:“移動端對我們如何考慮設計產生巨大影響。”在執掌搜索設計領導職位后,他首先做的一樣事情是將移動和pc團隊整合在一起。最初,這個想法是將大量努力投入到手機端——現在,他表示,完全是關于將搜索視為一種多設備的體驗。
知識圖譜
重大變革當中,哪項最為意義重大的?谷歌搜索團隊對此毫不掩飾。搜索業務負責人辛格爾明確表示:“當然是知識圖譜(knowledge graph),只要你開始進行打造,就能慢慢了解現實世界。第二是語音輸入——因為我不能在這里打字,”他一邊說著,一邊向手腕上的三星智能手表打手勢。“我們還意識到,除了預測外還需要一些科學,這樣的話人們就不必總是提出問題,因此我們開發了google now。”
知識圖譜將全世界的知識打造成一個廣大的數據庫。語音搜索將語音帶到搜索。google now在用戶提問之前就告知答案。所有這三項都與谷歌對移動端的關注密切相關。這些組成部分——以及它們運作的方式——已經在過去三年幫助對谷歌搜索進行改造:從一個“10個藍色鏈接”的投遞系統到某些幾乎超自然的東西——這個系統的行為并不像計算機,而是一個智能的知識儲備庫,能夠聰明地解譯和滿足你的信息需求。在你還沒有開始予以尋找的時候,它已經完成一切。
谷歌在2010年收購一家名為metaweb的公司,該消息并沒有引起太多關注。但事實證明這筆并購成為了谷歌搜索史上一項最意義重大的變革的關鍵。
metaweb在2005年由丹尼·希利斯(danny hillis)創辦,他是一位知名的計算機科學家和企業家。在經營他的公司applied minds時,希利斯構想了大量創造性項目,不過他認為metaweb項目非常意義重大,因而將其剝離出來成為一家獨立公司。metaweb公司在2007年成立,是所謂的semantic web的首批重大利用成果之一。semantic web實際上是一種處理多數據庫的辦法,經整合后數據庫中的信息可被輕松閱讀。希利斯說:“我們嘗試創造一個全球性的數據庫,包含全世界的信息。”由于metaweb可以掃描互聯網來回答問題,因而被廣泛視為是谷歌的競爭對手。不過在經過幾年的經營以及超過5000萬美元融資后,希利斯意識到只有加入一家規模更大的公司——即谷歌——這個想法才能開花結果。
當時,谷歌已經在向用戶提問提供一些直接的回答:如果你輸入“奧巴馬生日”,它會在搜索結果的頂部顯示“1961年8月14日”。不過,正如谷歌在2010年7月一篇宣布收購metaweb的博客文章上解釋說,谷歌的搜索引擎未能回答像“美國西岸學費低于3萬美元的大學”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”這樣的問題。該篇博客承諾metaweb將幫助谷歌提供這些答案。
產品經理艾米麗·莫斯利(emily moxley)從2011年就開始參與到metaweb項目,她表示:“谷歌收購metaweb的時候,知道‘物’的概念將成為搜索一個非常重要的部分。我們認為這是快速呈現一些簡要事實以及人們所關注事物的有關信息的良好途徑。”
在2012年5月,谷歌推出了這些metaweb材料,將其稱為“知識圖譜”(knowledge graph)。該項目從1200萬實體發展至5億。該產品可以在自認為合適的時候對搜索結果提供補充性的答案:多項有關所搜索主題的關鍵事實,其位置位于平常的搜索排名的右側。這看起來有點“手氣不錯”(i’m feeling lucky)的感覺。
在介紹谷歌如何考慮哪些詞條應該獲得知識圖譜結果時,莫斯利引用了弗吉尼亞州里奇蒙德(richmond, virginia)地區的洲際高速公路系統。從西北向佛羅里達州進發的游客應該非常清楚這種情況——在里奇蒙德背部,95號公路出現分叉,駕駛員可以選擇繼續沿南北主干道行駛并途徑市中心,或者選擇295號公路,在外圍繞過該城市并在里奇蒙德南部再進入95號公路。
她解釋說,如果用戶提供一個搜索詞條,谷歌將其擴展為替代性的形式以及同義詞等,之后提供一個算法測試,從而了解它是否與“知識圖譜”結果具有相關性。“然后,用戶可能會選擇295號公路的出口,說‘好,有什么可能的知識圖譜內容會對這個詞條有用?’——我們搜索所有的文件,給出相關的內容。之后用戶再次回到95號公路,我們說‘好,我們認為這些內容足夠有用,讓我們更顯著地呈現這些信息吧’。”
谷歌搜索與“知識圖譜”整合的2年多里,該公司繼續改善這款產品(谷歌并未正式公布設計“知識圖譜”回答的詞條比例,不過似乎大約為25%)。最初,“知識圖譜”較為動態。不過這款產品逐漸掌握谷歌搜索本身所具有的學習能力,能夠分析用戶的習慣。莫斯利舉了“誰在電影《太空炮彈》(spaceballs)中扮演barf?”作為例子,“知識圖譜”已經接觸了非常多詞條,因而知道如何提供涉及演員和電影的圖解——并且以非常快的速度完成。
“知識圖譜”也在另一個重要領域——新鮮度——取得較大進步。由于谷歌假定對一個問題提供一個正確答案,因此其信息必須與時俱進。否則,答案會是錯誤的,對用戶造成的影響會比沒有答案更糟糕。莫斯利表示,“知識圖譜”在2012年推出的時候,其中一個實體的變化——例如大眾汽車(volkswagen)決定聘請新的首席執行官——該系統可能要花長達2周來反映這種變化。現在該系統能夠在幾分鐘內處理這些新聞并進行調整。但是她承認,對“知識圖譜”而言,這種特定的“大眾汽車首席執行官”詞條既是成功也是失敗。新任首席執行官要幾個月后才會正式上任。“知識圖譜”仍然展示當前的領導人,不過很多在谷歌輸入“大眾汽車首席執行官”詞條的用戶可能尋求的是有關繼任者的信息。因此,盡管“知識圖譜”是正確的,其回復可能不會令用戶滿意。
谷歌還需要進行很多改進。首先是增加更多領域和行業;該項目最近增加了汽車、視頻游戲及雨果獎(hugo award)獲獎者的知識。不過她表示,谷歌正嘗試找出如何提供更加復雜的結果——不再只是快速事實,還提供更主觀、更模糊的聯想。“人們不只是對事實感興趣,”她說。“他們對一些主觀性的東西也感興趣,如該電視節目是否好看。這些東西能幫助將‘知識圖譜’提升至新的級別。”這就像谷歌并不希望讓用戶感覺自己在進行機械搜索,而是咨詢一位圣人,這位圣人不僅無所不知而且在文化方面還具有自己的獨立見解。
不過這還需要走很長的路,并且由于對“知識圖譜”所提供信息的預期提升,其所犯錯誤也不斷令用戶感到失望。莫斯利最近較為煩惱,因為她意識到“知識圖譜”雖然了解電視節目的信息,但是缺乏有關新節目以及何時播出的內容。她說:“我希望有這樣的提醒,能告訴我本周有新節目播出,我也想知道哪些網站有放映,從而可以登陸觀看,”承諾最終谷歌將穿越這個“中間階段”,雖然該項目還沒有將所有東西都收入到目錄中。
談到期望提升,可能“知識圖譜”最顯眼的錯誤是谷歌在2010年夏天收購metaweb時提到的兩個問題。4年后,其搜索引擎仍然未能對“美國西岸學費低于3萬美元的大學”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”等問題提供一站式答案。
語音輸入
在意識到移動技術將變得無處不在后,谷歌決定對搜索業務進行一項細微但意義重大的調整。該公司不再將搜索詞條視為向計算機系統提交的指令,而是把所有輸入的內容都當成是對話。“很顯然,一旦你擁有這種類型的設備(他舉起手機做例證),語音輸入將變得非常重要,”本·戈麥斯說,“同樣非常明確的是,用戶說話比打字更自然。”
這種調整不僅涉及改變搜索引擎處理詞條的方式。它意味著改變我們。我們現在可以將搜索框——不管在pc或在移動端上——視為可以進行對話的對象。塔瑪爾·耶霍舒亞(tamar yehoshua) 表示:“在谷歌出現前,人們并沒有詞條的概念,我們花了多年時間教會大家使用詞條。不過,如果你以平常的方式進行交流,不必進行很認真的思考,這樣不是更輕松嗎?這會是非常美好的情景。”
進行這種變革需要2個方面。首先,谷歌的搜索引擎必須加強,從而更仔細地傾聽,對輸入的語音內容進行分析。之后谷歌必須確保當用戶向手機發出語音指示——或者在搜索框通過文字進行交流,其系統會理解用戶在說什么。
的確,谷歌已經在語音識別方面進行了一段時間的努力。“在很多年前,我們當然知道這些基礎部分——語音、自然語言處理——將具有重要意義,”耶霍舒亞說。“我們知道那些都是投資,都是科技界未曾解決的問題,我們需要花多年時間才能收獲成果。”在20世紀初的幾年里,谷歌有一項服務名為google 411,所做的事情跟用戶撥打(付費)電話號碼查詢系統時電話公司所做的事情一樣。谷歌使用那數百萬的免費電話來學會如何正確地解譯不同語言和口音的語音。這一點非常有用,不過在其他一些地方,谷歌并沒有獲得分析語音輸入所需的大約2500個短語樣本。因此,該公司開始派遣小型團隊到多個不同的地區,并在此之前在谷歌網絡發布消息稱該公司希望收集語音樣本。在印度尼西亞進行的努力具有代表意義。谷歌語音專家林奈·哈(linne ha)說:“在第二天,有900人現身。”谷歌進行這些研究的時候,會選擇在與該地區相匹配的現場條件進行收集:如在香港的街道和巴黎的地鐵路里記錄物體。
這些努力獲得了回報——谷歌搜索支持159種語言,語音搜素(voice search)現在支持其中58種語言。谷歌聲稱該應用的“錯詞率”已經降低至8%。
戈麥斯自豪地指出谷歌發展過程中的一個里程碑:他現在親自進行語音展示。“我的口音非常不標準,”這位印度裔工程師說。“我的元音發音是美國的,不過我不發r的的音。”在這個語音項目前,戈麥斯從未親自去證明谷歌在語音識別方面的努力:相反,該公司使用一位內部的專家,他具有純正的美國口音,能夠與機器和諧共處。現在,戈麥斯已經與這位專家失去聯系。“他不再是對這份工作非常重要,”他說。“我可以親自進行展示。讓我坐在記者面前,親自進行語音輸入,我對此毫不畏懼。”
谷歌還必須考慮電話向用戶回應的方式。應該像siri那樣的擬人化形象,還是使用明顯的機器人語調從而讓用戶意識到自己在跟系統對話?谷歌選擇了后者。該公司搜索設計主管瓊·威利表示,為了成功實現與一個有意識個體對話這種錯覺,他們必須達到皮克斯(pixar)般故事自動敘述能力。“我認為從具有個性的計算機到人類與之自然交流還有很長的路要走。”
不過科技迅速發展,已經足以讓谷歌(當然,也包括其他一些公司)達到研究人員數十年來所幻想的語音互動級別。“我認為三或四樣東西推動實現了這種可能性,”戈麥斯說。“顯然,計算機變得更快且運算能力變得更強。硬件——麥克風——也變得更好。軟件算法方面也有進步。不過最大的變化是我們理解語言的能力。”
費爾南多·佩雷拉(fernando pereira)是搜索部門的“杰出搜索科學家”(distinguished research scientist),過去30年他一直從事自然語言處理(nlp)工作。他表示,這幾年來,谷歌變得非常善于找出如何接收搜索詞條以及將詞條與網絡及其他其他信息庫上的文件配對。他說:“當你進行搜索的時候,很有可能你在詞條中使用的詞語會出現在部分搜索結果中。”不過將“知識圖譜”這樣的數據庫增加到搜索引擎中會帶來新的挑戰和機遇。他指出:“要預期所使用的語言是否與數據庫所設計的方式配對變得更具難度。”
一方面,這并不容易。當谷歌收到像“巨人隊在哪里打比賽?”這樣的詞條,它必須知道很多東西:該詞條涉及體育,球隊所比賽的場館等。它還必須作出選擇——這是棒球聯盟的巨人隊還是橄欖球隊?用戶希望知道的是該球隊通常在哪里打比賽,如主場,還是該球隊下周的比賽在哪里進行?谷歌使用詞條中的信號以及用戶此前的習慣來確定答案。佩雷拉說:“所有這些思考,所有的推理,都是在幾年前不能做到的。”
一旦這些障礙被去清除,谷歌的nlp系統可以憑借“知識圖譜”而實現進一步提升。“我們開始理解世界上的事物,”戈麥斯說。這讓谷歌能夠正確地猜測用戶在詢問什么,甚至即使詞條的拼寫存在錯誤或者語言輸入不太正確。戈麥斯指出,例如有人向手機說“大衛·卡梅倫(david cameron)”,系統已經知道這兩個詞通常是配對在一起的,而且還是男性——因而可以使用替代詞“他”。即使麥克風沒有太聽清楚后面說到的姓,“知識圖譜”也可以想到指的是英國首相。
谷歌懂得的東西越多,對用戶就越了解。
google now
在2004年,我問拉里·佩奇(larry page)和謝爾蓋·布林(sergey brin)對于搜索的長期展望。佩奇表示,搜索將融入到人們的大腦中。“當你考慮某些東西并且對其了解不是太多,你會自動獲得信息。”布林指出,關鍵點是,“你可以讓與你進行交流的設備或者讓關注周邊事物的計算機,提出有用的信息。”
在2010年,兩位在android部門工作的工程師巴利斯·古爾特金(baris gultekin)和安德魯·基爾斯姆(andrew kirsme)著手一項與上述展望非常相符的課外項目,從而創辦了google now。
根據古爾特金(去年從google now調任至該公司其他項目),這款產品恪守他們最初的宣傳文件。“核心的聲明是,現在大家的手機并不智能,不過它們可以變得智能,”他說。“如果我們可以將這些具有各種功能、強勁和連接互聯網的設備的能力與谷歌的能力合并在一起,那會怎么樣?”
換言之,google now可以回答那些你沒有主動提出來的詞條。這意味著將多個領域的信息合并起來,解決某些重要的事情。古爾特金表示,最開始創造一個系統來這樣做是令人恐懼的,不過他和他的合作伙伴開始分解在計算領域內可以如何實現這個目標。即使某些類似具有限制性的東西也要求系統具有實質性的知識:家和辦公室的地理位置、最佳路線、交通信息等。如果google maps知道如何在路網中導航,肯定會有幫助作用——但這恰恰就是關鍵的地方。谷歌會使用其全部能力去放大這種搜索工具。很快,他們擁有了一款優秀的應用程序來幫助通勤者。“不過我們不希望它只是作為一款通勤應用,”古爾特金表示。“我們希望它成為一位主動的助手,可以處理很多事情。”因此他們在2012年7月推出了google now,主要關注幾個領域:通勤、航班、體育比賽、附近的場所、出游、公共交通運輸以及天氣。現在,它已經覆蓋超過70個領域,并且正迅速增加。古爾特金說:“我的遠大目標是,google now向用戶提供大部分所需的信息,而其他東西都只成為備用品。”
google now的有效性取決于將對世界的了解(所有這些都是谷歌搜索以及“知識圖譜”能夠提供的)與個人信息深度融合。這正是為什么有人可能指出,這個搜索的細分部門可視為是谷歌的替代品:每一次google now及時提供信息卡,都會利用大量谷歌服務。一張普通的信息卡會將來自個人電子郵件、日程表和通訊錄的信息與公交線路安排、交通信息及天氣進行整合。
很多時候,只有在google now行動后,人們才會準確知道它干些什么。例如,當你停好車后,google now會記錄你停車并記住你停車的位置——以防你忘記了。如果你的電子郵件告訴google now你在找房子,該項服務可能會向你推送你希望居住地區的待租售房屋的照片。
隨著google now進化,它從一個課外項目發展為一項全職服務。不過其最大的助推器可能出現在2011年,當時蘋果推出了siri,這在谷歌總部引起了一些擔憂情緒,也為這個以語音為方向的項目吸引了更多資源。它成為搜索部門的一個正式組成部分,盡管該團隊實際上受命于搜索和android兩個部門。古爾特金表示:“搜索和google now都值得贊美。我們希望在用戶搜索之前就為其提供信息,不過在很多情況里,我們不知道你的水管爆裂了,你需要水管工。”
(當然, 在未來,通過谷歌旗下智能家居企業nest,谷歌將知道你家的水管何時破裂,或者你家是否著火了。古爾特金表示,整合nest“可能會在將來,但不是現在”。)
與傳統版本的搜索不同的是,google now搜索只有在你全部采用谷歌產品的情況下才能起到效果。耶霍舒亞表示:“拉里(佩奇)曾說過,搜索應該理解你的意圖并提供你所需的信息。這是一個谷歌生態系統,如果你在手機端和pc上注冊登陸后,我們可以予以利用。如果你想要獲得航班信息并追蹤你的包裹以及任何來自gmail的信息,我們都會帶給你。如果你沒有使用gmail,你就不會得到信息——不過你還是可以利用我們的語音服務并獲得答案。”
沒有其他解決辦法——如果你想要使用google now但gmail不是你默認的郵箱,你不會得到google now甚至谷歌搜索的全部價值。“如果我們可以將這些信息分享給所有人,這會是非常美好的事情。我不認為這會在明天出現。當然,蘋果也會給我們帶來壓力。”
谷歌非常刻意地不將google now作為一款獨立的產品。相反,該公司將其視為搜索應用的一部分。該應用并不是以搜索作為名稱,而是冠名“谷歌”。這種命名法不僅顯示搜索非常密切地與谷歌聯系在以前,還顯示googe now對該公司非常重要。
盡管如此,googe now部件仍是可選部件。所有人使用的時候都會考慮隱私警告;該產品看起來無所不知,但也從側面提醒我們這家巨頭對我們是多么了解。隨著谷歌對個人信息的掌控引發更多麻煩,特別是在歐洲,當地政府正推動加強監管并實施罰款,甚至威脅將其分拆,該公司希望服務大眾的雄心壯志可能會被隱私擔憂所挫敗。即使對于那些信任谷歌的人士而言,斯諾登事件證明政府可以很輕松地訪問我們的信息。如果google now知道你把車停在哪里,當地的情報部門也是如此,對吧?
辛格哈爾認為,搜索的第一個時代是以人們想象在他們與某些遙遠機器之間進行互動為標志的。現在這個新時代清除了這個障礙。我們預期電話會明白我們的意思。我們預期搜索也同樣精通于提供涉及我們個人信息的答案,因為它正在發掘來自網頁、文件和公共數據庫的信息。
“我認為搜索是所有計算的界面,”辛格哈爾說。“當設備消失或者變小,你將如何與它們互動?因為在大部分時間里,你需要采取行動——可能簡單如播放音樂,或復雜如寫便簽來提醒自己經過附近雜貨店時買牛奶。或者你想知道妻子的航班是否準點?或者奧巴馬有多高?”http://feiyi.51dzw.com/
人們可能認為這是理所當然的——他們甚至可能抱怨說谷歌搜索不再像以前那樣了。不過辛格哈爾認為,搜索已經跨越了一個他在過去幾十年所對付的障礙。辛格哈爾說:“20年來,我作為研究員未能做到這一點”,他指的是他的團隊為谷歌搜索實現的成就。他承認,有很多問題還有待解決。不過在描述詞條后面的科學時,他充滿了自豪感。當有人提出“天空為什么是藍色”這樣簡單的問題時,谷歌能夠成功地進行回應。