微軟推Concept Graph
發布時間:2016/11/3 10:04:32 訪問次數:872
probase是一個知識數據庫,微軟在該產品上開發了相當一段時間。
- 51電子網公益庫存:
- M12L2561616A
- M25P10-AVMN6PB
- M51957B
- M82C55A-2
- N25W128A11EF740
- NC7ST04M5X
- NC7SZ08M5X
- NC7SZ86M5X
- OB2263
- OB3396AP
- OPA2244NA/250
- P20NM50FP
所有這些互聯信息的目標是混合解釋與可能性以支持文本分析,非常類似人類使用排除法完成同樣任務的方法。例如,如果我說“the man ran from the stranger with the knife”,你最可能理解為這個人逃離了一個手拿刀的陌生人。但這個句子的意思也可以是你從陌生人手中奪走了刀并逃離。
但逃跑意味著害怕,刀與害怕有關,因此最簡單、最直接的解釋占據優勢,即使可能不是很準確。微軟的concept tagging model(概念標簽模型)以此為基礎開發以用相同概率想法對文本進行分類映射。接著上面的例子,刀也可指廚房用具或武器,但從上下文看,最可能是武器而不是從博物館中偷來的17世紀餐刀。
廚房用具和武器都是相對普遍的東西,但博物館的藝術品有點長尾概念。微軟的模型規模宏大,同時考慮了高度可能性和極度不可能性以解釋屬性、子語境和關系。今天發布的版本可對任何文本詞條排定分類相關性。微軟基礎級概念化將優先排定有效和合適種類以及其他方法如mi、pmi、pmik和typicality。
未來版將能包含他們稱的“根據語境的單個實例概念化”,基本上將“陌生人”和“刀”與所代表的意思聯系起來。對更長遠的未來,該團隊希望解決“短文本概念化”,甚至進一步拓寬在搜索、廣告和ai內的應用范圍。
據美國媒體報道,微軟研究院公開了其為解決讓自然語言難以理解的困難之一而進行的努力,這個困難就是知識。該公司認為,背景知識是人類與機器在語言理解上的主要差別之一。probase是一個知識數據庫,微軟在該產品上開發了相當一段時間。
- 51電子網公益庫存:
- M12L2561616A
- M25P10-AVMN6PB
- M51957B
- M82C55A-2
- N25W128A11EF740
- NC7ST04M5X
- NC7SZ08M5X
- NC7SZ86M5X
- OB2263
- OB3396AP
- OPA2244NA/250
- P20NM50FP
所有這些互聯信息的目標是混合解釋與可能性以支持文本分析,非常類似人類使用排除法完成同樣任務的方法。例如,如果我說“the man ran from the stranger with the knife”,你最可能理解為這個人逃離了一個手拿刀的陌生人。但這個句子的意思也可以是你從陌生人手中奪走了刀并逃離。
但逃跑意味著害怕,刀與害怕有關,因此最簡單、最直接的解釋占據優勢,即使可能不是很準確。微軟的concept tagging model(概念標簽模型)以此為基礎開發以用相同概率想法對文本進行分類映射。接著上面的例子,刀也可指廚房用具或武器,但從上下文看,最可能是武器而不是從博物館中偷來的17世紀餐刀。
廚房用具和武器都是相對普遍的東西,但博物館的藝術品有點長尾概念。微軟的模型規模宏大,同時考慮了高度可能性和極度不可能性以解釋屬性、子語境和關系。今天發布的版本可對任何文本詞條排定分類相關性。微軟基礎級概念化將優先排定有效和合適種類以及其他方法如mi、pmi、pmik和typicality。
未來版將能包含他們稱的“根據語境的單個實例概念化”,基本上將“陌生人”和“刀”與所代表的意思聯系起來。對更長遠的未來,該團隊希望解決“短文本概念化”,甚至進一步拓寬在搜索、廣告和ai內的應用范圍。
據美國媒體報道,微軟研究院公開了其為解決讓自然語言難以理解的困難之一而進行的努力,這個困難就是知識。該公司認為,背景知識是人類與機器在語言理解上的主要差別之一。上一篇:AI-人類混合智能時代
下一篇:科學家研發新型無人機