Concept Graph以理解自然語言
微軟推出Concept Graph,以更好的理解自然語言。微軟研究院公開了其為解決讓自然語言難以理解的困難之一而進(jìn)行的努力,這個困難就是知識。該公司認(rèn)為,背景知識是人類與機(jī)器在語言理解上的主要差別之一。
Probase是一個知識數(shù)據(jù)庫,微軟在該產(chǎn)品上開發(fā)了相當(dāng)一段時間。該數(shù)據(jù)庫是開放工具M(jìn)icrosoft Concept Graph(微軟概念圖)的基礎(chǔ)。Probase包含了540萬個概念,超過了如提供12萬個概念的Cyc等其他知識數(shù)據(jù)庫。
所有這些互聯(lián)信息的目標(biāo)是混合解釋與可能性以支持文本分析,非常類似人類使用排除法完成同樣任務(wù)的方法。例如,如果我說“the man ran from the stranger with the knife”,你最可能理解為這個人逃離了一個手拿刀的陌生人。但這個句子的意思也可以是你從陌生人手中奪走了刀并逃離。
但逃跑意味著害怕,刀與害怕有關(guān),因此最簡單、最直接的解釋占據(jù)優(yōu)勢,即使可能不是很準(zhǔn)確。微軟的Concept Tagging Model(概念標(biāo)簽?zāi)P停┮源藶榛A(chǔ)開發(fā)以用相同概率想法對文本進(jìn)行分類映射。接著上面的例子,刀也可指廚房用具或武器,但從上下文看,最可能是武器而不是從博物館中偷來的17世紀(jì)餐刀。
廚房用具和武器都是相對普遍的東西,但博物館的藝術(shù)品有點長尾概念。微軟的模型規(guī)模宏大,同時考慮了高度可能性和極度不可能性以解釋屬性、子語境和關(guān)系。今天發(fā)布的版本可對任何文本詞條排定分類相關(guān)性。微軟基礎(chǔ)級概念化將優(yōu)先排定有效和合適種類以及其他方法如MI、PMI、PMIk和Typicality。
未來版將能包含他們稱的“根據(jù)語境的單個實例概念化”,基本上將“陌生人”和“刀”與所代表的意思聯(lián)系起來。對更長遠(yuǎn)的未來,該團(tuán)隊希望解決“短文本概念化”,甚至進(jìn)一步拓寬在搜索、廣告和AI內(nèi)的應(yīng)用范圍。
2898站長資源平臺友情鏈接交換:http://www.afrimangol.com/friendchange.htm

商機(jī)加盟
更多友鏈買賣
更多網(wǎng)站 | 權(quán)重 | 銷量 |
---|---|---|
七七三好服游戲網(wǎng) | 2 | 26 |
金融理財網(wǎng) | 5 | 2 |
中國建筑網(wǎng) | 6 | 38 |
考試信息網(wǎng) | 5 | 39 |
yy分類目錄 | 6 | 102 |
81396網(wǎng)址大全 | 5 | 17 |
學(xué)習(xí)驛站 | 6 | 359 |
藍(lán)鳥號-創(chuàng)業(yè)好幫手 | 6 | 247 |
家電中華網(wǎng) | 5 | 1 |
河南中華網(wǎng) | 7 | 8 |
熱門文章
相關(guān)資訊