QQ在線客服

Concept Graph以理解自然語言

2016-11-03 11:46 來源: 站長資源平臺 瀏覽(756)人   

    微軟推出Concept Graph,以更好的理解自然語言。微軟研究院公開了其為解決讓自然語言難以理解的困難之一而進(jìn)行的努力,這個困難就是知識。該公司認(rèn)為,背景知識是人類與機(jī)器在語言理解上的主要差別之一。


微軟Concept Graph以理解自然語言


    Probase是一個知識數(shù)據(jù)庫,微軟在該產(chǎn)品上開發(fā)了相當(dāng)一段時間。該數(shù)據(jù)庫是開放工具M(jìn)icrosoft Concept Graph(微軟概念圖)的基礎(chǔ)。Probase包含了540萬個概念,超過了如提供12萬個概念的Cyc等其他知識數(shù)據(jù)庫。


    所有這些互聯(lián)信息的目標(biāo)是混合解釋與可能性以支持文本分析,非常類似人類使用排除法完成同樣任務(wù)的方法。例如,如果我說“the man ran from the stranger with the knife”,你最可能理解為這個人逃離了一個手拿刀的陌生人。但這個句子的意思也可以是你從陌生人手中奪走了刀并逃離。


    但逃跑意味著害怕,刀與害怕有關(guān),因此最簡單、最直接的解釋占據(jù)優(yōu)勢,即使可能不是很準(zhǔn)確。微軟的Concept Tagging Model(概念標(biāo)簽?zāi)P停┮源藶榛A(chǔ)開發(fā)以用相同概率想法對文本進(jìn)行分類映射。接著上面的例子,刀也可指廚房用具或武器,但從上下文看,最可能是武器而不是從博物館中偷來的17世紀(jì)餐刀。


    廚房用具和武器都是相對普遍的東西,但博物館的藝術(shù)品有點長尾概念。微軟的模型規(guī)模宏大,同時考慮了高度可能性和極度不可能性以解釋屬性、子語境和關(guān)系。今天發(fā)布的版本可對任何文本詞條排定分類相關(guān)性。微軟基礎(chǔ)級概念化將優(yōu)先排定有效和合適種類以及其他方法如MI、PMI、PMIk和Typicality。


    未來版將能包含他們稱的“根據(jù)語境的單個實例概念化”,基本上將“陌生人”和“刀”與所代表的意思聯(lián)系起來。對更長遠(yuǎn)的未來,該團(tuán)隊希望解決“短文本概念化”,甚至進(jìn)一步拓寬在搜索、廣告和AI內(nèi)的應(yīng)用范圍。


    2898站長資源平臺友情鏈接交換:http://www.afrimangol.com/friendchange.htm 


【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息發(fā)郵件至 kefu@2898.com ,我們將及時溝通與處理。 本站內(nèi)容除了2898站長資源平臺( www.afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容,涉及言論、版權(quán)與本站無關(guān)。