系統(tǒng)之家 - 系統(tǒng)光盤(pán)下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細(xì)頁(yè)面

微軟將開(kāi)源數(shù)據(jù)庫(kù) 增強(qiáng)機(jī)器的閱讀理解能力

編輯:jiayuan 2016-12-19 15:44:04 來(lái)源于:網(wǎng)易科技頻道

  溝通是任何事物了解彼此的最大障礙,學(xué)習(xí)、理解不同的語(yǔ)言是它的基礎(chǔ)。據(jù)悉為了解決機(jī)器與人類(lèi)溝通的難題,微軟將發(fā)布一個(gè)免費(fèi)的數(shù)據(jù)庫(kù)來(lái)幫助機(jī)器創(chuàng)建更多的對(duì)話(huà)。

微軟將開(kāi)源數(shù)據(jù)庫(kù) 增強(qiáng)機(jī)器的閱讀理解能力

  該數(shù)據(jù)庫(kù)名為微軟機(jī)器閱讀理解數(shù)據(jù)庫(kù)(簡(jiǎn)稱(chēng)MS MARCO),包含有10萬(wàn)條英文查詢(xún)及對(duì)應(yīng)回答。用來(lái)幫助人工智能系統(tǒng)更好地理解人類(lèi)語(yǔ)言。

  微軟合作伙伴集團(tuán)項(xiàng)目經(jīng)理Rangan Majumder在周五的一篇博客中提到,微軟將免費(fèi)開(kāi)放MS MARCO,并希望能夠與其他機(jī)構(gòu)合作來(lái)更好地提高機(jī)器的閱讀理解能力。

  數(shù)據(jù)庫(kù)中的資料來(lái)源于必應(yīng)搜索和Cortana,并做相應(yīng)的匿名處理。對(duì)問(wèn)題的回答則是基于互聯(lián)網(wǎng)、人類(lèi)手工編寫(xiě)以及經(jīng)過(guò)驗(yàn)證的信息。這些查詢(xún)和回復(fù)將用于建立深度學(xué)習(xí)模型。

  當(dāng)前,該數(shù)據(jù)庫(kù)將對(duì)非商業(yè)用途的用戶(hù)提供免費(fèi)下載。同其他人工智能數(shù)據(jù)庫(kù)開(kāi)源計(jì)劃類(lèi)似,微軟也將采用同樣的方式開(kāi)源MS MARCO。

  其中的一項(xiàng)是ImageNet,可用于訓(xùn)練圖像識(shí)別算法的圖片標(biāo)記數(shù)據(jù)庫(kù)。微軟此前在開(kāi)發(fā)圖片識(shí)別技術(shù)時(shí)用到ImageNet,現(xiàn)在又用該數(shù)據(jù)庫(kù)來(lái)強(qiáng)化微軟計(jì)算機(jī)視覺(jué)API等產(chǎn)品。如果想了解更多有關(guān)MS MARCO的信息,可下載其研發(fā)團(tuán)隊(duì)發(fā)表的論文。該團(tuán)隊(duì)還在進(jìn)行另外一項(xiàng)挑戰(zhàn),用MARCO的數(shù)據(jù)來(lái)評(píng)估訓(xùn)練模型,而評(píng)估腳本也還在研發(fā)中。

  這項(xiàng)開(kāi)源計(jì)劃也是微軟進(jìn)一步發(fā)展其人工智能的舉重要措。微軟一直以來(lái)都在打造基于機(jī)器學(xué)習(xí)和人工智能的Azure云平臺(tái),同時(shí)在Office和Windows中也加入了一些人工智能的特性。本周早些時(shí)候,微軟推出了QnA Maker云服務(wù),用于降低開(kāi)發(fā)者研制問(wèn)答聊天機(jī)器人的難度。

  人工智能的每一絲進(jìn)步,都離不開(kāi)工程師與海量信息的幕后支持。隨著微軟開(kāi)源計(jì)劃的實(shí)施,人工智能領(lǐng)域無(wú)疑迎來(lái)了更進(jìn)一步的契機(jī)!或許未來(lái)的某一天,機(jī)器真的能和人溝通呢。

標(biāo)簽 微軟

發(fā)表評(píng)論

0

沒(méi)有更多評(píng)論了

評(píng)論就這些咯,讓大家也知道你的獨(dú)特見(jiàn)解

立即評(píng)論

以上留言?xún)H代表用戶(hù)個(gè)人觀點(diǎn),不代表系統(tǒng)之家立場(chǎng)

掃碼關(guān)注
掃碼關(guān)注

官方交流群 軟件收錄