系統(tǒng)之家 - 系統(tǒng)光盤下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細(xì)頁面

二代機(jī)器人“張小明”寫稿技術(shù)超越了第一代

編輯:chenbing 2016-08-12 16:10:08 來源于:互聯(lián)網(wǎng)

  據(jù)悉,我們所看到的奧運(yùn)精彩賽事的報(bào)道有可能是機(jī)器人些的。機(jī)器人寫新聞?沒錯(cuò),這個(gè)機(jī)器人就是由今日頭條實(shí)驗(yàn)室推出的,其名叫作“張小明”。據(jù)了解,張小明的寫稿技術(shù)屬于第二代,其最大的特點(diǎn)在于,它可以滿足人們對長尾新聞的閱讀需求。

  奧運(yùn)會(huì)開幕后,眾多用戶都通過新聞客戶端第一時(shí)間了解比賽的賽況。比如,你可能看到了這樣一條有關(guān)乒乓球女單比賽的新聞:

  “丁寧本輪的對手是現(xiàn)世界排名第7的韓英,實(shí)力不俗。但經(jīng)過4場大戰(zhàn)的激烈較量,最終,丁寧還是以總比分4:0戰(zhàn)勝對手,笑到了最后,為中國延續(xù)了在這個(gè)系列賽事中最終奪冠的機(jī)會(huì)。”

二代機(jī)器人“張小明”寫稿技術(shù)超越了第一代

  值得注意的是,這條超過5.4萬閱讀量的新聞并不是出自記者、編輯之手,而是由機(jī)器人寫成。這個(gè)機(jī)器人名叫“張小明”,由今日頭條實(shí)驗(yàn)室推出,其“寫稿”模塊是由頭條實(shí)驗(yàn)室與北京大學(xué)計(jì)算所(萬小軍團(tuán)隊(duì))聯(lián)合研發(fā)而成。可以通過兩種文本生成技術(shù)產(chǎn)出新聞:一是針對數(shù)據(jù)庫中表格數(shù)據(jù)和知識(shí)庫生成自然語言的比賽結(jié)果報(bào)道,即簡訊;二是利用體育比賽文字直播精煉合成比賽過程的總結(jié)報(bào)道,即資訊。

  據(jù)了解,張小明主要報(bào)道乒乓球、網(wǎng)球、羽毛球和女足的比賽,以2秒種的生成時(shí)間,發(fā)布著每一場賽事的新聞稿,6天共生成超200篇簡訊和資訊。

  此前,國內(nèi)也有了一些機(jī)器人寫稿的嘗試,張小明的寫稿技術(shù)已經(jīng)進(jìn)入是第二代寫稿水平。與第一代機(jī)器人相比 ,張小明特征包括:速度快、樣式多、自適應(yīng)、自動(dòng)配圖等。

  今日頭條相關(guān)人士對TechWeb表示,張小明最大的意義在于,面對奧運(yùn)會(huì)這樣同時(shí)舉行上百場比賽的綜合賽事,記者很難關(guān)注到每一場比賽,而機(jī)器人可以任勞任怨的為每一場比賽報(bào)道,無論這場比賽多么冷門和不重要。“傳統(tǒng)新聞理論并不認(rèn)為這些冷門比賽或者熱門比賽(比如乒乓球)的前幾輪小組賽有新聞價(jià)值,可是通過我們的平臺(tái)測試,我們發(fā)現(xiàn)對冷門場次的報(bào)道任然有可觀的閱讀量,這個(gè)閱讀量非常長尾,而新聞機(jī)器人可以彌補(bǔ)對這種長尾的新聞需求。”

  機(jī)器人寫新聞稿雖說不是頭一回了,但隨著科技的進(jìn)步,機(jī)器人如何能夠更好的寫出精彩的新聞是值得大家關(guān)注的。特別是當(dāng)人無法面對像奧運(yùn)這樣百場賽事的長尾新聞的報(bào)道,機(jī)器人是至關(guān)重要的。

發(fā)表評(píng)論

0

沒有更多評(píng)論了

評(píng)論就這些咯,讓大家也知道你的獨(dú)特見解

立即評(píng)論

以上留言僅代表用戶個(gè)人觀點(diǎn),不代表系統(tǒng)之家立場

掃碼關(guān)注
掃碼關(guān)注

官方交流群 軟件收錄