久久精品国产99国产精2020丨,亚洲成αv人片在线观看,www.黄色av免费,亚洲黄色在线,福利无码视频世界,欧美色综合一区二区三区,2017夜夜爱毛片

人工智能新方向:像總統(tǒng)一樣發(fā)表政治演講

來源:網(wǎng)絡(luò)

點(diǎn)擊:1230

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: 人工智能,總統(tǒng),演講

      美國馬薩諸塞大學(xué)研究人員Valentin Kassarnig為我們帶來了答案,他開發(fā)了一套撰寫政治演講稿的人工智能(AI)機(jī)器算法,機(jī)器寫出的講稿幾乎可以以假亂真。經(jīng)典的政治演講少之又少,普普通通的演講倒是很多,比如美國國會的辯論演講。這些演講大多千篇一律,都遵循標(biāo)準(zhǔn)的格式,重復(fù)相似的論調(diào),甚至使用一樣的短語來表述特定的政治立場和觀點(diǎn)。看起來好像背后有一套算法在決定它的內(nèi)容。于是它引導(dǎo)我們?nèi)ニ伎家粋€(gè)有趣的問題:有沒有可能讓機(jī)器自動(dòng)撰寫政治演講稿呢?

      分析文本預(yù)測單詞

      從表面上看,基本原理還是很簡單的。Kassarnig首先建了一個(gè)數(shù)據(jù)庫,從53場美國國會辯論中抽取4000個(gè)政治演講片斷,編成一套“機(jī)器學(xué)習(xí)”算法,讓它自動(dòng)撰寫稿件。這些政治演講由5萬多個(gè)句子組成,平均每個(gè)句子包涵23個(gè)單詞。凱斯塞寧將演講按政黨進(jìn)行分類,比如哪些是民主黨的,哪些是共和黨的,看它們是否贊同或者反對某個(gè)特定的主題。

      魔鬼在于細(xì)節(jié),分析數(shù)據(jù)庫是最大的挑戰(zhàn)。在嘗試了許多種技術(shù)之后,Kassarnig最終采用了基于“N-grams(元語法模型即馬爾可夫模型)”的方法。他首先用詞類法分析文本,也就是用語法規(guī)則來給每一個(gè)詞語和短語作標(biāo)志(標(biāo)為名詞、動(dòng)詞、形容詞等)。然后分析第6個(gè)詞或者短語,根據(jù)前5個(gè)詞或者短語判斷第6個(gè)詞或者短語最有可能是什么。Kassarnig說:“只要看它前面是5個(gè)是什么,我們就可以很快確定所有的單詞。”

      在分析詞的過程中演講稿會同步生成。Kassarnig需要告訴算法寫什么類型的演講稿,比如是給民主黨寫還是給共和黨寫。算法最開始會按給定的類別搜索6個(gè)詞或者短語組成的數(shù)據(jù)庫,然后用5個(gè)詞或者短語作為起點(diǎn)來撰寫演講稿。

      算法的寫作從隨機(jī)選擇的5個(gè)詞或者短語開始,然后選擇可以與之相關(guān)聯(lián)的下一個(gè)單詞。Kassarnig說:“跟著系統(tǒng)就會自動(dòng)一個(gè)接一個(gè)地預(yù)測單詞,并最終預(yù)測演講的結(jié)尾。”

      整個(gè)過程有一些技巧。例如,算法會知道演講中最可能出現(xiàn)的特定主題是什么,然后它會挑選其它主題嵌入到演講中去,它還要決定如何修飾這些主題。

      機(jī)器的政治寫作水平挺高

      下面是機(jī)器寫的一則民主黨講稿:

      “議長先生,多年來,因?yàn)槭艿狡飘a(chǎn)法的保護(hù),誠實(shí)而不幸的消費(fèi)者可以為自己的案子進(jìn)行申訴了,最終他們合理而有效地償還了債務(wù)。系統(tǒng)所采用的方法是管用的,破產(chǎn)法院會評估各種情況,如收入、資產(chǎn)、債務(wù),從而決定哪些債務(wù)應(yīng)該償還,決定消費(fèi)者如何自力更生。讓我們支持增長和機(jī)會,請通過這項(xiàng)立法。”

      寫出來的文稿還算通順,畢竟Kassarnig的人工智能算法還沒有接受過訓(xùn)練,它只是在最開始時(shí)作了標(biāo)記,并對政治演講按6個(gè)詞組或者短語進(jìn)行過一番分析。他用一些標(biāo)準(zhǔn)對演講稿進(jìn)行評估,比如檢查語法正確性、句子過渡、講稿結(jié)構(gòu)和內(nèi)容,評估發(fā)現(xiàn)機(jī)器寫的東西很不錯(cuò)。Kassarnig說:“特別值得欣慰的是講稿的語法很正確,句子過渡也非常流暢。”

      盡管如此,讓機(jī)器算法走上政治舞臺,Kassarnig并不樂觀:“盡管算法的確可以為政治家撰寫演講稿,但它的結(jié)果不太可能好。”愿意使用這套算法的政客沒幾個(gè)。

      幸好算法還可以用來撰寫其它類型的文本,比如新聞,只要根據(jù)同樣的事件給它們提供一些故事就可以了。它還可以用來寫博客,只要為它準(zhǔn)備一個(gè)很大的數(shù)據(jù)庫,在里面裝滿相似的文章就行了。

      凱斯塞寧希望大家都來試一試,他已經(jīng)將源代碼發(fā)布在GitHub上,快去試下吧。

    (審核編輯: 智匯張瑜)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請聯(lián)系我們刪除。