科技訊 11月22日下午消息,近日在微軟小冰年度研究進(jìn)展分享會上,微軟小冰三大首席科學(xué)家分享了小冰近期的技術(shù)突破,包括唱歌、會比喻等。
2019年8月15日,微軟正式推出了第七代小冰。微軟小冰首席NLP科學(xué)家武威認(rèn)為,Self-Complete(自我完備)可以很好地概括近些年來微軟在小冰身上的研究成果。一個能夠自我完備的對話機(jī)器人應(yīng)該擁有幾項能力:學(xué)習(xí)、自主管理、連結(jié)。
“我認(rèn)為這三項能力貫穿起來就構(gòu)成了一條縱線,貫穿了對話機(jī)器人這些年來,甚至可能是未來一段時間整個的研究與發(fā)展。” 武威表示,其實還有一條橫線,橫線就是微軟小冰核心對話引擎的進(jìn)化。小冰一開始做檢索模型,通過重用已有的人類的對話來實現(xiàn)人機(jī)交互,后來團(tuán)隊又做生成模型,讓小冰自己能夠去合成回復(fù),再到后來做共感模型,希望小冰能夠自主的去把握整個的對話流程。
“這條橫線和那條縱線實際上交錯在一起,構(gòu)成了一幅對話機(jī)器人發(fā)展的絢爛畫卷?!?/p>
其中,學(xué)習(xí)包括能夠從人類的對話中學(xué)習(xí)怎樣說話,以及機(jī)器人之間互相學(xué)習(xí)。
武威透露,團(tuán)隊今年嘗試了讓兩個機(jī)器人通過互相學(xué)習(xí)來共同進(jìn)步。即讓兩個檢索模型在訓(xùn)練過程中互為師生,互相交流。在每一次迭代的時候,一個模型都把它從數(shù)據(jù)中學(xué)到的知識傳達(dá)給另外一個模型,同時又從另外一個模型中接觸到它的知識,然后這兩個模型互相學(xué)習(xí),最終希望能夠得到共同的進(jìn)步。
微軟小冰首席語音科學(xué)家欒劍提到了小冰唱歌技術(shù)的進(jìn)展。他透露,小冰是從2016年開始做唱歌的,之后經(jīng)過努力,小冰在語音合成領(lǐng)域一些大的問題已經(jīng)被解決了,團(tuán)隊就開始尋找一個更有挑戰(zhàn)性的課題繼續(xù)來做,所以就選擇了唱歌。
選擇唱歌主要有三個原因:唱歌的門檻比說話高,在技術(shù)上有難點;情感表達(dá)上更加豐富激烈一些,歌曲是一種喜聞樂見的形式;它是一個很重要的娛樂形式,唱歌做好了,應(yīng)該是很有市場前景、很有方向的。
深度學(xué)習(xí)其中一個很重要的支撐就是數(shù)據(jù),現(xiàn)在有大數(shù)據(jù)的支持才能夠把深度學(xué)習(xí)做的這么好。而“對唱歌這個任務(wù)來說,數(shù)據(jù)其實是比較困難的,因為相對于說話來說,清唱的數(shù)據(jù)是非常少,絕大部分的數(shù)據(jù)是混雜的、伴奏的音軌?!睓鑴Ρ硎?,團(tuán)隊曾經(jīng)和唱片公司進(jìn)行合作,利用了其數(shù)據(jù)庫中已有的混合了伴奏的數(shù)據(jù)進(jìn)行很好的學(xué)習(xí)。
據(jù)悉,小冰唱歌也有一定的商業(yè)化前景,比如其日本分身已經(jīng)與唱片公司簽約。
欒劍總結(jié)認(rèn)為,接下來不管是人工智能創(chuàng)造,還是唱歌提高上,都要兩條腿走路,一邊要不斷提高模型,一邊要不斷挖據(jù)更多的數(shù)據(jù),這兩個東西如果做的更好,質(zhì)量會不斷得到提高。
小冰目前除了寫詩、會畫畫、會作曲、會唱歌,今年另一個進(jìn)展是可以創(chuàng)造比喻。微軟小冰首席科學(xué)家宋睿華表示,希望小冰真正創(chuàng)造出人類不曾說過的比喻,而不是在人類已有的文章里去挖掘這種比喻句,不要用“像”、“就像”、“一樣”這樣子的模板把它挖掘出來。
為了幫助小冰學(xué)會“比喻”這項技能,宋睿華透露,他們從復(fù)雜的詩歌中挑選了6大類,每類122個主題,并通過小冰聊天日志過濾出了包括愛情、內(nèi)心、世界、母親、美麗、人類在內(nèi)的96個常用比喻概念。隨后從1000個常用詞中選取了3000個最常用的形容詞擴(kuò)充小冰的比喻能力。
比如愛情與國足,它們共同的相關(guān)詞匯可能有未來、虛幻,那么小冰就可以作出“愛情就像國足,未來都是虛幻的”這樣自然的比喻句。
“我們其實想讓小冰更像人,你會發(fā)現(xiàn)除了工作,聽音樂是你很大的一個享受。我覺得人跟動物的不同在于有一定的自主性,人工智能創(chuàng)造體現(xiàn)了一種自主性,包括作曲、寫詩、畫畫,我們做算法的人也不知道最后會產(chǎn)生什么樣的結(jié)果,你在那一瞬間就會有一個錯覺,覺得她有意識,這是非常好的一個點?!彼晤HA表示。(雪梅)