IT之家 12 月 31 日消息,日本大阪大學(xué) 12 月 23 日發(fā)布公報(bào)說,該校領(lǐng)導(dǎo)的研究小組開發(fā)出一種動(dòng)態(tài)面部表情合成技術(shù),可使人形機(jī)器人更好地表達(dá)情緒狀態(tài),如興奮或困倦。這項(xiàng)技術(shù)有望顯著提升交流型機(jī)器人的價(jià)值,使它們能夠以更自然、更像人類的方式與人類交換信息,有望解決“恐怖谷”問題。
IT之家注:恐怖谷理論是一個(gè)關(guān)于人類對機(jī)器人和非人類物體的感覺的假設(shè),在 1970 年被日本機(jī)器人專家森昌弘提出。當(dāng)機(jī)器人與人類的相似程度達(dá)到一個(gè)特定程度的時(shí)候,人類對他們的反應(yīng)便會(huì)突然變得極其負(fù)面和反感,哪怕機(jī)器人與人類只有一點(diǎn)點(diǎn)的差別,都會(huì)顯得非常顯眼刺目,從而整個(gè)機(jī)器人有非常僵硬恐怖的感覺。
據(jù)公報(bào)介紹,雖然人形機(jī)器人可以微笑、皺眉或表現(xiàn)出其他各種熟悉的表情,但要在這些表情背后找到一致的情感狀態(tài)卻很困難,令人無法確定它的真正感受,從而讓人產(chǎn)生一種不適感。
傳統(tǒng)上,人形機(jī)器人的面部表情采用“拼湊法”來實(shí)現(xiàn)。這種方法需要準(zhǔn)備多個(gè)預(yù)先設(shè)定的動(dòng)作場景,以確保在這些場景之間切換時(shí)避免不自然的面部動(dòng)作。但在實(shí)際運(yùn)用中充滿挑戰(zhàn),不僅需要提前準(zhǔn)備復(fù)雜的動(dòng)作場景,在過渡過程中盡量減少不自然的動(dòng)作,還要微調(diào)動(dòng)作以精細(xì)控制所傳達(dá)的表情。
在這項(xiàng)新研究中,大阪大學(xué)等機(jī)構(gòu)人員開發(fā)出一種借助“波形運(yùn)動(dòng)”的動(dòng)態(tài)面部表情合成技術(shù)。該技術(shù)將各種構(gòu)成表情的面部動(dòng)作表示為單獨(dú)的波,如眨眼、打哈欠等。這些波被傳播到相關(guān)的面部區(qū)域并疊加起來,從而實(shí)時(shí)生成復(fù)雜的面部表情。該方法不需要提前準(zhǔn)備復(fù)雜多樣的動(dòng)作數(shù)據(jù),同時(shí)避免了不自然的面部動(dòng)作過渡。
這種技術(shù)還可以根據(jù)機(jī)器人的內(nèi)部狀態(tài)調(diào)整個(gè)別波形,可以使機(jī)器人的內(nèi)部條件變化即時(shí)反映為面部動(dòng)作的變化。
研究人員表示,在該技術(shù)輔助下,具備復(fù)雜面部動(dòng)作的機(jī)器人將能夠展現(xiàn)更生動(dòng)的表情,并且能夠根據(jù)周圍環(huán)境變化展現(xiàn)情緒變化,這將極大豐富人與機(jī)器人之間的交流。
相關(guān)論文已發(fā)表在日本《機(jī)器人與機(jī)電一體化雜志》上,IT之家附論文鏈接如下: