91青青青国产在观免费2019,国产精品一区二区不卡乱伦

微信咨詢

咨詢QQ

咨詢電話

公眾號

TOP

首頁 > 知識 > 科技前沿

能提前“復制”人類微笑！AI融入人類社交世界成為可能？

來源：學術(shù)頭條

發(fā)布時間：2024-04-01

瀏覽次數(shù)：1376

版權(quán)歸原作者所有，如有侵權(quán)，請聯(lián)系我們

ChatGPT 等大型語言模型（LLM）的出現(xiàn)，讓機器人具備了如同人類一般的語言表達能力。然而，機器人在與人類交談時，其面部表情卻依然顯得很不自然，甚至充滿了恐懼感。

這無疑會阻礙人與機器溝通的意愿，讓兩者的溝通變得十分困難。

因此，在未來人機共存的時代，設(shè)計一個不僅能做出各種面部表情，而且知道何時使用這些表情的機器人，至關(guān)重要。

如今，來自哥倫比亞大學的研究團隊及其合作者便邁出了重要一步——制造了一個披著硅片、能夠預測人類面部表情并同步執(zhí)行表情的機器人 Emo。它甚至可以在人類微笑前約 840 毫秒（約 0.9 秒）預測即將出現(xiàn)的微笑。

據(jù)介紹，它能與人進行眼神交流，并利用兩個人工智能（AI）模型在人微笑之前預測并“復制”人的微笑。研究團隊表示，這是機器人在準確預測人類面部表情、改善互動以及建立人類與機器人之間信任方面的一大進步。

相關(guān)研究論文以“Human-robot facial coexpression”為題，已于今天發(fā)表在科學期刊 Science Robotics 上。哥倫比亞大學機械工程系博士?Yuhang Hu?為該論文的第一作者和共同通訊作者，他的導師、哥倫比亞大學教授?Hod Lipson?為該論文的共同通訊作者。

圖｜Yuhang Hu 與 Emo 面對面。（來源：Creative Machines Lab）

在一篇同期發(fā)表在 Science Robotics 的 FOCUS 文章中，格拉斯哥大學計算社會認知教授 Rachael Jack 評價道：

“人類社交互動本質(zhì)上是多模式的，涉及視覺和聽覺信號的復雜組合，雖然 Hu 及其同事的研究集中在單一模式——面部表情上，但他們的成果在為開發(fā)更復雜的多模態(tài)信號的社交同步技能方面做出了巨大的貢獻?！?/p>

在她看來，盡管這是一個復雜的跨學科工作，但“真正使社交機器人融入人類社交世界是可能的”。

Emo 微笑了，但也不僅僅是“微笑”

如果你走到一個長著人類腦袋的機器人面前，它先對你微笑，你會怎么做？你很可能會回以微笑，也許會覺得你們兩個在真誠地交流。

但是，機器人怎么知道如何做到這一點呢？或者更好的問題是，它怎么知道如何讓你回以微笑？

為此，Yuhang Hu 及其同事需要解決兩大難題：一是如何以機械方式設(shè)計一個表情豐富的機器人面部，這涉及復雜的硬件和執(zhí)行機制；二是知道該生成哪種表情，以使它們看起來自然、及時和真實。

據(jù)論文描述，Emo 配備了 26 個致動器，頭部覆蓋有柔軟的硅膠皮膚，并配有磁性連接系統(tǒng)，從而便于定制和快速維護。為了實現(xiàn)更逼真的互動，研究團隊在 Emo 每只眼睛的瞳孔中都集成了高分辨率攝像頭，使其能夠進行眼神交流，這對非語言交流至關(guān)重要。

圖｜Robot face 平臺

另外，他們還開發(fā)了兩個人工智能模型：其中一個通過分析目標面部的細微變化預測人類面部表情，另一個則利用相應的面部表情生成運動指令。第一個模型是通過觀看網(wǎng)絡(luò)視頻進行訓練的，而第二個模型則是通過讓機器人觀看自己在實時攝像機畫面上的表情來訓練的。他們通過與其他基線進行定量評估，證明了這兩個模型的有效性。