作者LimYoHwan (gosu mage)
看板Stock
標題[情報] Tiktok發佈AI模型「OmniHuman-1」
時間Fri Feb 7 13:53:28 2025
標題:
字節跳動發布AI模型「OmniHuman-1」:讓黃仁勳變Rapper、泰勒絲唱日文歌…網讚超逼
真
來源:
Blocktempo
網址:
https://tinyurl.com/mtuddvts
內文:
在中國 AI 新創公司 DeepSeek 上月向全球 AI 界投下震撼彈之後,TikTok 母公司字節
跳動近期也吸引了全球 AI 界的關注。據《Forbes》報導,字節跳動在 2 月 5 日公佈了
其最新 AI 模型 OmniHuman-1,該模型允許用戶僅透過一張靜態圖片加上搭配的音頻,就
能生成一個栩栩如生的影片,包括人物說話時的口型、手勢等細節,都能得到細緻的刻畫
。
目前社群上已經有釋出部分 OmniHuman-1 使用成果,例如:黃仁勳唱 Rap、愛因斯坦演
講、泰勒絲唱青鳥…效果相當逼真。紐約大學教授 Samantha G. Wolfe 就表示:
從技術角度來看,僅僅根據一張圖片,就能創造出來看起來真的會說話、會動的人物形象
,這非常令人著迷。
OmniHuman-1 特性有哪些?
據官方說明,OmniHuman-1 的關鍵特性包括:
多模態輸入:OmniHuman-1 模型支援文本、語音和影片等多種輸入形式,由此生成的數位
人物可以在不同的場景中展示出豐富的情感與動作;
高質量輸出:OmniHuman-1 由於具備先進的深度學習技術,能夠生成包含真人、動漫人物
、3D 人物等高質量數位形象,可用於直播、娛樂、教育等眾多場景;
實時生成:OmniHuman-1 具備實時生成的能力,在互動中,用戶能夠即時獲得數位人物的
反饋;
表現力強:在多種驅動模式下,由 OmniHuman-1 生成的數位人物能夠完成具有挑戰性的
動作,進一步提升了影片的真實感和表現力。
OmniHuman-1 引人擔憂
不過雖然 OmniHuman-1 的強大功能讓人讚歎 AI 可能為人類生活帶來的改變,當前社群
對這一模型也產生了一些擔憂,具體來看包括:
身份冒用:該模型看起來能夠精確複製特定個人的容貌和動作,可能會被用於惡意模仿和
身份詐欺;
資訊操縱:當前 AI 最令人擔憂的負面影響之一,就是可能會催生網路虛假資訊的氾濫,
這可能嚴重影響公共輿論和社會認知;
隱私侵犯:該模型的推出,也可能導致惡意分子在未經許可的情況下,擅自重建和操縱個
人形象,例如利用某明星的圖片製作色情影片等,可能引發倫理問題。
不過要說明的是,當前雖然字節跳動已經推出 OmniHuman-1 模型,但目前該模型尚未正
式投入商業使用,官方也尚未清楚說明具體釋出時間。
另一方面,字節跳動掌管著抖音這一中國當前最熱的社交媒體平台,但 OmniHuman-1 的
推出似乎在中國社群內部的討論度還不高,頗令人玩味。
OmniHuman:通過一張圖片配合音頻或視頻,生成非常自然的會說話、唱歌的人類動作視
頻
支持各種不同類型輸入(如單一的人物圖片和音頻、視頻等信號)生成非常逼真真人視頻
動畫,涵蓋從面部表情到全身動作,無論是說話、唱歌、跳舞等。
OmniHuman 在生成動畫時能夠保持極高的真實感,能夠精確捕捉到人類的面部表情、身體
動作、手勢變化、物體交互等細節,超越了現有的方法。
支持手勢、肢體語言、舞蹈動作等自然動畫。
支持臉部特寫(Close-up)、半身(Half-body)、全身(Full-body) 動畫。
可適應不同畫面比例(如 16:9、9:16、1:1)。
能夠處理各種人體姿勢和全身動作,尤其是在面對複雜的運動和物體交互時,表現出更高
的準確度。
https://www.xiaohu.ai/c/xiaohu-ai/omnihuman
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.195.108 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1738907610.A.3B8.html
1F:推 leotompp : 放我照片可以改成彭于晏身材跳舞嗎?? 02/07 13:54
2F:推 KSUGOD : 抖音供應鏈噴 02/07 13:54
3F:→ b9513227 : 你各位ai慢慢吹 tsm跟nv躺著發財 02/07 13:55
4F:推 hpk89 : 裸圖變影片? 小日本av產業的末日? 02/07 13:57
5F:推 QooSnow : (遙遙領先!) 02/07 13:57
6F:→ goodapple807: 所有人都要有AI 笑死 02/07 13:58
7F:推 cosmite : 台灣不是有個法在罰deep fake的嗎?這樣做沒問題? 02/07 13:58
8F:推 ntnuljg : 全部的人都用AI做短影音 沒辦法做出自己的特色並 02/07 13:58
9F:→ ntnuljg : 且不被模仿 就跟垃圾一樣 02/07 13:58
10F:推 iamjojo : 這挺多類似的AI有就是了 02/07 13:59
11F:推 love80 : 大家都急了,青鳥怎麼唱? 02/07 13:59
12F:推 qwe78971 : 這東西半年前就有了 一堆meme 鬼畜 02/07 13:59
13F:推 leotompp : 先跳個坑恰娜~壓壓驚 02/07 14:00
14F:推 herculus6502: 股版快變成AI版了 02/07 14:00
15F:→ calmerrorans: 校署 開始蒸餾你的蒸餾 瘋狂推出 02/07 14:01
16F:→ blacklight27: 太神啦 中國 02/07 14:02
17F:噓 sean667cd : 每間快點都買老黃烤箱裡的GPU 快賣! 02/07 14:02
18F:推 onekoni : 想不想跟我做壞壞的事…放空老黃 02/07 14:02
19F:推 metallolly : 現在連網友貼布萊德彼特的病照都不能相信了 02/07 14:02
20F:→ qwerkevin : 抖音超多AI生成的影片了 02/07 14:03
21F:推 ntr203 : 換臉大降價時代要來了嗎? 02/07 14:04
22F:推 metallolly : 不過這也不是什麼新奇 我最近都看狗狗貓貓煮飯 02/07 14:04
23F:→ abljy : 抖音可以作習大大小熊維尼片頭曲嗎 02/07 14:08
24F:推 DA3921999 : 可以做老黃大罵NV空軍嗎 02/07 14:08
25F:→ idernest : PTT金城武的大勝利 02/07 14:10
26F:→ lalacos123 : 到處都在推出AI系統 北七一直喊算力無用 那後來推出 02/07 14:11
27F:→ lalacos123 : 的八成都複制貼上的XD 02/07 14:11
28F:→ s1001234 : 這個模型感覺很危險... 02/07 14:14
29F:→ x58420 : 老黃要崩了 02/07 14:14
30F:推 Brioni : 發展模型應用場景跟節省算力不衝突 02/07 14:16
31F:→ IBIZA : 算力跟複製貼上的關係在哪? 02/07 14:16
32F:推 ll6a : 放空也是講求時機問題,賣鏟子要衰弱那也要買鏟子 02/07 14:18
33F:→ ll6a : 的先衰弱,就看淘金客花錢買鏟子掏不掏的到金子, 02/07 14:18
34F:→ ll6a : 現在還在瘋狂買鏟子的階段,不急不急 02/07 14:18
35F:推 rereterry : 之前就有可以換臉直播等等免費應用出來了,一直覺得 02/07 14:23
36F:→ rereterry : 中國企業在簡化門檻這塊蠻願意投入的,雖然是早就有 02/07 14:23
37F:→ rereterry : 的應用,但現在方便更多群體可以參與了 02/07 14:23
38F:推 SRNOB : 小玉 你真冤啊 02/07 14:25
39F:推 WTF55665566 : 這以後會有肖像爭議吧 不過未來這門檻大幅拉低 整 02/07 14:25
40F:→ WTF55665566 : 體環境算力需求反而上升 02/07 14:25
41F:→ Lowpapa : 這在台灣要關12年 02/07 14:26
42F:→ MizPerfect : 國際板 豆包 02/07 14:26
43F:推 kimula01 : 精煉再精煉。AI之煉金術士 02/07 14:26
44F:推 kotorichan : 美國根本沒管制中國AI發展 等著被卷 02/07 14:27
45F:推 QooSnow : (買鏟子的,)(不想買)(金鏟子,)(要買)(鐵 02/07 14:29
46F:→ QooSnow : 鏟子!)(嘻嘻。) 02/07 14:29
47F:推 panda816 : 人類滅亡倒數計時 02/07 14:30
48F:→ ramirez : 鏟子買起來!!!!!!!!!!!!!!!!! 02/07 14:30
49F:噓 PureAnSimple: 不重要 不用每天po模型 有錢賺嗎? 02/07 14:32
50F:推 pttabs : 台灣他媽的不是只看不到車尾燈,應該是坐在原地不會 02/07 14:37
51F:→ pttabs : 動啊 02/07 14:37
52F:推 smch : 小八都會買切糕了 還在買台積電 02/07 14:39
53F:推 HEINOUS : 迪士尼 掰掰 02/07 14:45
54F:→ cl3bp6 : 連結內那個比Sora弱太多了 02/07 14:48
55F:推 camoont : 香 02/07 14:55
56F:推 newmiga : 現在網路的影片快沒真的了 02/07 14:55
57F:推 DDDDRR : 現在看影片都當成動畫看 反正都是假的 02/07 14:57
58F:推 sdbb : 電影的背景也是動畫師用電腦畫的,不一定是真實取景 02/07 14:58
59F:→ sdbb : 廣義來說,大家都在看電腦動畫,只有演員是真人 02/07 14:59
60F:→ sdbb : 以後也不用真人,配音也交由AI處理 02/07 14:59
61F:推 pttsac : 川普:來人 把抖音買起來~~~~~~~~~ 02/07 15:05
62F:推 Diver123 : 老鐵 牛逼 02/07 15:07
63F:推 joewucool : 川普爸爸不開心了 02/07 15:07
64F:→ PTTMAXQQ : 說實話,美國的AI影像生成…嘖嘖 02/07 15:09
65F:→ wr : 換臉太難聽了 請說濾鏡 02/07 15:10
66F:推 popo123456 : 中國大概都免費的,美國怎麼拼啊 02/07 15:14
67F:推 QooSnow : (還在玩)(文字生成的,)(加油好嗎?) 02/07 15:15
68F:推 joe0934 : 對嘴叫欸哎的話,我們早有了啊 02/07 15:22
69F:噓 madeinheaven: 這又不是新東西 早就有了 02/07 15:23
70F:→ MizPerfect : 白話一點 字節的豆包 屌打 deepthink 02/07 15:27
71F:推 good10740 : 下一步 導入AI眼鏡 02/07 15:30
72F:→ a0809449333 : 以後會不會真人更難看到 02/07 15:31
73F:推 x20165 : 泰勒絲唱青鳥 抓到了 02/07 15:41
74F:推 harry458031 : 小玉領先五年 02/07 15:49
75F:推 worf : 可以用小熊維尼嗎 02/07 16:17
76F:→ gstym : 啥小 ai抖音喔 02/07 16:58
77F:推 Grothendieck: 幹片自動生成 02/07 17:28
78F:推 nakinight : 這在台灣會被關 02/07 18:05
79F:推 epephanylo : 話說CLOSE AI 不是有個SORA嗎? 好像沒火起來? 02/07 18:20
80F:推 kisusu : 豬大哥也會唱法文歌了嗎 02/07 18:30
81F:推 moto000 : 肖像權! 02/07 18:47
82F:推 letyouselfgo: 既然有人做開源 應用就會爆炸性的產出 02/07 21:06
83F:→ fantasyscure: 完了 泰勒絲以後出現在番號上不意外 02/08 00:00
84F:→ alex00089 : 以後大家都AI咩 02/08 06:15
85F:推 israelii : 小玉真的領先世界10年 02/10 08:07