展會信息港展會大全

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-30 12:42:37   瀏覽:265次  

導讀:機器之心原創(chuàng)作者:楊文我們實測16個Prompt:生成速度比Sora還快,動漫效果行業(yè)SOTA。前段時間,AI 毒液特效爆火,迅速攻占抖音小紅書。而想出這個「鬼點子」的正是愛詩科技。他們把自家視頻模型 PixVerse V3 和電影《毒液:最后一舞》進行聯(lián)動,搞出了這一熱門玩法。此外,在 SuperCLUE 12 月文生視頻測評結(jié)果中,PixVerse V3 綜合能力更是吊打 Sora。圖片來源:https://mp.we ......

機器之心原創(chuàng)作者:楊文我們實測16個Prompt:生成速度比Sora還快,動漫效果行業(yè)SOTA。

前段時間,AI 毒液特效爆火,迅速攻占抖音小紅書。而想出這個「鬼點子」的正是愛詩科技。

他們把自家視頻模型 PixVerse V3 和電影《毒液:最后一舞》進行聯(lián)動,搞出了這一熱門玩法。

此外,在 SuperCLUE 12 月文生視頻測評結(jié)果中,PixVerse V3 綜合能力更是吊打 Sora。

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

圖片來源:https://mp.weixin.qq.com/s/yOkK5jG3D9d5xllqbUFDRA短短一個月,火爆全球的 PixVerse 母公司又發(fā)布了新一代視頻模型 PixVerse V3.5。

該模型主打一個生成速度快、運動控制強,動漫和動畫效果還拿下行業(yè)第一。先奉上幾個視頻給大家摟一眼。

視頻來自 X 博主 @aziz4ai:

https://x.com/aziz4ai/status/1872614428598014298

還有網(wǎng)友稱這絕對是市場上最好的「圖片轉(zhuǎn)視頻」模型。

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

高清視頻來自 X 博主 @vladimircherner:

https://x.com/vladimircherner/status/1872978258444120224

自今年 1 月 PixVerse V1 版本上線以來,愛詩科技平均每 2-3 個月就有大的模型升級。

其中既有底層模型能力的提升,也有新功能的增加和用戶界面的優(yōu)化。

接下來,我們就來個全方位測評,看看 PixVerse V3.5 究竟進化到何種程度了。

PixVerse 官網(wǎng)鏈接:https://app.pixverse.ai/

10 秒跑出一個視頻

在這個用戶體驗至上的時代,AI 視頻緩慢的生成速度無疑是讓用戶抓狂的「罪魁禍首」之一。

PixVerse V3.5 就在速度上卷出了新高度,據(jù)說是全球首個接近實時生成的高質(zhì)量 AI 視頻模型。

官方稱,使用 turbo 模式和分辨率較小的圖片進行視頻生成,等待時間不超過 10 秒,如果各方面條件給力,它能達到最快 5 秒的生成速度。

為了測評這一點,我們專門掐了下秒表。

以外國老頭喝茶看電腦這張梗圖為例。我們選擇 turbo 模式并使用「圣誕戰(zhàn)袍」特效,PixVerse 僅需 7 秒左右的時間即可搞定。

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

頭發(fā)花白、一本正經(jīng)的老頭立馬換上清涼圣誕裝,秒變肌肉男。

AI 視頻的生成速度是衡量性能的關(guān)鍵指標之一,因為它直接影響著用戶體驗和創(chuàng)作效率。

試想當你打開 AI 視頻生成應(yīng)用,急需快速處理任務(wù)時,卻不得不面對漫長的排隊等待,以及像烏龜爬一樣的生成速度,這無疑會大大影響創(chuàng)作熱情。而 PixVerse V3.5 的出現(xiàn),恰好解決了這兩大痛點。

此外,不同的應(yīng)用場景對生成速度也有著不同要求。

在直播、游戲等實時互動場景中,快速生成是必不可少的剛需;影視制作雖然對速度要求不那么苛刻,但提升生成效率依然能顯著改善工作流程。

因此,PixVerse V3.5 此番提速,勢必會為內(nèi)容創(chuàng)作開啟更多可能性。

運動控制強

一直以來,精確的運動控制都是 AI 視頻的短板。

只要幅度變大,動作就會扭曲變形,即使是 Sora、Veo2 也免不了翻車。

Veo2 的生成效果PixVerse V3.5 在運動控制方面下了大功夫,雖然遇到體操運動仍容易出 bug,但與上一代相比已經(jīng)有了長足的進步。

比如我們讓它生成一段啦啦隊成員進行蹦床運動的視頻。

女孩們跳躍的同時雙手開合,動作整齊劃一,沒有出現(xiàn)不自然的扭曲或變形。女孩飄揚的頭發(fā)、蹦床的凹陷等細節(jié) PixVerse V3.5 也處理得很逼真。

要知道,蹦床運動是一個技術(shù)、藝術(shù)和物理規(guī)律的綜合體。

它涉及重力、彈力等物理現(xiàn)象,還涉及多主體動作的協(xié)調(diào)性,這對于 AI 說來并非易事。

Prompt:一群啦啦隊成員在蹦床上跳。

在下面這則小男孩奔跑的視頻中,雖然生成的是慢鏡頭,但運動幅度大,小男孩也沒有出現(xiàn)左右腿不分、動作詭異的情況。

虛化的背景、蕩起的發(fā)絲、泛起的塵土也都讓畫面更加真實。

Prompt:一個小男孩正在操場跑步。我們使用它的圖生視頻功能,試試經(jīng)典的吃面鏡頭。

上傳一張「皮衣刀客」黃仁勛的圖像,輸入 Prompt:這名男子正拿著叉子吃意大利面。

PixVerse V3.5 完美刻畫了從叉子夾面到入口、咀嚼、吞咽的連貫動作,同時精準呈現(xiàn)了頸部的自然筋紋和皮衣在燈光下的細膩光澤變化。

畫質(zhì)高清細膩

PixVerse V3.5 還是個細節(jié)控,很擅長處理光影、紋理以及人物的面部表情等。

同時,它支持多分辨率,720P、1080P,甚至還可以升級為 4K 分辨率。

比如一名時髦的女士走在繁華的大街上,畫面很有電影感。

女人微笑的表情、行走的動作以及衣服的褶皺都很自然逼真,就連背景中的行人也幾乎找不出什么問題。

Prompt:一名中年婦女行走在紐約的大街上。

PixVerse V3.5 不僅能完美還原真實場景,在非現(xiàn)實畫面的創(chuàng)作中也同樣表現(xiàn)驚艷。

西裝革履的金毛煞有介事地敲著打字機,那蔫頭耷腦的模樣,很有當代打工人的牛馬感。

Prompt:一只穿著西裝的狗,正在老式打字機上打字。

穿著廚師服裝的小狗手拿鏟子攤煎餅,虛化的廚房背景中擺著各式各樣的廚具、爐灶,細節(jié)滿分。

Prompt:一只穿著廚師服裝的狗在做煎餅。

不得不說,它生成的怪物史萊克簡直和動畫電影中一模一樣,毛衣的針織紋理也清晰可見。為了體現(xiàn)麥當勞這一場景,咖啡杯上特意印著大大的 Logo。

Prompt:怪物史萊克在麥當勞喝咖啡。

我們再來看看它對于復雜提示詞的理解能力。

Prompt:low-angle tracking shot, 18mm lens. The car drifts, leaving trails of light and tire smoke, creating a visually striking and abstract composition. The camera tracks low, capturing the sleek, olive green muscle car as it approaches a corner. As the car executes a dramatic drift, the shot becomes more stylized. The spinning wheels and billowing tire smoke, illuminated by the surrounding city lights and lens flare, create streaks of light and color against the dark asphalt. The cityscape  yellow cabs, neon signs, and pedestrians  becomes a blurred, abstract backdrop. Volumetric lighting adds depth and atmosphere, transforming the scene into a visually striking composition of motion, light, and urban energy.

(低角度跟蹤拍攝,18 毫米鏡頭,汽車漂移,留下光線和輪胎煙霧的痕跡,創(chuàng)造出視覺沖擊力極強的抽象構(gòu)圖,攝像機低角度追蹤拍攝,捕捉這輛橄欖綠色的時尚肌肉車駛近彎道的瞬間,隨著汽車急速漂移,鏡頭變得更加風格化,在周圍城市燈光和鏡頭光暈的照射下,旋轉(zhuǎn)的車輪和滾滾的輪胎煙霧在漆黑的瀝青路面上形成了光與色的交錯,城市景觀  黃色出租車、霓虹燈和行人  成為一個模糊的抽象背景。體積光增加了畫面的深度和氛圍,將這一場景轉(zhuǎn)化為一個由運動、光線和城市活力構(gòu)成的視覺沖擊。)

面對這一長串的文本描述,PixVerse V3.5 幾乎實現(xiàn)了每一個細節(jié):低角度跟蹤鏡頭、輪胎煙霧,橄欖綠的車身、城市中閃爍的霓虹燈以及穿梭的黃色出租車…… 即便在高速運動場景中,畫面依然清晰穩(wěn)定。

其電影級的鏡頭語言、光影效果和動態(tài)表現(xiàn),不禁讓人想到《速度與激情》的經(jīng)典畫面。

Prompt:A massive, terrifying monster appears among the skyscrapers in a dystopian city under a stormy night sky. The creature has glowing red eyes, sharp claws, and reptilian scales. Lightning flashes illuminate the dark cityscape, Helicopters circle in the background, while panicked citizens watch from the streets below. The atmosphere is tense, with a cinematic mix of chaos and awe .

(在狂風暴雨的夜空下,一個巨大、恐怖的怪物出現(xiàn)在一個烏托邦城市的摩天大樓之間。這只怪物有一雙閃著紅光的眼睛、鋒利的爪子和爬行動物般的鱗片。閃電照亮了黑暗的城市景觀,直升機在背景中盤旋,而驚慌失措的市民則在下面的街道上觀望。氣緊張,混亂與敬畏交織在一起。)

PixVerse V3.5 生成的畫面極具張力,怪物可怕的形象讓恐怖氛圍拉滿,遠處的閃電劃破夜空照亮整個城市,形成強烈的光影對比。動畫效果一流

PixVerse V3.5 不僅擅長寫實風格,在動畫創(chuàng)作上表現(xiàn)也很出色。

只需輸入提示詞,就能直出日漫、3D 動畫等多種風格,畫面精美,絲毫不輸專業(yè)的動畫制作軟件。換句話說,其動畫效果已躋身行業(yè)頂尖水平。

Prompt:A cinematic shot, old Hollywood era musical. A group of tap dancing hamsters dance across a busy Christmas high street. light mist, light snow falling, 3D Animation.

(電影鏡頭,老好萊塢時代的音樂劇,一群倉鼠在繁忙的圣誕大街上跳著踢踏舞,輕微的薄霧,輕微的雪花飄落,3D 動畫。)

生成的畫面中,大街上張燈結(jié)彩,各種圣誕元素拉滿。擬人化的小倉鼠有節(jié)奏地跳著舞。

即使在多主體的情況下,PixVerse V3.5 仍能保持動作協(xié)調(diào)一致,畫面沒有出現(xiàn)虛化閃幀變形等問題。

Prompt: A meeting of a lion, a bear and a giraffe, all of them wearing suits,Disney style(穿著西裝的獅子、熊和長頸鹿開會,迪士尼風格。)

PixVerse V3.5 巧妙地抓住了迪士尼動畫的特點,角色表情豐富且夸張,毛發(fā)、服裝以及環(huán)境的光影效果,都力求逼真和生動,配色也很舒服。

更有意思的是,角色邊指手畫腳邊侃侃而談的場景可太像打工人開會了。

我們再來試試圖生視頻的風格化。

上傳一張美漫風格的圖片,輸入 Prompt: Two cars are engaged in a chase.

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

PixVerse V3.5 延續(xù)畫面風格特征,讓靜態(tài)圖片瞬間動起來。兩輛汽車在街道上演追逐大戲,一路火花帶閃電,鏡頭也能隨著汽車而移動,變換不同的城市場景。

它還能生成黑白動漫風。這種風格強調(diào)線條和對比,PixVerse V3.5 使用粗獷的線條勾勒出人物和環(huán)境,并利用黑白對比增強視覺沖擊力。

天空飄落的雨絲、男人六親不認的步伐都讓畫面更加生動。

圖生視頻。Prompt:The man walks to a car in a rainy night.此外,它還能在畫面字體不出現(xiàn)亂碼的情況下,讓四個角色同時動起來,而且姿勢各異。

除了模型升級外,PixVerse 還有更多進階玩法。

比如新增首尾幀功能。我們上傳兩張 AI 生成的寫實照片作為視頻的首幀和尾幀,PixVerse 以此生成一段連貫的視頻。拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

它還趕在圣誕節(jié)前夕上線了一堆節(jié)日特效。

比如「圣誕禮物盲盒」特效,只需上傳一張圖片或視頻,輸入「我想要……」的提示詞即可。

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

以及「萬物皆可羊毛卷」特效,隨便上傳一張梗圖,就能秒變卷發(fā)。

截至目前,它已經(jīng)上線了 27 種特效,其中比較出圈的就有「成為肌肉猛男」、「愛的抱抱」、「掃射一切」等。

拿下近3億元融資后,愛詩上線新模型,AI視頻生成速度殺入10秒大關(guān)

一番實測下來,我們可以清晰地看到 PixVerse V3.5 的進步。秒級生成速度為內(nèi)容創(chuàng)作帶來前所未有的流暢體驗,精準的運動控制讓高難度動作不再「變形」,細膩的畫質(zhì)表現(xiàn)更是將每一幀都打磨成了電影級畫面。

更令人驚喜的是,它在寫實與動畫兩個領(lǐng)域都展現(xiàn)出強大的駕馭能力,再配合豐富的特效玩法,極大地降低了影視創(chuàng)作門檻。

大家也快去體驗一波吧。

贊助本站

相關(guān)熱詞: 愛詩 pix 毒液 融資

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港