人民網(wǎng)
人民網(wǎng)>>四川頻道

開年大模型再出“王炸”

短視頻行業(yè)將被AI顛覆嗎?

2024年02月20日09:33 | 來源:北京日報
小字號

原標(biāo)題:短視頻行業(yè)將被AI顛覆嗎?

  相似的時間點(diǎn),更甚于上次的震撼。2月16日,曾以大模型ChatGPT震驚全球的人工智能科技公司OpenAI再次祭出新“王炸”——文生視頻大模型Sora,只需輸入一段文本指令,即可生成一段60秒的視頻,畫面精致細(xì)膩。

  “AI(人工智能)成長速度比想象中更快!”有人對此振奮,也有人表達(dá)擔(dān)憂:“人類是否真的準(zhǔn)備好了?”但越來越多的聲音認(rèn)為,人工智能將引領(lǐng)第四次工業(yè)革命。

  首個視頻大模型橫空出世

  Sora并非首個文生視頻大模型。此前,科技巨頭谷歌、創(chuàng)業(yè)公司Runway等都已布局這一賽道。Sora何以驚艷全球?相比此前應(yīng)用,它將生成視頻的時間大幅延長至60秒,在畫面的細(xì)致逼真、流暢程度、三維空間多角度呈現(xiàn)等方面也有明顯提升。

  360集團(tuán)創(chuàng)始人周鴻祎就談到了幾個讓他印象深刻的鏡頭:小狗在雪地玩耍濺起紛飛的雪粒,毛茸茸的毛發(fā)根根分明、隨風(fēng)浮動;咖啡杯里,兩只帆船“纏斗”掀起翻涌的波浪水紋;不同角度的街景通過運(yùn)鏡流暢地呈現(xiàn)。

  跳出視頻領(lǐng)域,更深廣的變革或許正悄然發(fā)生。

  周鴻祎談到,Sora的顛覆性絕不僅僅限于一個文字生成視頻的工具,而是通用人工智能對世界理解的又一次突破。一年前,ChatGPT標(biāo)志著人工智能對人類語言和知識的理解達(dá)到了一個突破點(diǎn)。而除此之外,這個世界還有很多規(guī)律,例如小狗拱雪雪會留在鼻子上、無人機(jī)在空中飛時視角如何變換等,而Sora目前生成的視頻,顯示它對這個世界的規(guī)律有了更為完整的理解。這意味著,通用人工智能時代或?qū)⒓铀俚絹怼?/p>

  同濟(jì)大學(xué)人文學(xué)院特聘教授解學(xué)芳也認(rèn)為,Sora的出現(xiàn)意味著AI理解真實世界的能力進(jìn)一步躍升,但這類大模型的突破性發(fā)展未來也會受到算力、算法、倫理法規(guī)的制約,應(yīng)對其保持積極且審慎的態(tài)度。

  視頻行業(yè)格局或被重塑

  Sora的橫空出世,讓視頻領(lǐng)域從業(yè)者感受到了危機(jī)?!疤鸷?,感覺要丟飯碗了?!北本┠澄幕瘋鞑ビ邢薰緞?chuàng)始人胡娟坦言,Sora讓她危機(jī)感陡增,“這完全可以用于鏡頭樣板,一些復(fù)雜的特效制作,以前工期至少得好幾天,但AI將其縮短到了幾分鐘?!?/p>

  攝影師李浩楠認(rèn)為,Sora對影視相關(guān)的產(chǎn)業(yè)影響比較大,能大幅拉低制作成本,特別是涉及多角度、多機(jī)位的視頻,如果AI能夠部分替代人工拍攝和剪輯,成本可能只要原來的十分之一。

  Sora的技術(shù)突破也讓大大小小生成式AI創(chuàng)業(yè)公司和投資機(jī)構(gòu)的前景變得充滿挑戰(zhàn)。某專注全球早中期企業(yè)的風(fēng)投公司運(yùn)營合伙人羅超表示,Sora表現(xiàn)出的領(lǐng)先性讓Runway、Pika Labs等視頻生成大模型明星公司面臨強(qiáng)力沖擊,而相比這些自研大模型公司,純做應(yīng)用的創(chuàng)業(yè)公司則更加前途未卜。

  在新壹科技CEO雷濤看來,Sora的誕生,無疑會改變AI視頻生成市場格局?!熬蛧鴥?nèi)而言,要看哪些企業(yè)能結(jié)合、利用新技術(shù),完善符合國情的產(chǎn)品。”

  AI讓“眼見不一定為實”

  Sora展示的生成視頻也被發(fā)現(xiàn)有不少“穿幫”鏡頭。比如,在一段老奶奶吹蠟燭的視頻中,老奶奶吹氣后蠟燭卻沒有熄滅;在另一段玻璃杯從空中墜落的視頻中,玻璃杯剛被抬到半空,桌上就已經(jīng)有水流出來了。

  這也是目前文生視頻大模型的短板——不懂物理世界以及因果關(guān)系等。在中國政法大學(xué)傳播法研究中心副主任朱巍看來,大模型所生成的視頻代表著AI對這個世界規(guī)律的理解,但這不一定都是正確的,因此也讓“眼見不一定為實”。

  更廣泛的擔(dān)憂,是視頻的可信度高于文字和圖片,一旦生成門檻被大幅降低,難辨真?zhèn)蔚奶摷僖曨l可能會被用于傳播謠言、詐騙等非法領(lǐng)域。對此,朱巍認(rèn)為,應(yīng)參考此前針對生成式AI的相關(guān)規(guī)定,對AI生成內(nèi)容予以標(biāo)識。

  此外,創(chuàng)作者用一段文字生成視頻后,該視頻的版權(quán)歸屬等問題也需要重新梳理。目前,針對AI生成文字或圖片的著作權(quán)歸屬問題已形成爭論。去年年底,北京互聯(lián)網(wǎng)法院就針對一起“人工智能生成圖”著作權(quán)侵權(quán)糾紛案做出一審判決,這也是我國首例涉及“AI文生圖”著作權(quán)案件。法官認(rèn)為,人們利用生成式人工智能生成圖片時,本質(zhì)上仍然是人利用工具進(jìn)行創(chuàng)作,如果能體現(xiàn)出人的獨(dú)創(chuàng)性智力投入,就應(yīng)當(dāng)被認(rèn)定為作品,受到著作權(quán)法的保護(hù)。(北京日報記者 趙語涵 袁璐)

(責(zé)編:章華維、高紅霞)

分享讓更多人看到

返回頂部