摘要:AIGC,迷人又新奇。
這也許不是夢境,大概就在不遠的將來,我們的科技場景會變成這樣:
只要我想,“我”可以畫出一架翼展超過一公里的飛機,如果你覺得這樣的飛機沒法起飛,我還可以通過想象,瞬間將它變成視頻,我會說:“你看,這架飛機沒有任何問題”。
翼展超過一公里的飛機能起飛嗎?當然不能——但只要我想,并將想法告訴計算機,它就有可能實現。
聽起來,這真是一個超酷的科幻場景,如果我還想騎著掃帚飛,AI就能繪制出我想象的場景——無論是圖片、視頻都可以。
現在,藉由技術的進步,這種夸張的想象力已經一步步成為現實——AIGC和其身后的學習模型,正在讓“每個人成為創造世界的藝術家”變為可能。
在去年,AICG(生成式 AI)在開啟了影音技術方面的應用。從AI繪畫到生成短視頻,從寫作到與ChatGPT聊天,你能感覺到人工智能從曲高和寡的實驗室走出,在普通人面前展示出非凡的技能。
在中國,AIGC一樣迷人又新奇。
1月10日,科技公司百度舉辦了第五屆百度 Create AI開發者大會,大會將AIGC應用到每一個環節——從現場歌曲創作到內容制作、幕后、大會腦圖甚至現場作畫,都有AI在其中參與。
而在這背后,是技術精進、AI“學習”的成果。而不斷“機靈”的AI,實力不止展現在舞臺。
百度CTO王海峰在Create大會上介紹:從深度學習技術興起,到產業鏈的形成,再到深度跨界融合,深度學習已經進入了一個全新的發展階段,“深度學習+”。
多年來,百度對于“深度學習+”的布局是多維度的:從技術角度,深度學習+知識,從產業角度,深度學習+上下游產業,從應用角度,深度學習+千行百業。而深度學習平臺加上大模型,貫通了從硬件適配、模型訓練、推理部署,到場景應用的全產業鏈,夯實了產業智能化基座,會進一步加速產業智能化升級。
一切看起來即清晰又迷人——通過深度學習,AIGC“讓每個人成為創造世界的藝術家”這種“科幻”得以付諸實現,在更廣泛的領域,AI技術同樣讓這家老牌科技公司,展現出新的魅力。
Create大會,一場AIGC的百度秀場
如何解釋AIGC——它是真正的AI生產力。
不同于AI控制的生產線機械臂,那些看似復雜的裝配工作,仍需要工程師制定嚴謹的流程和精確的數據——現在科技公司賦予AI“思想”,你只要給出一個想法,AI就能創造一個世界。
即便這聽起來像是AI的“玄學”,到生產力,但AIGC正以各種方式闖入人們的生活中。
比如在今年8月,當那幅《太空歌劇院》在藝術大賽獲獎的時候,還沒人相信它是由AI“創作”;但接下來,紅杉的一篇文章《Generative AI: A Creative New World》(一代人工智能:一個創新的新世界)火爆全網,作者不僅描述了AI的創造力,還進一步指出了一款AI“殺手級應用”將很快出現。
請注意,僅就這篇“指明未來AI道路”的文章來說,它的作者不是人類,是個叫GPT-3的生成式AI。
還有前一陣,AI實驗室OpenAI推出的AI聊天機器人ChatGPT,它上線的五天里迅速積累100萬用戶,雖然ChatGPT還不能和你對春聯,但可以邏輯清晰的回答類似“顏值是否代表一切”這樣的問題。
ChatGPT說:這種說法是不正確的……
再往前看一點,早在2015年,谷歌就在AI上有所行動,那時他們在一篇論文中介紹了神經網絡架構,這是個非常酷的發明,或者可以說是GPT-3和ChatGPT的祖師爺。
現在,類似AI“創造世界”這樣具有未來主義的描述,正在不斷接近現實——來自中國的科技公司不甘心只停留在“描繪AI藍圖”這樣的境地,它們正在用基于AIGC的技術干點漂亮活。
比如1月10日的2022百度Create大會上,開場視頻便是數字人希加加在不同維度的Create(創造)世界跑酷穿梭;更有數字人樂隊演繹歌曲——從作詞、作曲到編排,全部是由AIGC生成;整場大會當然有專業制作人員參與,但AI這次加入了各個環節之中,整個創排過程混合了人類和AIGC的“腦洞”,使得大會真正具備了“Create”的特性。
Create大會看起來真像一個科技公司的AIGC秀場,但其背后技術平臺的實力,以及“人機共創”的新模式——這甚至可以看做是為“人人都是藝術家”而邁出的最為深遠的一步。
文心大模型如何成為內容生成力?
想象一下,若讓AIGC創造世界,這家伙要學習不同的文化、不同的創作方式、不同的理念,也許還要懂點美學概論……
于是工程師們創造了一個可以學習的模型,讓AI得以更懂藝術創作。在百度,這個模型叫做文心。
通過學習,文心成為天才。
比如要拍一部電影,AI一個“人”便兼職了編劇、導演、演員、攝影師、剪輯師、美術師、服化道等等——這在人類看來是不可能的事情,AI做起來非常簡單。
現實中,作為“天才導演”的AI已經完成一些簡單的任務——百度APP里有些視頻內容,是AI“導演”,將百家號的圖文內容自動轉換成視頻。
而更復雜的AIGC學習和生成,背后則有著這一套深不可測的方法和邏輯。
比如在訓練“文心ERNIE 3.0”中,工程師為AI灌注了百科、小說、新聞、戲劇、詩歌等無標注數據——還記得哆啦A夢中有一個放在書頁上的轉印轉知識面包嗎?你可以理解工程師不斷將印有知識面包喂給文心模型。
“吃下”百余種不同形知識的文心,成為一個真正的“雜學家”——會寫摘要、對對聯,翻譯、分類、閱讀理解,并且掌握了幾十類自然語言。
在另一個模型,“文心 ERNIE-ViLG 2.0”中,通過訓練逐漸成為一位AI美術室、插畫師。現在,你只需要在屏幕上輸入一個想法,AI便可以據此進行創作,生成一幅令人驚嘆的畫作。
AI背后的操縱者,總會感慨人工智能的創作成果與他的想法如此接近,這恰恰是因為AI學會了分析你的想法。
工程師為AI學習添加了知識增強的擴散模型——簡單說就是,AI不僅能分析你這段想法中的語義,同時能通過拆解描述,找到對應的圖像。不僅如此,AI還能在圖像的底稿、輪廓、著色等不同階段,選擇不同網絡來進行建模。
最終,AI生成的圖像,不僅精美,與人的想法也如此接近。與其說這是AIGC的生產力,不如說這是機器學習帶來的力量。
所以AIGC真的是一個合格的藝術家,從編劇到運鏡,從橋段設置到畫出分鏡,乃至渲染、剪輯、添加特效,這些以往需要超大制作團隊才能完成的任務,AIGC都能輕松應對——畢竟,文心模型在權威公開數據集 MS-COCO 上刷新 SOTA 效果,性能已經遠遠超過了國際上的同類技術。
人人藝術家?百度的AI軟實力
有一點需要注意,AI終究是AI,并不會主動為你做點什么。
無論AIGC有多么強大,驅動其完成各種任務的,始終是背后的人。而通過AIGC進行創造,本質上是讓“每個人成為創造世界的藝術家”這一夢想成為現實。
反過來說,現實中成為“藝術家”是一件可望不可及的事情,但AIGC整讓此變得簡單。
今年1月10日舉辦的第五屆百度 Create AI開發者大會上,百度創始人李彥宏用“危機和希望”為關鍵詞,在百度AI作畫平臺一格上,由人工智能自動生成了一幅畫并展示在大屏幕上。
他說:我覺得很傳神。生機勃勃的新生命已經破冰而出,然而寒冷還沒有完全褪去——AI理解了他的創作動機,這讓不是藝術家的李彥宏,也能完成一幅藝術作品。
AIGC的力量還不止如此——百度數字人度曉曉曾發布MV《啟航星》,作畫、作詞、作曲,全部由AI一手操刀;百度AI數字人度曉曉,挑戰寫高考作文,40秒寫了40篇,得分可以排在總考生前 25%。
這些通過文字描述自動生成的文章、歌詞、音樂,讓AIGC生產的藝術充滿了靈性,同時也讓技術更加迷人。
事實上,為了讓AI更“聰明”,創造力更豐富,百度也在不斷培養AI背后的“教練”——工程師。
比如百度已與全國 100 多所高校進行深度人才培養戰略合作,并連續八年支持教育部產學合作協同育人項目,累計投入超過千萬基金,覆蓋 242 所高校的 511 個項目,為 4100 多名教師提供技術支持;多學科領域的師資培訓項目覆蓋超過 910 所高校,累計免費培訓 4100 多名 AI 相關專業教師。
在程序設計大賽方面,不僅有連續舉辦 18 年的企業級編程賽——百度之星程序設計大賽,還舉辦了百度國際大數據競賽、中國高校計算機大賽-人工智能創意賽(C4-AI大賽),以及被稱為國內 AI 領域資助金額與含金量最高的學術獎學金之一百度獎學金。
Create AI開發者大會上,李彥宏說:三年前,我們宣布五年內為社會培養500萬AI人才,目前已培養了超過 300萬。未來,百度會投入更多資源,與各位開發者們一道,為中國AI的發展盡我們最大的努力。
這么大精力的投入,不止生產更多“創造世界的藝術家”這么簡單。
現如今,各大視頻平臺都將目光轉向新奇的AI 創作,市場也在期待AIGC領域制作的動畫或視頻出現爆款,營銷等領域更是期望AIGC能替代費用高昂的制作團隊,去生成精美的海報和視頻——雖然目前的AIGC 技術還未能成熟到支持低成本的 C 端應用,但無疑,對技術和人才的長期投資,是一件未來可期的事情。
如果說技術研發的AI模型是硬實力,驅動技術長足進步的人才培養與儲備則是軟實力——百度的AI當然不止于此,但在“每個人成為創造世界的藝術家”上押注和投入,則顯示出這家科技公司對AIGC布局的高瞻遠矚。
來源|AI藍媒匯 作者|黑羊