繼Google發表了影片生成AI模型「Lumiere」後,OpenAI也在2月發表了旗下最新的AI模型「Sora」,能根據使用者提供的描述生成最長60秒的影像!這樣嶄新的工具將為世界帶來什麼樣的重大影響?對人類社會是利還是弊?
在2023年,好萊塢演員工會以及編劇工會進行了長達118天的罷工行動,除了向近年興起的串流平台爭取應有的權益以外,另外一大抗議主因,便是看見了AI人工智慧的出現,擔憂未來資本家們可能會大量使用生成式AI去進行編劇,或者是使用演員的肖像在未經同意的狀況下合成在影片,侵犯他們的權益或者是導致他們失業。這件事情一直到去年底終於塵埃落定,但是影像工作者們面臨的威脅似乎沒有停歇!
一進入2024年不久,除了Google在2月份發布影像生成AI模型「Lumiere」,在人工智能領域具有首屈一指領導地位的OpenAI公司也隨即發佈了嶄新模型:「Sora」,並展示了這一套模組是如何根據使用者提供的文字,將其生成最長一分鐘的影片。OpenAI也同步公佈了多部使用此一技術創作的影像,其完成度之高可說令人十分驚艷。而Sora是什麼樣的技術?有什麼樣的特色以及優勢?又將會帶給人類社會什麼樣的益處或是挑戰?為何會引起許多專家的憂慮與關切?OpenAI又將如何面對這些潛在性的問題?且看Tatler的整理報導。
延伸閱讀:什麼是生成式AI?躍升明日之星2026將達9千億美元市場!一篇看懂AI商機、3大AI受惠科技產業從Nvidia到雲端AWS

Above 2023年好萊塢持續118天的罷工行動,其中一個原因就是擔心資本家透過AI運用而影響到演員與編劇們的工作權。(Photo by Mario Tama/Getty Images)
1. Sora是什麼?能做到什麼樣的事情?

Above 透過輸入文字敘述指令,Sora就能夠協助使用者生成最長60秒的影片。(Photo credit should read CFOTO/Future Publishing via Getty Images)
這套名為Sora的生成式AI模組是由OpenAI所發佈的最新技術。這套模組擁有相當強大的Transformer架構,能夠理解並且將文字內容轉換成最長60秒的影片。與過往的AI技術不同,由Sora所生成的影片結構完整,能夠表達出明確的主題。
在OpenAI所公布的其中一則影像當中,他們示範以「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage.」此段文字敘述作為基礎,讓Sora幫忙轉譯為長達1分鐘的影片——在影片裡,Sora也成功的生成了一位穿著時尚有型的女性、在東京街頭上漫步行走,更重要的是就連整體的氛圍、光線控制還有運鏡,不只符合文字敘述更與一般人類所拍攝製作的影片效果相去無幾。
從數段Sora所製作的影片和OpenAI所公布的訊息裡得知,Sora可以還能夠讓使用者從運鏡、色調搭配等去進行細部的調整,且做到100%符合真實世界物理現象的運算,包含光線折射、物體碰撞運動等,不只能夠產生人物、動物,甚至動畫人物也能夠生成。而除了像這部演示影片所展現的,Sora更可以把複數角色、複雜的場景設計和攝影運鏡效果運用在影片生成之中。之後,OpenAI也計畫讓Sora能夠支援將既有的影像進行重組模擬,讓原本靜態的畫面「動起來」,亦可以將影像插入原有的動態影片、把原本的影片擴充等協助創作者們編修影片,功能相當的強大。
另外,Sora同步支援現在市面上大多數的影音剪輯軟體和影片格式,讓影片創作者可以直接使用這些片段進行編輯與利用;輔助創作者去打造作品外,使用者也可以透過社群共享,讓不同的用戶一同進行編修創造,提高學習效率,成為十分實用的工具和學習影音剪輯的管道。
以上種種的好處,讓OpenAI在發佈此一模組後,立即引發熱烈的討論和關注,認為這是AI技術的又一大突破。
2. Sora將帶來的改變是什麼?

Above OpenAI領導人Sam Altman已成為世界最具影養力的人物之一。(Photo by Justin Sullivan/Getty Images)

Above OpenAI創造了ChatGPT後引起一波熱潮,人人都在討論關於AI的未來。(Photo Illustration by Mateusz Slodkowski/SOPA Images/LightRocket via Getty Images)
目前,Sora尚未對大眾開放,而是釋放給一些相關領域的使用者擔任「紅色小組(Red Teamers)」的任務,對這套AI模組進行測試、實驗,找出潛在的問題。若是有朝一日真的上市,會帶來什麼樣的改變與衝擊?
Sora作為一款強大的AI工具,在它正式投入市場、普及化後,可以想見的是製作影片的學習成本大幅降低,任何人只要學會使用,便能透過文字去「創造」出屬於自己的影片,因此可以想像,未來人人都能夠成為一個優秀的影片創作者,在社群上發表自己的作品,讓創作更加多元豐富。
而因為創作影像的成本降低,教育單位人員和致力推廣科學普及化的教學人員,可以使用這樣的工具製作相關的影片,推廣他們想要推廣的知識;而社會上的弱勢族群,在過去因為缺少資源,較難以透過現在熱門的影音媒體在社群平台為自己發聲,但未來他們可以透過Sora這樣的AI工具,去製作自己的影片,從弱勢者的角度取得他們應有的發言權力,讓更多人以正確的角度認識他們、消彌不平等以及歧視的問題。
再者,對於娛樂產業和創意工作者來說,Sora令製作影像的成本大幅降低,他們更能夠使用這些工具去製作娛樂大眾的影片,行銷工作者也可以打造更多令人為之驚豔的廣告影音,進行產品的宣傳,這些都是Sora正式問世後可以預期到的正面影響。
3. 專家的憂心?

Above 假新聞與假訊息(Disinformation)透過TikTok、Facebook、X、Instagram等社群平台散佈已成為現代人所面臨的嚴重議題,而專家憂心Sora的誕生會造成這樣的現象更加嚴重。(Photo illustration by Jonathan Raa/NurPhoto via Getty Images)
然而,Sora的誕生可能讓想要從事影片創作卻無從學習的朋友感到振奮,卻也同時引發許多專家學者們的憂慮。非營利組織TrueMedia.Org成立以來,一直以協助人們對抗與辨識各種以deepfake等工具創作的造假影片、假新聞與假訊息(Disinformation),而其創辦人Oren Etzioni接受CBS News訪問時提出了他的擔憂。他認為,這樣便利的工具很可能會加劇與惡化假訊息透過網路傳播的速度和影響力,讓有心人士能夠藉此影響選舉結果、政治局勢以及操弄社會輿論風向,造成社會族群對立等嚴重問題。

Above 現在只需要透過deepfake技術,就能夠很快的生成造假影片,圖為利用deepfake技術產生Meta創辦人Mark Zuckerberg的換臉影片。(Elyse Samuels/The Washington Post via Getty Images)
對於弱勢族群而言,雖然他們可能透過AI製作為自己發聲的影片,但也可能讓部分人士製作充滿仇恨、歧視與誤導性的影片,加深人們對少數族群的誤解以及偏見!
Sora的出現也讓許多想要成為影像創作者維生或是現在的從業人員感到被取代的焦慮!在OpenAI的社群網站上,已經有網友指出,OpenAI所做的事情正在扼殺他們的夢想以及未來。正如2023年好萊塢大罷工當中所關注的議題,未來AI是否對於導演、製片、影像剪輯師等從業人員工作權益的受損,已經是值得各國政府和相關單位關切的重要議題。
4. OpenAI的規劃?

Above OpenAI已經成了生成式AI的指標性公司,而這次釋出Sora後勢必又再度為世界掀起一波震盪。而OpenAI也正以負責任的態度,審慎的評估與檢視Sora帶來的潛在危險性。(Photo by Alain Pitton/NurPhoto via Getty Images)
目前Sora仍然處在測試的階段,尚未向大眾開放,OpenAI也沒有公佈明確的時間表說明預計將在何時釋放這組AI讓更多人使用,但OpenAI顯然已經注意到Sora在未來可能會產生的負面影響以及隱憂,也正採取積極的手段,試圖在事前進行預防。
這套模組正處在測試的階段,OpenAI希望謹慎地處理這方面的問題,透過專業人士使用後的反饋、去預防Sora會創造誤導性和仇恨性的內容,對社會產生負面影響。OpenAI也表示,正在積極與立法機構、藝術創作者、教育界人士等緊密的討論,了解他們對於這套AI的看法、憂心,希望能夠建立完善的配套,讓Sora正式問世後、帶來的問題傷害減到最低。
而身處於這個AI快速發展的年代,每個人如何找到屬於自己的定位而不被AI所取代,甚至運用AI為自己創造更多機會、改善工作和生活處境,仍然會是當代人類所面臨的重要課題。




