再也不用『鑒AI』了,反正也看不出來
隨著AI所生成的圖像演變得越來越逼真,似乎 『AI不會畫手』,已經是AI作品所剩下的最突出的弱點了。
無論是前段時間AI筆下風格各異的二次元美少女;
文中圖均源於網路
還是最近AI經過真人圖片訓練所生成的虛擬妹子;
就好像受到了古神的詛咒一樣,在每一位AI生成的美少女姣好面容的背後,都存在著一些瞥一眼就會不斷掉san的畸形手指,讓人瞬間就失去了想要進一步探索的欲望。
而『AI不會畫手』這回事兒,也曾是不少畫家們嘲諷AI的談資——
在此前我所報道過的『畫師們在Artstation平臺上集體抗議AI入侵』的事件中,『手指』,就是這些抗議的聲音中的一個重要的元素。
藝術家們用筆刷畫下了這些造型扭曲惡心的手指,用以回擊Artstation這一國外最大的藝術平臺默許AI入侵的行為。
—— 不過,AI不會畫手的『詛咒』似乎在最近被打破了。
上周,Midjourney 宣佈他們推出了第五代版本——Midjourney V5。
和前幾次迭代一樣,V5在圖像質量、風格范圍和圖片紋理等等都有著一定程度的提升。
但這次大家發現了一個不一樣的地方:
AI終於學會畫手指了!
使用者發現,在更新V5之後,Midjourney渲染出圖像中,人物的手指根根分明,甚至連紋路都栩栩如生,刻畫出了歲月的痕跡。
而更新後的AI也會如炫技一般,從不把手指遮遮掩掩地放在身後,而是擺在最顯眼的地方,讓你根本看不出什麼端倪。
不僅如此,如果你執意仔細研究這些AI所生成的手部細節的話,這些圖片也並不會讓你失望。
更精細的手部細節
在學會畫手的同時,使用新版本的大家發現—— V5所生成的圖像更加高清和逼真,甚至有的到了真假難辨的情況。
相信使用過Midjourney的觀眾都知道,在此之前,Midjourney生成的圖片總體看還是以奇幻風格為主的。
而如今Midjourney V5所生成的圖片,已經達到了照片級別的程度。
V5生成的這張AI情侶照片
不僅會畫手,新版本在人臉的精細程度上也更上一層樓。
如果誰要在不經意之間拿出這樣的圖,我想大部分人都會毫不懷疑的認為,這是照相機拍攝的吧。
就在Midjourney V5的推出炸裂全網之後,很快它生成的真假難辨的圖片,就引發了一次大規模的社會輿論。
從這周二開始,twitter上就流傳著一組『特朗普被逮捕』的圖片。
此前特朗普自稱正面臨刑事指控,可能於本周被捕,而這組圖片更是加大了群眾的可信度,一時間『特朗普被捕』的消息火遍了全網。
不過很快就有人指出,這組圖片其實都是通過新版本的Midjourney生成的。
看來,在突破了手指的限制,擁有更好的圖像質量之後,AI似乎真的難以與真實事物區分開來,開始在社會上混淆視聽了。
那麼, 在AI的技術越來越成熟之後,AI真的是時候取代人類了嗎?
——先別著急,就現在其他AI的表現來看, 現在說『取代』可能還有些早了。
同樣是上周,在ChatGPT4推出的一天後,百度在發佈會上公佈了他們自研的AI工具『文心一言』。
在官方的介紹中, 文心一言除了可以提供類似於ChatGPT的對話問答功能外,還支持生成圖片、視頻等功能。
然而,作為國內第一個對標ChatGPT的AIGC,它的表現卻並不是那麼優秀。
讓人『大跌眼鏡』的,主要是在文心一言的 『文生圖』功能上。
雖說是百度擁有國內最大的中文搜索引擎,但文心一言就好像聽不懂中國話一樣,隻能夠理解字面意思,生成讓所有中國人瞳孔炸裂的圖片——
就比如說,『車水馬龍』是什麼樣的場面?
或許很多人腦內可能已經描繪出一副車馬如流水一般的繁華景象——不過在AI的眼裡,它所想的,就是這樣一個有車、水、龍,但唯獨沒有馬的奇幻場景。
再比如說『胸有成竹』這個成語,大家應該都明白是什麼意思吧。
然而在AI精確到每一個字的理解下,這位兄弟的胸上還真的長了根竹子。
或許通過上面兩張圖片,你已經掌握了文心一言的繪圖心得,而在看到下面這張『青梅竹馬』,你也就不奇怪了。
可能有的人覺得,對於現代的AI來說,要去理解古人幾千年琢磨出來的成語可能有些困難了。
但是,更奇葩的來了——AI對於現代詞匯的理解,我感覺還不如成語呢。
來幾個食物舉例吧。
AI生成的『魚香肉絲』可真的別有一番風味。
我想密恐人士可能在看到這張圖之後,都無法直視這道菜了。
再來上個『紅燒獅子頭』。
不過吃了這道菜,你接下來可能就要帶上一副銀手銬了。
如果你還沉浸在被『魚香肉絲』給震驚到的餘韻中,那麼下面這道『菜』,絕對能夠再一次震撼你的視覺神經——
文心一言是懂夫妻肺片的
好吧,看多了這些稍顯詭異的圖片,再來看看可愛的小動物們吧。
就比如說這盤『松鼠鱖魚』……不對啊,這是分明就是松鼠『撅』魚吧。
雖然理解不了除了字面意思上的其他含義,但文心一言在某些方面還是展現了它強大的學習和模仿能力。
就比如你讓它生成一張35歲的資深程序員的畫像——
嗯,的確沒毛病。
別的不說,在看了這麼多『乍一看有點懵,但仔細琢磨還真的挺形象』的圖片之後,我隻覺得:
用文心一言來玩你畫我猜應該挺有意思的。
可以說,這次的文心一言尚不成熟的文生圖程序,已經成為了繼前段時間簡易版圖片生成AI軟件之後的又一個能夠承包一整天笑點的AI樂子。
在百度的文心一言的文生圖功能遭到群嘲之後,也有不少人開始質疑:
『從文心一言生成的圖片看,它根本就是將中文先翻譯成英文,再通過英文輸入生成圖片的,不會是套了其他AI繪圖工具的殼吧』
在網友們的實踐中,能夠很明顯地看出文心一言將中文翻譯成英文的步驟:
就比如說讓它畫個『起重機』,AI生成了一個完全詞不達意的丹頂鶴——
實際上起重機在英文語境中,和鶴共用一個『crane』的單詞,所以在這樣扭曲的理解下,圖片中的工地多了隻丹頂鶴。
道理我都懂,為什麼這隻鶴這麼大?
再就是如果你輸入『王冰冰』這個人名,生成的也不是本人。
AI將中文翻譯成了『King』和『Ice』兩個單詞,於是在圖中你就可以看到一位『冰雪國王』。
對於網友們對文心一言套殼造假的質疑,百度在23號給出了回復,表示:
『文心一言的文生圖能力來自於文心跨模大模型ERNIE-ViLG。
而在訓練中我們使用的是全球互聯網公開數據,符合行業慣例』
也就是說,文心一言確實把輸入的中文句子,通過機器翻譯生成了單詞。
但這並不是網友們口中說的『套殼』,而是因為目前開源的圖文數據大部分為英文內容。
百度的畫圖AI采用了應為標註的開源圖片素材進行訓練,而這樣的訓練需要將提示詞中翻英,這才導致了上面這些『圖不達意』的圖片產生。
在文心一言鬧了個大笑話之後,百度表示:
『文心一言正在大家的使用過程中不斷學習和成長,也請大家給自研技術一些信心和時間』希望在不久之後,我們能夠看到文心一言全新的面孔。
在我看來,在AI不斷突破人類上限的技術沖擊下,像百度這樣搶先加入研究AI的行列的方式也是無可厚非的。
隻不過,可能還要再給文心一言一些時間吧。
事實上,如果你也關注AI這方面的新聞的話,你會發現——
最近這段時日,有太多廠商都開始爭先恐後地將AI技術納入自己的發展目標了:
3月22日,無數美工、設計師的生產力工具Adobe,也在前幾日宣佈加入AI的戰局。
在Adobe Summit用戶大會上,Adobe發佈了『Adobe Firefly』的私人測試版AI工具,利用這個工具,僅僅輸入文字,就可以協助創造者完成圖像生成、模型構建、圖像編輯以及圖形變體等各種任務。
Adobe Firefly強大的『塗鴉成畫』功能
除了設計領域,遊戲行業也沒有落後追隨AI的腳步。
3月23日,育碧發佈了一款新的人工智能工具『Ubisoft Ghostwriter』,並且生成這款AI將用於生成觸發NPC臺詞和周圍群眾聊天內容的初稿。
育碧表示AI工具的誕生能夠讓開發團隊騰出更多的時間,來處理更為重要的元素:『Ghostwriter 是與敘事團隊共同創建的,旨在幫助他們更快更有效地完成重復性任務,讓他們有更多時間和自由去處理遊戲的敘事、角色和劇情』
在3月21日晚,英偉達的第14次GTC大會上,英偉達的創始人黃仁勛就發表了一段長達78分鐘的演講《切勿錯過AI的決定性時刻》。
在演講時,他多次強調—— 『AI已進入iPhone時刻』。
可以預見的是, 隨著AI滲透到各個領域,AI技術帶來的工作形式的轉變,將會影響到各行各業。
這兩天一直掛在小紅書熱搜上的,就是有關AI顛覆職業的內容。
隨著AI生成圖像的精度提升,將圖片中的服裝轉移到AI模特的『一鍵換裝』功能正在成為了討論的熱點。
從生成的圖片來看,AI模特身上的衣服效果和原圖並沒什麼大的區別,甚至還能夠自由變換想要的姿勢。
真人模特《左》 AI模特《右》
對於店家來說,AI模特的誕生能夠給他們帶來更多的便利。
不僅僅是省錢,還能夠提高效率,這樣一鍵生成的方式能夠讓他們隨時隨地的上架新的的產品。
然而,如果AI模特真的得到廣泛應用,我想不止是會影響到模特的行業,對攝影師、化妝師以及場地租賃人員等等行業來說,都會帶來不小的沖擊。
雖然我不確定AI是否能完全替代這些創造型的工作,但我知道,隨著AI滲透到各行各業,一個全面應用AI的時代已經逐漸到來。
也許目前AI仍未波及到所有的行業,但如果不想被AI所取代的話,我想每個人都要做好『駕馭』它的準備了。