再也不用『鑒AI』了，反正也看不出來。

小編輯

2023-09-30

chat GPT

再也不用『鑒AI』了，反正也看不出來

隨著AI所生成的圖像演變得越來越逼真，似乎『AI不會畫手』，已經是AI作品所剩下的最突出的弱點了。

無論是前段時間AI筆下風格各異的二次元美少女；

文中圖均源於網路

還是最近AI經過真人圖片訓練所生成的虛擬妹子；

就好像受到了古神的詛咒一樣，在每一位AI生成的美少女姣好面容的背後，都存在著一些瞥一眼就會不斷掉san的畸形手指，讓人瞬間就失去了想要進一步探索的欲望。

而『AI不會畫手』這回事兒，也曾是不少畫家們嘲諷AI的談資——

在此前我所報道過的『畫師們在Artstation平臺上集體抗議AI入侵』的事件中，『手指』，就是這些抗議的聲音中的一個重要的元素。

藝術家們用筆刷畫下了這些造型扭曲惡心的手指，用以回擊Artstation這一國外最大的藝術平臺默許AI入侵的行為。

—— 不過，AI不會畫手的『詛咒』似乎在最近被打破了。

上周，Midjourney 宣佈他們推出了第五代版本——Midjourney V5。

和前幾次迭代一樣，V5在圖像質量、風格范圍和圖片紋理等等都有著一定程度的提升。

但這次大家發現了一個不一樣的地方：

AI終於學會畫手指了！

使用者發現，在更新V5之後，Midjourney渲染出圖像中，人物的手指根根分明，甚至連紋路都栩栩如生，刻畫出了歲月的痕跡。

而更新後的AI也會如炫技一般，從不把手指遮遮掩掩地放在身後，而是擺在最顯眼的地方，讓你根本看不出什麼端倪。

不僅如此，如果你執意仔細研究這些AI所生成的手部細節的話，這些圖片也並不會讓你失望。

更精細的手部細節

在學會畫手的同時，使用新版本的大家發現—— V5所生成的圖像更加高清和逼真，甚至有的到了真假難辨的情況。

相信使用過Midjourney的觀眾都知道，在此之前，Midjourney生成的圖片總體看還是以奇幻風格為主的。

而如今Midjourney V5所生成的圖片，已經達到了照片級別的程度。

V5生成的這張AI情侶照片

不僅會畫手，新版本在人臉的精細程度上也更上一層樓。

如果誰要在不經意之間拿出這樣的圖，我想大部分人都會毫不懷疑的認為，這是照相機拍攝的吧。

就在Midjourney V5的推出炸裂全網之後，很快它生成的真假難辨的圖片，就引發了一次大規模的社會輿論。

從這周二開始，twitter上就流傳著一組『特朗普被逮捕』的圖片。

此前特朗普自稱正面臨刑事指控，可能於本周被捕，而這組圖片更是加大了群眾的可信度，一時間『特朗普被捕』的消息火遍了全網。

不過很快就有人指出，這組圖片其實都是通過新版本的Midjourney生成的。

看來，在突破了手指的限制，擁有更好的圖像質量之後，AI似乎真的難以與真實事物區分開來，開始在社會上混淆視聽了。

那麼，在AI的技術越來越成熟之後，AI真的是時候取代人類了嗎？

——先別著急，就現在其他AI的表現來看，現在說『取代』可能還有些早了。

同樣是上周，在ChatGPT4推出的一天後，百度在發佈會上公佈了他們自研的AI工具『文心一言』。

在官方的介紹中，文心一言除了可以提供類似於ChatGPT的對話問答功能外，還支持生成圖片、視頻等功能。

然而，作為國內第一個對標ChatGPT的AIGC，它的表現卻並不是那麼優秀。

讓人『大跌眼鏡』的，主要是在文心一言的『文生圖』功能上。

雖說是百度擁有國內最大的中文搜索引擎，但文心一言就好像聽不懂中國話一樣，隻能夠理解字面意思，生成讓所有中國人瞳孔炸裂的圖片——

就比如說，『車水馬龍』是什麼樣的場面？

或許很多人腦內可能已經描繪出一副車馬如流水一般的繁華景象——不過在AI的眼裡，它所想的，就是這樣一個有車、水、龍，但唯獨沒有馬的奇幻場景。

再比如說『胸有成竹』這個成語，大家應該都明白是什麼意思吧。

然而在AI精確到每一個字的理解下，這位兄弟的胸上還真的長了根竹子。

或許通過上面兩張圖片，你已經掌握了文心一言的繪圖心得，而在看到下面這張『青梅竹馬』，你也就不奇怪了。

可能有的人覺得，對於現代的AI來說，要去理解古人幾千年琢磨出來的成語可能有些困難了。

但是，更奇葩的來了——AI對於現代詞匯的理解，我感覺還不如成語呢。

來幾個食物舉例吧。

AI生成的『魚香肉絲』可真的別有一番風味。

我想密恐人士可能在看到這張圖之後，都無法直視這道菜了。

再來上個『紅燒獅子頭』。

不過吃了這道菜，你接下來可能就要帶上一副銀手銬了。

如果你還沉浸在被『魚香肉絲』給震驚到的餘韻中，那麼下面這道『菜』，絕對能夠再一次震撼你的視覺神經——

文心一言是懂夫妻肺片的

好吧，看多了這些稍顯詭異的圖片，再來看看可愛的小動物們吧。

就比如說這盤『松鼠鱖魚』……不對啊，這是分明就是松鼠『撅』魚吧。

雖然理解不了除了字面意思上的其他含義，但文心一言在某些方面還是展現了它強大的學習和模仿能力。

就比如你讓它生成一張35歲的資深程序員的畫像——

嗯，的確沒毛病。

別的不說，在看了這麼多『乍一看有點懵，但仔細琢磨還真的挺形象』的圖片之後，我隻覺得：

用文心一言來玩你畫我猜應該挺有意思的。

可以說，這次的文心一言尚不成熟的文生圖程序，已經成為了繼前段時間簡易版圖片生成AI軟件之後的又一個能夠承包一整天笑點的AI樂子。

在百度的文心一言的文生圖功能遭到群嘲之後，也有不少人開始質疑：

『從文心一言生成的圖片看，它根本就是將中文先翻譯成英文，再通過英文輸入生成圖片的，不會是套了其他AI繪圖工具的殼吧』

在網友們的實踐中，能夠很明顯地看出文心一言將中文翻譯成英文的步驟：

就比如說讓它畫個『起重機』，AI生成了一個完全詞不達意的丹頂鶴——

實際上起重機在英文語境中，和鶴共用一個『crane』的單詞，所以在這樣扭曲的理解下，圖片中的工地多了隻丹頂鶴。

道理我都懂，為什麼這隻鶴這麼大？

再就是如果你輸入『王冰冰』這個人名，生成的也不是本人。

AI將中文翻譯成了『King』和『Ice』兩個單詞，於是在圖中你就可以看到一位『冰雪國王』。

對於網友們對文心一言套殼造假的質疑，百度在23號給出了回復，表示：

『文心一言的文生圖能力來自於文心跨模大模型ERNIE-ViLG。

而在訓練中我們使用的是全球互聯網公開數據，符合行業慣例』

也就是說，文心一言確實把輸入的中文句子，通過機器翻譯生成了單詞。

但這並不是網友們口中說的『套殼』，而是因為目前開源的圖文數據大部分為英文內容。

百度的畫圖AI采用了應為標註的開源圖片素材進行訓練，而這樣的訓練需要將提示詞中翻英，這才導致了上面這些『圖不達意』的圖片產生。

在文心一言鬧了個大笑話之後，百度表示：

『文心一言正在大家的使用過程中不斷學習和成長，也請大家給自研技術一些信心和時間』希望在不久之後，我們能夠看到文心一言全新的面孔。

在我看來，在AI不斷突破人類上限的技術沖擊下，像百度這樣搶先加入研究AI的行列的方式也是無可厚非的。

隻不過，可能還要再給文心一言一些時間吧。

事實上，如果你也關注AI這方面的新聞的話，你會發現——

最近這段時日，有太多廠商都開始爭先恐後地將AI技術納入自己的發展目標了：

3月22日，無數美工、設計師的生產力工具Adobe，也在前幾日宣佈加入AI的戰局。

在Adobe Summit用戶大會上，Adobe發佈了『Adobe Firefly』的私人測試版AI工具，利用這個工具，僅僅輸入文字，就可以協助創造者完成圖像生成、模型構建、圖像編輯以及圖形變體等各種任務。

Adobe Firefly強大的『塗鴉成畫』功能

除了設計領域，遊戲行業也沒有落後追隨AI的腳步。

3月23日，育碧發佈了一款新的人工智能工具『Ubisoft Ghostwriter』，並且生成這款AI將用於生成觸發NPC臺詞和周圍群眾聊天內容的初稿。

育碧表示AI工具的誕生能夠讓開發團隊騰出更多的時間，來處理更為重要的元素：『Ghostwriter 是與敘事團隊共同創建的，旨在幫助他們更快更有效地完成重復性任務，讓他們有更多時間和自由去處理遊戲的敘事、角色和劇情』

在3月21日晚，英偉達的第14次GTC大會上，英偉達的創始人黃仁勛就發表了一段長達78分鐘的演講《切勿錯過AI的決定性時刻》。

在演講時，他多次強調—— 『AI已進入iPhone時刻』。

可以預見的是，隨著AI滲透到各個領域，AI技術帶來的工作形式的轉變，將會影響到各行各業。

這兩天一直掛在小紅書熱搜上的，就是有關AI顛覆職業的內容。

隨著AI生成圖像的精度提升，將圖片中的服裝轉移到AI模特的『一鍵換裝』功能正在成為了討論的熱點。

從生成的圖片來看，AI模特身上的衣服效果和原圖並沒什麼大的區別，甚至還能夠自由變換想要的姿勢。

真人模特《左》 AI模特《右》

對於店家來說，AI模特的誕生能夠給他們帶來更多的便利。

不僅僅是省錢，還能夠提高效率，這樣一鍵生成的方式能夠讓他們隨時隨地的上架新的的產品。

然而，如果AI模特真的得到廣泛應用，我想不止是會影響到模特的行業，對攝影師、化妝師以及場地租賃人員等等行業來說，都會帶來不小的沖擊。

雖然我不確定AI是否能完全替代這些創造型的工作，但我知道，隨著AI滲透到各行各業，一個全面應用AI的時代已經逐漸到來。

也許目前AI仍未波及到所有的行業，但如果不想被AI所取代的話，我想每個人都要做好『駕馭』它的準備了。