2022雖然不是ai繪圖這項技術誕生的時間,但卻是到目前為止最爆火出圈的繪圖元年。
AI繪圖《AI painting》就是以文生圖《text2image》,屬於跨模態生成《Cross-modal generation》的一種:指的是將一種模態《文本、圖像、語音》轉換成另一種模態,同時保持模態之間的語義一致性。
如此爆火的AI繪圖,在哪裡可以生成效果驚艷的圖呢?今天就給大家推薦7款AI繪畫工具,詳細介紹每一款工具的功能以及價格,希望你看完這篇能找到適合自己的AI繪畫工具。
1、PicUP.AI
皮卡智能《PicUP.AI》在經過反復測試,終於正式上線了!相比其他AI作畫神器,PicUP速度更快,生成效果更好,最重要是全站中文,每5秒鐘就能生成一張圖。
用戶可以發揮想象,輸入文字描述後,便可生成1:1的圖片。還有15種繪畫風格可以選擇,除了基礎的動漫、寫實風之外,主要是一些特別風格的生成,例如超現實主義、陰冷系、賽博風、空靈、科幻、蒸汽朋克等。
除此之外,PicUP.AI還有圖生圖功能,這是在文生圖基礎上的進一步嘗試,只要上傳一張參考圖,便可以生成與該圖風格相近的圖片,也可以在原畫的基礎上添加自己的創意。如果你對生成結果不滿意,還可以重新生成。
你生成的每一張圖片都可以在線發佈,可在『畫廊』中查看,讓更多用戶看到你的作品。目前支持免費有水印下載,想要下載無水印圖片需要消耗5個圖片處理點數。
2、DALL-E 2
DALL-E和升級版DALL-E 2都來源於OpenAI團隊,這個由馬斯克參與創辦的國際頂級AI研究機構在2020年7月公佈Image GPT模型,將在自然語言處理上取得突破性成就的Transformer模型引入圖像補全及生成任務。 不僅在2021年1月開源了新的深度學習模型 CLIP《Contrastive Language-Image Pre-Training)-一個當今最先進的圖像分類人工智能,並且推出了全新AI模型DALL·E。隻需輸入文字描述,DALL·E就能畫出符合要求的一系列備選圖像。可以說這是最早實現『以文生圖』的平臺。
DALL-E 2是它的升級版。特點是風格寫實,操作足夠簡單,完成度高,速度快到可以當搜索引擎:60秒內生成 10 張圖片《1024 × 1024》,可無限延伸變化,甚至可以擦除局部重新生成。
新用戶每月免費生成200張圖片,之後每月60張,後續15美元可生成460張。
在版權方面,DALL·E 2 背後的組織 OpenAI 列了幾條嚴格的限制:圖片生成版權最終歸屬 OpenAI;僅供個人學習探索使用,不能商用,不能用於制作 NFT;不能在社交媒體上發佈過於寫實的人臉生成結果,會有肖像侵權風險。
3、Midjourney
Midjourney便是之前生成畫作『太空歌劇院』戰勝人類畫手獲獎的平臺。
它的特點是界面簡潔,選擇多樣。Midjourney 搭在了通訊軟件 Discord 上,在對話框輸入『/image』後,用英文輸入描述詞,然後按下回車鍵。這個過程就像在和 AI 聊天一下。60 秒後,你就可以在對話框裡收到 4 張渲染好的圖片。如果對『圖 1』不滿意,可以點擊『U1』按鈕增加細節,按『V1』按鈕延伸變化,直到滿意為止。
Midjourney擁有創作社區,零門檻的交互和非常好的輸出結果,從輸出風格上看,非常明顯針對人像做了一些優化並且風格傾向也比較明顯。
每個新用戶有生成25張圖片的機會,想要生成更多圖片,則需要付費,基本會員10美元/月,有生成200張圖片的機會;標準會員30美元/月,可以無限制生成圖片。
版權方面,如果你是免費用戶,圖像的版權歸屬於 AI,每月支付 30 美元後,就能將圖片拿去商用了。但同時,如果你因此獲利達兩萬美元以上,則需要給 Midjourney 20% 的分成。因為是付費業務,所以MidJourney的迭代非常快。
4、Disco Diffusion
如果說 DALL- E 2 擅長寫實,那麼Disco Diffusion 則更擅長描繪氛圍、風景極各種概念藝術。
Disco Diffusion 可以實現最復雜的關鍵詞描述,支持自設置的參數很多,是一個待探索的巨大寶庫,但是成圖時間長,操作界面也相對復雜:不需要下載任何軟件,直接在瀏覽器上就能運行,並且現階段免費,不過操作比較麻煩。一整個網頁都是代碼,操作困難,一般來說,你需要等半個小時,如果盯著屏幕看,你會看到圖像從滿是噪點,逐漸變得清晰、有細節起來。使用期間,Disco Diffusion 可能會提示你在電腦上空出足夠的運行內存,但因為它運行在google免費提供的 GPU 等計算資源上,對用戶的電腦硬件要求並不高,打開瀏覽器運行就可以。除了隻輸入文字讓 AI 自由發揮,你還可以事先墊進一張初始化圖片《Initial Image》去約束 AI 的創作。
Disco Diffusion 生成圖理論上可以商用,其程序基於 MIT 開源協議,所有互聯網用戶可以免費使用、復制、修改甚至出售生成圖。但還是存有風險。風險主要來源於你的描述詞會引來畫風抄襲的爭議。
5、Stable Diffusion
Stable Diffusion被認為是目前最強的 AI 繪畫工具,已完全開源,市面上還有很多』變體『,比如專用來生成二次元人像的 Waifu Diffusion。能快速(以秒計算)生成一張飽含細節的512×512圖像,隻需要一張消費級的8GB 2060顯卡就能實現DALL-E 2級別的圖像生成,且生成效率可提高30倍。風格上明顯更藝術化,且上手操作無難度。
收費標準:有200 張的免費生成額度,之後需要付費購買點數《生成越復雜,尺寸越大,消耗的點數越多》。
版權要求:可以商用自己創作的圖像,但圖像如果是通過 DreamStudio 生成的,就自動變成了 CC0 1.0 授權,這樣,服務提供商 Stability.ai 也能處理你的圖像,無需付費甚至不會經過你同意,也會一並成為通用公共領域 royalty-free 的圖片資源。如果是你自己部署了開源的 Stable Diffusion,消耗的是你自己的 GPU 資源,那著作權都歸你所有。
6、Google
google作為最早研究ai繪畫的公司之一,早在2015年便推出了Deep Dream。最近他們則是一口氣發佈了兩款模型:Imagen和Parti。
Imagen 的圖像生成具有與 DALL-E 2 相似的擴散模型,但輸入依據的是大型 AI 語言模型—由於具有更高的語言理解能力,因此可以從文本描述獲得更好的圖像生成結果。
新的 AI 模型 Parti 《Pathways Autoregressive Text-to-Image》嘗試使用一種更接近大型語言模型功能的替代架構《自回歸》,這些語言模型能根據之前的單詞和句子或段落的上下文預測合適的新詞。Parti 將這一原則應用於圖像,並取得了成功。Parti 可以將長而復雜的文本輸入準確地翻譯成圖像,這表明它可以更好地理解語言和主題之間的關系。
伴隨著 Parti 的發佈,還有一篇部落格文章描述了使用 Google 的文本到圖像模型創建圖像的過程,但目前Imagen和Parti還未發佈測試版本,其具體使用性如何還有待考證。
7、NovelAI和其他
如果你想嘗試二次元風格,那麼一定要嘗試一下NovelAI。AI繪畫功能收費,:10美元月費1000代幣,25美元月費10000代幣,每幅畫都消耗一定代幣。NovelAI是cc0版權,即公有版權。
除了這些應用外,更多的模型和商用應用在也源源不斷地出現:微軟推出的NUWA-Infinity,Meta推出的Make-A-Scene和其他平臺如NightCafe Creator 和 WOMBO Dream。
總的來說,AI 繪畫產生的素材可以用來打草稿或者發散思維,也可以成為素材、靈感、抽象概念、色彩效果的參考。最重要的是,生成速度較快的 AI 繪畫工具,能快速幫助畫師們和設計師們構建多種可能性,提供更多思路以及意外的想法。
大家對於AI繪畫是如何看的?你會用這些AI繪畫工具嗎?歡迎評論區留言。