圖片來源@視覺中國
文 | Alter
文 | Alter
在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下,不少人或多或少聽說過Prompt的概念。
雖然OpenAI掀起的大模型浪潮再度刷新了人們對AI的認知,但現階段的AI終歸還不是強人工智能,大模型裡的『知識』存儲在一個隱性空間裡,需要輸給AI正確的指令,也就是過去幾個月中頻頻被討論的Prompt。
有人將Prompt翻譯成『提示詞』,也有人翻譯為『激發詞』。
再感性一些,就像童話故事裡的魔法一樣,Prompt是AI時代的魔法,擁有它就擁有『巫師』一樣的能力。
01 Prompt是什麼?
並不難理解Prompt的字面含義,可為何會出現Prompt這個概念?既然是ChatGPT炒熱的新名詞,不妨讓ChatGPT自己來回答。
這個回答中規中矩,但還是可以提取到一些有價值的信息:一,Prompt繼承了計算機編程裡的命令行提示符,可以理解為控制AI的指令;二,在生成式AI的語境裡,Prompt的價值在於引導,而非計算機裡的命令。
打個比方的話:大模型就像是人類的大腦,知識被存儲在神經元聯接中,隻有當你遇到具體的問題時,就像『你最喜歡的食物是什麼?』大腦才會給出確切的答案,Prompt等於是一個個具象的問題。
由此產生了一種流行的說法,即提問比回答更重要。
你使用ChatGPT所遇到的『邊界』,實際上是你自己的『邊界』。
但Prompt的價值體現,並不在於ChatGPT代表的對話機器人,而是Midjourney為首的圖像生成類應用。
簡單來說,你要告訴AI想要什麼樣的圖,想要把自己腦海裡的東西變成肉眼可見的圖案,需要幾十個單詞作為Prompt。
哪怕隻有一個提示詞的差異,AI所生成的圖像都可能有著質的差別,怎麼正確地給AI投喂Prompt,逐漸成了一門深奧的學問,並衍生出了提示語工程學《Prompt Engineering》的說法。
以至於在衡量大模型的能力時,出現了三個標準:一是大模型的預訓練水平;二是用來進行預訓練語料數量和質量;三是提示語的水平。
直接的例子就是外界對文心一言文生圖的質疑,即使不考慮前兩個因素,單單在提示詞方面,就足以讓文心一言和Midjourney拉開幾條街的距離。
因為在文心一言上想要生成圖片,普遍給的指令是:幫我生成一張XXX《這也是百度官方的示例》,解析為Prompt時註定隻有幾個提示詞,遠不足以表達腦海裡想要的畫面;同樣的需求給Midjourney,可能是十幾個乃至幾十個提示詞,大模型可以更準確地理解並輸出用戶想要圖案。
理解了這些差異,便不難讀懂Prompt走紅的原因。
目前大模型對算力的要求很高,以OpenAI的DALL・E為例,生成一張圖片的收費約0.02美元,如果讓不懂Prompt的人去調用模型,大概率會浪費掉一次次算力。
何況當前想要生成滿意的圖片,需要不斷重復調整,能否熟練運用Prompt,直接左右了大模型所能釋放的生產力。
02 Prompt 還能賺錢?
利用信息差賺錢向來是最容易做的生意,生成式AI也不例外,Prompt作為AI時代的魔法,已然成了不少人用來『賺錢』的生產資料。
第一種:直接售賣Prompt。
國外已經出現了PromptBase等明碼標價的平臺,涉及Midjourney、Stable Diffusion、DALL・E、GPT等多個模型,而且適用的場景越來越細分,包括音樂創作、兒童插畫、油畫藝術、人物肖像等等,即便是不擅長整理提示詞的普通用戶,也可以直接復制Prompt生成相對不錯的作品。
其實國內也有類似的現象,一些商家早已在電商平臺上兜售Prompt,也有一些人將Prompt做成面向垂直任務場景的應用,比如AI 寫評語、AI寫郵件、AI翻譯等等,吸引剛需用戶按月付費使用。
第二種:用Prompt換流量。
國內最早一批售賣AI課程的自媒體,多半將Prompt作為吸引用戶付費的籌碼;小紅書等年輕人紮堆的平臺上,早早出現了分享Prompt的筆記;B站、抖音等視頻平臺上,教用戶使用Prompt的教程已不可計數。
個中邏輯並不復雜。
Prompt是駕馭AI的『咒語』,但提示詞本身並沒有版權效應,或許直接兜售Prompt可以快速賺錢,終歸是不長久的買賣。
將Prompt作為漲粉工具,趁機吸引到可觀的粉絲群體,在流量變相高度繁榮的互聯網江湖,無疑更符合市場規律,也是Prompt被廣泛討論的另一重誘因。
第三種:靠Prompt『找工作』
正如前面所提到的,正確使用Prompt已經是提升生產力的前提,不單單產生了提示語工程,還醞釀出了一批『提示詞工程師』《Prompt Engineer》。
國外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速漲粉,然後被矽谷獨角獸Scale AI聘請為『提示詞工程師』,據說年薪高達百萬人民幣;另一位名為Jason M. Allen的藝術家,則使用Midjourney贏得了Colorado State Fair周年藝術比賽……如果說計算機時代的能力密碼是編程,在生成式AI席卷全球的當下,Prompt正悄悄成為數以萬計打工人『傍身』的工具。
至少就目前來看,程序員群體裡已經漸漸興起兩股風潮:一類人瞄準了OpenAI等大模型企業的API,想要坐在人工智能的副駕駛上創業;另一類人打起了創造Prompt的主意,想要利用信息差賺到第一桶金。
倘若ChatGPT的出現當真是所謂的iPhone時刻,圍繞Prompt的生意其實才剛剛開場。
03 Prompt 隻是過渡?
相對應的一個問題是,Prompt是否是人工智能大眾化不可或缺的一環?這個問題的答案直接影響著Prompt和Prompt Engineer的紅利周期。
Open AI 的 CEO Sam Altman曾公開表示:五年後,就不再需要 Prompt Engineering。
也許在接下來的一段時間裡,我們仍需要提示語,需要去創造 Prompt,但生成式AI的發展速度可能超乎想象,AI對人類的理解力遠未觸達天花板。
可以佐證的是,第一代iPhone上市時還沒有App Store,僅預裝了瀏覽器、iPod、郵件等少量應用,想要安裝其他應用,需要在電腦上安裝iTunes,用USB線將iPhone連接到電腦……為了解決用戶體驗上的局限性,越獄工具和第三方應用商店應運而生,但在蘋果引入App Store後,越獄工具漸漸被丟進了歷史的故紙堆。
同樣的問題詢問ChatGPT,答案似乎客觀了許多。
想要不用特定Prompt就能和AI流暢對話,ChatGPT認為需要解決四個挑戰:
1、AI需要更好地理解語境和連貫性,哪怕用戶像《大話西遊》裡的唐僧一樣喋喋不休,或者語無倫次,AI也可以準確理解用戶的意圖,這樣就不需要精確的提示詞,用自然語言進行提問。
2、AI需要有豐富的常識和推理能力,即根據特定的信息和場景做出合理的回應,而非像現在的模型那樣『對牛彈琴』,比如中文裡的多義詞、不同場景下不同含義的語氣詞,非常考驗推理能力。
3、AI需要理解和處理情感信息,這也是當前AI研究的重心所在。
人的情感可以有很多種表達方式,文字隻是其中重要的一種。
在大模型不斷向多模態演進時,視覺和聲音是否也可以傳遞信息?
4、AI需要有主動學習和適應能力。
主動學習是指AI系統在學習過程中,能夠主動選擇最具信息量的樣本進行學習,在數據稀缺的情況下做出更好的決策;適應能力是指AI在面臨新的任務、場景或環境變化時,能夠自我調整並優化其行為。
按照ChatGPT的標準,在Prompt消失的時候,勢必已經進入到了強人工智能時代,目前還有很長一段距離。
Prompt及其衍生機會的消亡是一種歷史必然,在時間上仍有很大的不確定性,也許會很快出現另一場技術爆炸;也許AI會進入新一輪的瓶頸期, Sam Altman的五年預期不過是『盲目樂觀』。
04 寫在最後
或許可以借用科技媒體《VentureBeat》的說法:現在已經到了AI藝術的轉折點,未來的藝術家無論是自學成才還是科班出身,都需要有創造Prompt的能力,需要理解和學習數據科學,以及大模型的工作原理。
進一步延伸的話,需要有這些能力的絕不隻是藝術家,任何職業、任何行業的工作都不可避免和AI協作,將人類的思考和需求註入給AI,不斷更新、創造Prompt,將是大多數人必須要掌握的一種技能,就像現在必須要用輸入法打字一樣。