google推出對話式AI服務Bard,未來幾周將開放給大眾。

北京時間 2 月 7 日凌晨,google CEO 桑達爾·皮查伊《Sundar Pichai》宣佈,google將推出一款由 LaMDA 模型支持的對話式人工智能服務,名為 Bard。

google推出對話式AI服務Bard,未來幾周將開放給大眾。《來源:Google》

皮查伊稱這是『google人工智能旅途上的重要下一步』。

他在部落格文章中介紹稱:Bard 尋求將世界知識的廣度與大型語言模型的力量、智慧和創造力相結合。它將利用來自網路的信息來提供新鮮的、高質量的回復。它既是創造力的輸出口,也是好奇心的發射臺。

他還表示,Bard 的使用資格將首先『發放給受信任的測試人員,然後在未來幾周內開放給更廣泛的公眾』。雖然具體時間尚未公佈,但考慮到google目前的處境,或許不需要很久我們就能一睹為快。

與此同時,皮查伊還宣佈google搜索引擎將加入更多新的人工智能《AI》功能和服務。『人類的許多問題是主觀且沒有正確答案的,AI 可以在這些時候提供幫助和綜合見解……將復雜的信息和多個視角提煉成易於理解的形式,以便用戶快速了解全局並從網上獲得更多信息,』他寫道。

雖然沒有指名道姓,但 Bard 對話式 AI 服務的定位,很明顯是google為了應對 OpenAI 的 ChatGPT 而推出的競爭產品,而在搜索引擎中加入更多的、更強大的 AI 功能,也是為了對抗可能很快到來的、在 AI 技術《很可能是 ChatGPT》加持下的微軟必應搜索引擎。

ChatGPT 是 OpenAI 在 2022 年 11 月推出的對話式人工智能機器人,以驚人的對話表現和高質量的輸出內容引爆網路,甚至以一己之力徹底帶火了人工智能生成內容《AIGC》的賽道,讓微軟、google等公司紛紛在相關領域加註。最新統計數據顯示,ChatGPT 推出不到 2 個月,月活用戶數量就已超過 1 億,而短視頻殺手級應用 TikTok 用了 9 個月才實現這一目標。

根據描述,Bard 的工作方式大概率與 ChatGPT 類似,都是通過對話來回答用戶的問題或者提供用戶想要的信息,用戶可以不斷地追問、改進、豐富自己的問題,讓 AI 的回答更貼近自己想要的東西。

在介紹 Bard 時,google使用的案例是『用 9 歲小孩可以聽懂的話,介紹一下詹姆斯韋伯太空望遠鏡的最新發現』。這是一個復雜的話題,而google要展示的能力是用 Bard 簡化它。

Bard 給出的回應列出了三個最新發現,段落清晰,用詞簡單,還使用了比喻讓內容更易理解,而且在對 9 歲小孩可能沒掌握的詞根『Exo』加以註釋,可以說是理解力和解釋力雙滿分。

圖 | Bard 介紹詹姆斯韋伯太空望遠鏡的最新發現《來源:google》

根據介紹,最初發佈的 Bard 服務,將使用輕量級 LaMDA 模型。從執行任務的角度來看,輕量級模型將需要更少的算力,從而讓google可以擴展和服務更多的用戶。

目前還不清楚 Bard 將使用多麼『輕量級』的 LaMDA 模型。LaMDA 模型的全名是 Language Model for Dialogue Applications《對話應用的語言模型》,最早在 2021 年的google I/O 大會上公佈,後於 2022 年更新為第二代。它基於 Transformer 神經網路架構,使用高達 1370 億個參數進行訓練,它的訓練數據是對話內容,而非普通的句子和文章。

經過多年的打磨和實踐,LaMDA 模型的強大是毋庸置疑的。2022 年 6 月,google AI 工程師 Blake Lemoine 甚至公開表示,他認為 LaMDA 已經有了人格意識,具有相當於八歲兒童的智力。此番言論被google和許多從業者認為是證據不足,也導致該工程師被帶薪休假,但這也反應出模型確實具有很強的對話技巧。

google表示,在用戶使用 Bard 時,他們將會收集外部反饋並與內部測試相結合,以確保『Bard 的回答在質量、安全性和根基性《真實性》等關鍵方面達到高標準』。值得注意的是,這三點正是google研究人員在 LaMDA 模型中最看重的三個核心目標。

這一點與 OpenAI 對 ChatGPT 所做的類似。自推出以來,OpenAI 已經對 ChatGPT 進行了多次大大小小的更新,包括對問題接受程度的提高,對回答質量的改進,產品功能性優化和數學能力強化等等。不僅如此,OpenAI 還推出了付費版 ChatGPT,ChatGPT Plus 服務,包括更快的響應速度和提前體驗未來的新功能。

圖 | ChatGPT 的更新日志《來源:OpenAI》

可以預見的是,Bard 上線之後,google可能也會不斷推出更新和優化,比如參數更多的 LaMDA 模型,甚至是類似的訂閱制服務。

畢竟在動蕩不安的宏觀經濟環境下,科技巨頭們已經陸續裁員。接下來我們很可能看到,投入長期人工智能研究的資金減少,同時讓相關技術產生經濟利益的壓力增大。企業實驗室的研究人員將面臨更大壓力,以證明他們的研究成果可以整合到產品中,從而為企業賺錢。

可以說,Bard 將成為google的一款產品。在此基礎上,google還將開放同樣由 LaMDA 模型驅動的生成式語言 API《Generative Language API》,供第三方開發者和企業使用,從而推動更多創新。API 服務預計將在下個月開放,同時皮查伊也表示,google會開放更多的 AI 模型驅動的 API 並開發配套工具。

『重要的是,我們要以大膽和負責任的方式,將根植於這些《人工智能》模型裡的經驗帶給整個世界。所以我們致力於負責任地開發人工智能,』皮查伊寫道,『無論是應用 AI 徹底改造我們自己的產品,還是讓其他人可以使用這些強大的工具,我們都將繼續大膽創新,並用我們的方法負責。這僅僅是個開始——在接下來的幾周和幾個月裡,所有這些《產品》領域都會看到更多更新。』

圖 | google展示人工智能如何改善搜索結果《來源:google》

『紅色代碼』

早在 2019 年和 2021 年,微軟就曾投資 OpenAI。ChatGPT 推出後,微軟很快就宣佈了對 OpenAI 進行『持續多年、數十億美元』規模的投資,以拓展兩家公司的合作夥伴關系。此後,有關微軟要將以 ChatGPT 為代表的 AI 技術與旗下多款產品深度整合的消息層出不窮。

正所謂『近水樓臺先得月』,ChatGPT 再開放,與其他企業的合作再深入,也不會比與『金主』微軟的合作更早、更快、更深入。一個最明顯的例子:被google搜索牢牢壓制的必應搜索引擎或許會因此煥發新生。

微軟當然不會放過這個好機會,就在皮查伊官宣 Bard 之後,微軟很快就表示要在周二《美國時間 2 月 7 號》召開一場發佈會,我們可以期待看到更具體的、由人工智能驅動的產品更新——這甚至早於google原定於周三在巴黎召開的有關搜索引擎的發佈會。

同樣也是在皮查伊官宣 Bard 之後,已有媒體表示獲得了一份google內部備忘錄,也是由他發佈的。

據稱,內部備忘錄號召所有google內部員工,以『參加 Hackathon《編程馬拉松》的態度』齊心協力測試 Bard,踴躍提供反饋和建議,因為『《該服務》現在還處於早期階段,需要快速迭代』。皮查伊還表示,google將很快開始招募開發人員和企業,來測試前文提到的、基於 LaMDA 的 API。

所有這些行動,一方面顯示出google、微軟等科技巨頭對 AIGC 技術的高度重視,另一方面也凸顯出他們的行事高效和技術上的積累——距離 ChatGPT 推出還不到 3 個月,再算上聖誕假期季google就已經能拿出與之競爭的產品,而微軟也打算成為『第一個吃螃蟹』的企業。

《來源:Pixabay》

生成式人工智能的未來

2022 年,我們看到了許多生成式人工智能技術的爆火。未來,我們一定會見證更多技術的誕生。

OpenAI 的 DALL-E 2 模型在 2022 年 4 月發佈。5 月,google官宣了《但沒有發佈》它自己的兩種文本到圖像的模型,Imagen 和 Parti。然後是 Midjourney 公司,推出了一個為藝術家制作的文本到圖像模型。8 月,英國初創公司 Stability AI 向公眾免費發佈了開源模型 Stable Diffusion。11 月,我們看到了 ChatGPT。

嘗鮮的用戶蜂擁而至。OpenAI 在短短 2 個半月內就吸引了 100 萬用戶。超過 100 萬人開始通過付費服務 Dream Studio 使用 Stable Diffusion;更多的人通過第三方應用程序使用 Stable Diffusion,或在他們自己的電腦上安裝免費版本。Stability AI 的創始人易馬德·莫斯塔克《Emad Mostaque》表示,他的目標是擁有 10 億用戶。

在 2022 年 10 月,我們看到了第二輪熱潮:google、Meta 等公司發佈了文本到視頻模型,可以創建短視頻、動畫和 3D 圖像。

這種發展速度令人驚訝。在短短幾個月的時間裡,這項技術登上了媒體頭條和雜志封面,社交媒體上到處都是討論的人和有關的梗,話題的熱度高居不下,但同時也引發了強烈的反彈。

倫敦國王學院研究計算創造力的人工智能研究員邁克·庫克《Mike Cook》說:『這項技術令人驚嘆——它很有趣,這是新技術該有的樣子。但它發展得如此之快,以至於在你的理解根本趕不上它的更新速度。我認為,整個社會要花上一段時間來消化它。』

盡管一些人仍沉浸在震驚之中,但更多人正在尋找使用這些工具的方法,並預測接下來會發生什麼。

從文本到圖像的模型可能隻是一個開始。生成式人工智能最終可能被用於建築設計和開發之中,這又被稱為『文本到 X《圖片之外的某種事物》』。人們會意識到,技術或工藝不再是障礙,唯一的限制是他們的想象力。

令人興奮的事實是,我們不知道接下來會發生什麼。原因是,雖然創意產業——從娛樂媒體到時尚、建築、市場營銷等等——將首先感受到影響,但這項技術將把創造力賦予每個人。從長遠來看,它可以用於產生幾乎任何東西的設計,從新型藥物到服裝和建築。

生成式人工智能的未來已經拉開帷幕,面對翻天覆地的變化,科技巨頭已經給我們展示了正確的對待方式:用一切可能的資源去擁抱它,而不是固步自封。