硬剛GPT-4,文心一言開口講四川話!做海報剪視頻,今日開測!。

硬剛GPT-4,文心一言開口講四川話!做海報剪視頻,今日開測!。

智東西

作者 | 智東西編輯部

智東西3月16日報道,剛剛,百度推出新一代大語言模型文心一言《ERNIE Bot》,即日起開啟測試,同時宣佈已有超650家夥伴加入文心一言生態,打響全球互聯網大廠應戰ChatGPT的第一槍。

文心一言能做什麼?百度創始人兼董事長李彥宏在現場進行的激情演示,圍繞文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五方面大秀『肌肉』:能幫劉慈欣續寫《三體》,會幫公司寫新聞,讀得懂『洛陽紙貴』的古文梗,解得了難倒ChatGPT的『雞兔同籠』問題,還能分分鐘幫智能交通峰會生成海報和宣傳視頻……

▲百度創始人兼董事長李彥宏在演示文心一言

李彥宏稱,文心一言對個人的改變也會是巨大的,有機構預測,到2030年,人工智能可以將每一個知識工作者的生產力提高4倍以上。

很多人的工作性質會發生不可逆轉的改變。

會上,百度CTO王海峰宣佈,3月16日起,首批用戶即可通過邀請測試碼在文心一言官網體驗產品;百度智能雲即將面向企業客戶開放文心一言API接口調用服務,3月16日起正式開放預約。

這意味了文心一言將立馬接受廣大受眾的真實測評。

▲百度CTO王海峰在講解文心一言相關技術

李彥宏說:『十月懷胎,一朝分娩』。

那麼文心一言究竟長什麼樣?能為各行各業帶來什麼樣的變化?背後又有什麼樣的技術邏輯和產業真相?智東西在文心一言發佈現場為大家帶來第一手消息。

一、文心一言初體驗:續寫《三體》、解『雞兔同籠』難題、需求秒變視頻

一開場,李彥宏就談道自己近期不斷被問,為什麼現在發佈文心一言,真的Ready了嗎?

他說,實際上百度過去十幾年一直堅持AI投入,2019年就推出了第一個版本文心大模型,此後每年更新一代。

文心一言是百度多年努力的自然延續。

在簡短介紹了文心一言的誕生背景後,李彥宏迅速進入正題,他從文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五大方面進行了演示。

1、文學創作:給《三體》寫總結,還能幫大劉寫一個續集

首先文心一言展示了文學創作能力,《三體》是非常知名的科幻小說,李彥宏與文心一言就以下五個問題進行了五輪對話《為了方便讀者朋友看清,我們對動圖做了降速處理,文心一言實際的碼字速度飛快~》:

《三體》的作者是哪裡人?可以總結一下《三體》的核心內容嗎?如果要續寫的話,可以從哪些角度出發?

如何從哲學的角度續寫?

電視劇《三體》演員都有誰?於和偉和張魯一有哪些共同點?於和偉和張魯一誰更高?

可以看到,這一演示體現了文心一言的總結、分析能力,以及內容創作生成能力。

大家知道,生成式AI在回答事實性問題時有時會出錯,我們看到文心一言在幾個實時信息問題的回答上是正確的。

李彥宏說,文心一言延續了百度知識增強的大模型理念,大幅度提升了事實性問題的準確率。

而『於和偉和張魯一有哪些共同點』等問題難度更高,體現的是文心一言的推理能力。

2、商業文案創作:給公司起名、腦暴Slogan、秒寫新聞稿

再來試試文心一言在商業文案創作方向的能力,以常見的公司起名字、寫slogan、寫新聞稿為例。

李彥宏向文心一言提了以下問題:

如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?

數智雲圖這個名稱不錯,給我起一個公司的服務Slogan,表達共贏的概念。

幫我生成一篇公司成立的新聞稿,數智雲圖以共贏的服務理念用大模型服務中小企業數字化升級。

字數600字。

剛才的演示,展現了文心一言連續三次內容創作生成。

AI要寫好一篇稿子,除了需要準確理解我們的意圖,還要有清晰的表達能力。

這背後有一個基礎,就是龐大的數據規模。

人類常說『讀萬卷書』,而AI可以說是 『讀書破千億卷』。

文心一言大模型的訓練數據就包括,萬億級網頁數據,數十億的搜索數據和圖片數據,百億級的語音日均調用數據,以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處於獨一無二的位置。

有研究表明,數據規模足夠大,參數達到千億級,大模型就可能發生『智能湧現』,即使在沒有專門訓練過的領域,也能湧現出知識理解和邏輯推理能力。

3、數理邏輯推算:搞定『雞兔同籠』,ChatGPT曾在此『翻車』

我們接下來看文心一言對數理邏輯推算任務做的怎麼樣。

雞兔同籠是鍛煉人類邏輯思維的經典題,這個對生成式AI同樣有挑戰。

李彥宏問了以下幾個問題:

下面我們來玩一個雞兔同籠的遊戲。

1隻雞有2隻腳1個頭,1隻兔子有4隻腳1個頭。

那麼,如果有一個籠子裡有9個頭,40隻腳,應該有多少隻雞,多少隻兔子?

對於第一道題,文心一言經過演算,認為可能是題出錯了。

於是李彥宏又重新問了一遍,文心一言不但給出了正確結果,還詳細給出解題步驟。

可以看出,文心一言能理解題意,並有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。

李彥宏說,文心一言已具備了一定的思維能力,能夠學會數學推演及邏輯推理這類相對復雜任務。

當然,現階段準確率還不是100%,我們還需要給它更多的時間來學習和成長。

4、中文理解:讀懂『洛陽紙貴』、解釋經濟理論、寫藏頭詩

前面三個例子,李彥宏演示了大語言模型比較常見的優勢和能力。

下面是關於文心一言的中文理解能力,主要問題如下:

『洛陽紙貴』是什麼意思?當時洛陽的紙到底有多貴?

這個成語在現在的經濟學原理裡,對應的理論是什麼?用洛陽紙貴四個字寫一首藏頭詩。

『洛陽紙貴』,『藏頭詩』,這很考驗AI對中文和中國文化的理解。

作為紮根於中國市場的大語言模型,文心一言盡力展示了在中文上的優勢。

同時李彥宏坦言,文心一言目前對英文語種、代碼場景的訓練還不夠多,表現還不夠好,接下來百度還要加緊訓練,不斷完善這些能力。

5、多模態生成:秒做海報和視頻,還能講四川話

下面是多模態生成方向的案例,要知道ChatGPT在升級GPT-4之後才具備多模態功能,文心一言本次也對次進行了演示。

李彥宏的主要要求如下:

請為2023世界智能交通大會創作一張海報。

你認為智能交通最適合哪個城市發展?請用四川話將以上內容講出來。

請將以上內容生成視頻。

於是文心一言生成了下視頻:

可以看到,在這一段演示中,文心一言生成了文本、圖片、音頻和視頻,展示了多模態生成能力。

李彥宏稱,目前的版本已經能夠生成文字、圖片和語音。

生成視頻因為成本比較高,還沒有對所有用戶開放,未來百度會逐步接入。

但是熟悉百家號創作的朋友,應該都體驗過這個功能了,每天有幾萬篇文章通過這個能力轉成視頻內容在百度分發。

多模態是生成式AI一個明確的發展趨勢,未來文心一言的多模態生成能力也會不斷提升。

二、650家夥伴加入文心一言生態,背後六大技術解讀

會上,百度CTO王海峰宣佈,3月16日起首批用戶即可通過邀請測試碼,在文心一言官網體驗產品。

百度智能雲即將面向企業客戶開放文心一言API接口調用服務,3月16日起正式開放預約。

同時,王海峰公佈了文心產業級知識增強大模型全景圖。

王海峰介紹了文心一言的六項核心技術,分別是有監督精調、人類反饋的強化學習《RLHF》、提示、知識增強、檢索增強、對話增強。

其中前三個都是大型語言模型普遍具備的能力,後面三個技術,則有助於解決AI『胡言亂語』的問題。

知識增強包括知識內化和知識外用,把5500億知識圖譜的事實疊加到生成式大模型,不僅將知識融入模型參數,而且模型可以用外部知識,能夠檢查生成內容與事實是否相符。

檢索增強將檢索系統與生成模型結合,先檢索內容,再用有用的部分進行生成。

對話增強涉及記憶機制、上下文理解、對話規劃等技術積累。

李彥宏說,剛才展示的這些例子,如果在其他模型上試,很容易出錯,但在文心一言上試都對了。

他昨天問文心一言『怎麼看GPT-4』,文心一言非常及時地總結出來相關信息和內容。

根據官方數據,自2月7日以來,已有650家夥伴宣佈加入文心一言生態,AI市場有望迎來迎來新一波爆發。

以文心一言為代表的大模型產品的誕生,也有望更深刻的改變IT領域的技術范式。

李彥宏談道,傳統IT是『芯片層-框架層-應用層』三層,進入AI時代,IT技術棧變為了芯片層-框架層-模型層-應用層四層,以後應用層的搜索、智能信控等各種應用將基於模型來進行開發。

生成式AI是非常耗費算力,四層架構之間相互協同,不斷優化將使得效率大大提升,降低成本。

尤其是框架層和模型層的協同,百度在過去幾個月體會到了其中收益。

三、生成式AI開啟新型雲計算,帶來三大產業機會

李彥宏認為,生成式AI將催生新產品、新業態,會有很多創業和投資機會。

具體來說,生成式大模型的問世會帶來新型雲計算、行業模型精調、應用開發三大方面機會。

第一類是新型雲計算公司,其主流商業模式從IaaS《基礎設施即服務》變為MaaS《模型即服務》。

文心一言,將根本性地改變雲計算行業的遊戲規則。

之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。

未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。

第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Know how,調用通用大模型能力,為行業客戶提供解決方案。

我們的文心大模型,已經在電力、金融、媒體等領域,發佈了10多個行業大模型。

在各行各業都有機會。

非常歡迎大家來跟我們合作。

第三類是基於大模型底座進行應用開發的公司,即應用服務提供商。

今天,基於文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景,已經湧現出很多創業明星公司,他們可能就是未來的新巨頭。

這裡面的機會非常多,可以說每家企業在現在這個階段都有機會。

李彥宏說,我們相信,人工智能會徹底改變我們今天的每一個行業。

AI的長期價值,對各行各業的顛覆性改變,才剛剛開始。

未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的裡程碑事件發生。

文心一言發佈之後,將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪,效果會迅速提升,給你『士別三日,當刮目相看』的驚喜。

李彥宏認為,文心一言對每一個企業和每一個人都可能產生巨大的影響,文心一言的定位是一個基礎大模型,在上面可以開發出適合千行百業的行業大模型。

它不僅僅會影響到搜索和互聯網公司,由於超強的自然語言理解、表達、推理能力,讓任何一家公司離自己的客戶更近,從而做出更好的客戶體驗,建立更強的競爭優勢。

結語:國產類ChatGPT密集開測,生成式AI熱潮爆發

隨著百度文心一言大模型正式發佈,其與此前清華技術成果轉化的公司智譜AI推出了基於千億基座模型的ChatGLM、復旦大學自然語言處理實驗室的對話式AI模型MOSS一起,推動國產類ChatGPT生成式AI熱潮爆發。

李彥宏坦言:『從文心一言的表現看,某種程度上它具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性,都逐漸接近人類水平。

但整體而言,這類大語言模型還遠未到發展完善的階段,它們有時候會有很驚艷的表現,但不少場景下,細究起來還有明顯的bug,進步空間很大。

未來這段時間文心一言有望飛速發展,通過定向微調,可以在百度內外部各類產品上逐步展示出驚人的親和力,讓每一個產品離自己的用戶和客戶更近』

生成式AI已成為當下AI領域的一個兵變必爭之地,技術的產業化落地和商業應用將成為決勝關鍵。

在國外,微軟旗下OpenAI的ChatGPT、google旗下的PaLM都已開放API,面向辦公協同工具、社交文娛、智能終端等行業推動落地集成,這在國內也有望掀起一陣趨勢,從而帶來算法、算力及數據等多個產業鏈環節的爆發。