硬剛GPT-4，文心一言開口講四川話！做海報剪視頻，今日開測！。

智東西

作者 | 智東西編輯部

智東西3月16日報道，剛剛，百度推出新一代大語言模型文心一言《ERNIE Bot》，即日起開啟測試，同時宣佈已有超650家夥伴加入文心一言生態，打響全球互聯網大廠應戰ChatGPT的第一槍。

文心一言能做什麼？百度創始人兼董事長李彥宏在現場進行的激情演示，圍繞文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五方面大秀『肌肉』：能幫劉慈欣續寫《三體》，會幫公司寫新聞，讀得懂『洛陽紙貴』的古文梗，解得了難倒ChatGPT的『雞兔同籠』問題，還能分分鐘幫智能交通峰會生成海報和宣傳視頻……

▲百度創始人兼董事長李彥宏在演示文心一言

李彥宏稱，文心一言對個人的改變也會是巨大的，有機構預測，到2030年，人工智能可以將每一個知識工作者的生產力提高4倍以上。

很多人的工作性質會發生不可逆轉的改變。

會上，百度CTO王海峰宣佈，3月16日起，首批用戶即可通過邀請測試碼在文心一言官網體驗產品；百度智能雲即將面向企業客戶開放文心一言API接口調用服務，3月16日起正式開放預約。

這意味了文心一言將立馬接受廣大受眾的真實測評。

▲百度CTO王海峰在講解文心一言相關技術

李彥宏說：『十月懷胎，一朝分娩』。

那麼文心一言究竟長什麼樣？能為各行各業帶來什麼樣的變化？背後又有什麼樣的技術邏輯和產業真相？智東西在文心一言發佈現場為大家帶來第一手消息。

一、文心一言初體驗：續寫《三體》、解『雞兔同籠』難題、需求秒變視頻

一開場，李彥宏就談道自己近期不斷被問，為什麼現在發佈文心一言，真的Ready了嗎？

他說，實際上百度過去十幾年一直堅持AI投入，2019年就推出了第一個版本文心大模型，此後每年更新一代。

文心一言是百度多年努力的自然延續。

在簡短介紹了文心一言的誕生背景後，李彥宏迅速進入正題，他從文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五大方面進行了演示。

1、文學創作：給《三體》寫總結，還能幫大劉寫一個續集

首先文心一言展示了文學創作能力，《三體》是非常知名的科幻小說，李彥宏與文心一言就以下五個問題進行了五輪對話《為了方便讀者朋友看清，我們對動圖做了降速處理，文心一言實際的碼字速度飛快~》：

《三體》的作者是哪裡人？可以總結一下《三體》的核心內容嗎？如果要續寫的話，可以從哪些角度出發？

如何從哲學的角度續寫？

電視劇《三體》演員都有誰？於和偉和張魯一有哪些共同點？於和偉和張魯一誰更高？

可以看到，這一演示體現了文心一言的總結、分析能力，以及內容創作生成能力。

大家知道，生成式AI在回答事實性問題時有時會出錯，我們看到文心一言在幾個實時信息問題的回答上是正確的。

李彥宏說，文心一言延續了百度知識增強的大模型理念，大幅度提升了事實性問題的準確率。

而『於和偉和張魯一有哪些共同點』等問題難度更高，體現的是文心一言的推理能力。

2、商業文案創作：給公司起名、腦暴Slogan、秒寫新聞稿

再來試試文心一言在商業文案創作方向的能力，以常見的公司起名字、寫slogan、寫新聞稿為例。

李彥宏向文心一言提了以下問題：

如果要成立一個用大模型服務中小企業數字化升級的科技服務公司，可以起個什麼公司名？

數智雲圖這個名稱不錯，給我起一個公司的服務Slogan，表達共贏的概念。

幫我生成一篇公司成立的新聞稿，數智雲圖以共贏的服務理念用大模型服務中小企業數字化升級。

字數600字。

剛才的演示，展現了文心一言連續三次內容創作生成。

AI要寫好一篇稿子，除了需要準確理解我們的意圖，還要有清晰的表達能力。

這背後有一個基礎，就是龐大的數據規模。

人類常說『讀萬卷書』，而AI可以說是『讀書破千億卷』。

文心一言大模型的訓練數據就包括，萬億級網頁數據，數十億的搜索數據和圖片數據，百億級的語音日均調用數據，以及5500億事實的知識圖譜等，這讓百度在中文語言的處理上，能夠處於獨一無二的位置。

有研究表明，數據規模足夠大，參數達到千億級，大模型就可能發生『智能湧現』，即使在沒有專門訓練過的領域，也能湧現出知識理解和邏輯推理能力。

3、數理邏輯推算：搞定『雞兔同籠』，ChatGPT曾在此『翻車』

我們接下來看文心一言對數理邏輯推算任務做的怎麼樣。

雞兔同籠是鍛煉人類邏輯思維的經典題，這個對生成式AI同樣有挑戰。

李彥宏問了以下幾個問題：

下面我們來玩一個雞兔同籠的遊戲。

1隻雞有2隻腳1個頭，1隻兔子有4隻腳1個頭。

那麼，如果有一個籠子裡有9個頭，40隻腳，應該有多少隻雞，多少隻兔子？

對於第一道題，文心一言經過演算，認為可能是題出錯了。

於是李彥宏又重新問了一遍，文心一言不但給出了正確結果，還詳細給出解題步驟。

可以看出，文心一言能理解題意，並有正確的解題思路，進而像學生做題一樣，按正確的步驟，一步步算出正確答案。

李彥宏說，文心一言已具備了一定的思維能力，能夠學會數學推演及邏輯推理這類相對復雜任務。

當然，現階段準確率還不是100%，我們還需要給它更多的時間來學習和成長。

4、中文理解：讀懂『洛陽紙貴』、解釋經濟理論、寫藏頭詩

前面三個例子，李彥宏演示了大語言模型比較常見的優勢和能力。

下面是關於文心一言的中文理解能力，主要問題如下：

『洛陽紙貴』是什麼意思？當時洛陽的紙到底有多貴？

這個成語在現在的經濟學原理裡，對應的理論是什麼？用洛陽紙貴四個字寫一首藏頭詩。

『洛陽紙貴』，『藏頭詩』，這很考驗AI對中文和中國文化的理解。

作為紮根於中國市場的大語言模型，文心一言盡力展示了在中文上的優勢。

同時李彥宏坦言，文心一言目前對英文語種、代碼場景的訓練還不夠多，表現還不夠好，接下來百度還要加緊訓練，不斷完善這些能力。

5、多模態生成：秒做海報和視頻，還能講四川話

下面是多模態生成方向的案例，要知道ChatGPT在升級GPT-4之後才具備多模態功能，文心一言本次也對次進行了演示。

李彥宏的主要要求如下：

請為2023世界智能交通大會創作一張海報。

你認為智能交通最適合哪個城市發展？請用四川話將以上內容講出來。

請將以上內容生成視頻。

於是文心一言生成了下視頻：

可以看到，在這一段演示中，文心一言生成了文本、圖片、音頻和視頻，展示了多模態生成能力。

李彥宏稱，目前的版本已經能夠生成文字、圖片和語音。

生成視頻因為成本比較高，還沒有對所有用戶開放，未來百度會逐步接入。

但是熟悉百家號創作的朋友，應該都體驗過這個功能了，每天有幾萬篇文章通過這個能力轉成視頻內容在百度分發。

多模態是生成式AI一個明確的發展趨勢，未來文心一言的多模態生成能力也會不斷提升。

二、650家夥伴加入文心一言生態，背後六大技術解讀

會上，百度CTO王海峰宣佈，3月16日起首批用戶即可通過邀請測試碼，在文心一言官網體驗產品。

百度智能雲即將面向企業客戶開放文心一言API接口調用服務，3月16日起正式開放預約。

同時，王海峰公佈了文心產業級知識增強大模型全景圖。

王海峰介紹了文心一言的六項核心技術，分別是有監督精調、人類反饋的強化學習《RLHF》、提示、知識增強、檢索增強、對話增強。

其中前三個都是大型語言模型普遍具備的能力，後面三個技術，則有助於解決AI『胡言亂語』的問題。

知識增強包括知識內化和知識外用，把5500億知識圖譜的事實疊加到生成式大模型，不僅將知識融入模型參數，而且模型可以用外部知識，能夠檢查生成內容與事實是否相符。

檢索增強將檢索系統與生成模型結合，先檢索內容，再用有用的部分進行生成。

對話增強涉及記憶機制、上下文理解、對話規劃等技術積累。

李彥宏說，剛才展示的這些例子，如果在其他模型上試，很容易出錯，但在文心一言上試都對了。

他昨天問文心一言『怎麼看GPT-4』，文心一言非常及時地總結出來相關信息和內容。

根據官方數據，自2月7日以來，已有650家夥伴宣佈加入文心一言生態，AI市場有望迎來迎來新一波爆發。

以文心一言為代表的大模型產品的誕生，也有望更深刻的改變IT領域的技術范式。

李彥宏談道，傳統IT是『芯片層-框架層-應用層』三層，進入AI時代，IT技術棧變為了芯片層-框架層-模型層-應用層四層，以後應用層的搜索、智能信控等各種應用將基於模型來進行開發。

生成式AI是非常耗費算力，四層架構之間相互協同，不斷優化將使得效率大大提升，降低成本。

尤其是框架層和模型層的協同，百度在過去幾個月體會到了其中收益。

三、生成式AI開啟新型雲計算，帶來三大產業機會

李彥宏認為，生成式AI將催生新產品、新業態，會有很多創業和投資機會。

具體來說，生成式大模型的問世會帶來新型雲計算、行業模型精調、應用開發三大方面機會。

第一類是新型雲計算公司，其主流商業模式從IaaS《基礎設施即服務》變為MaaS《模型即服務》。

文心一言，將根本性地改變雲計算行業的遊戲規則。

之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。

未來，更多會看框架好不好、模型好不好，以及模型、框架、芯片、應用這四層之間的協同。

第二類是進行行業模型精調的公司，這是通用大模型和企業之間的中間層，他們具有行業Know how，調用通用大模型能力，為行業客戶提供解決方案。

我們的文心大模型，已經在電力、金融、媒體等領域，發佈了10多個行業大模型。

在各行各業都有機會。

非常歡迎大家來跟我們合作。

第三類是基於大模型底座進行應用開發的公司，即應用服務提供商。

今天，基於文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景，已經湧現出很多創業明星公司，他們可能就是未來的新巨頭。

這裡面的機會非常多，可以說每家企業在現在這個階段都有機會。

李彥宏說，我們相信，人工智能會徹底改變我們今天的每一個行業。

AI的長期價值，對各行各業的顛覆性改變，才剛剛開始。

未來，將會有更多的殺手級應用、現象級產品出現，將會有更多的裡程碑事件發生。

文心一言發佈之後，將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪，效果會迅速提升，給你『士別三日，當刮目相看』的驚喜。

李彥宏認為，文心一言對每一個企業和每一個人都可能產生巨大的影響，文心一言的定位是一個基礎大模型，在上面可以開發出適合千行百業的行業大模型。

它不僅僅會影響到搜索和互聯網公司，由於超強的自然語言理解、表達、推理能力，讓任何一家公司離自己的客戶更近，從而做出更好的客戶體驗，建立更強的競爭優勢。

結語：國產類ChatGPT密集開測，生成式AI熱潮爆發

隨著百度文心一言大模型正式發佈，其與此前清華技術成果轉化的公司智譜AI推出了基於千億基座模型的ChatGLM、復旦大學自然語言處理實驗室的對話式AI模型MOSS一起，推動國產類ChatGPT生成式AI熱潮爆發。

李彥宏坦言：『從文心一言的表現看，某種程度上它具有了對人類意圖的理解能力，回答的準確性、邏輯性、流暢性，都逐漸接近人類水平。

但整體而言，這類大語言模型還遠未到發展完善的階段，它們有時候會有很驚艷的表現，但不少場景下，細究起來還有明顯的bug，進步空間很大。

未來這段時間文心一言有望飛速發展，通過定向微調，可以在百度內外部各類產品上逐步展示出驚人的親和力，讓每一個產品離自己的用戶和客戶更近』

生成式AI已成為當下AI領域的一個兵變必爭之地，技術的產業化落地和商業應用將成為決勝關鍵。

在國外，微軟旗下OpenAI的ChatGPT、google旗下的PaLM都已開放API，面向辦公協同工具、社交文娛、智能終端等行業推動落地集成，這在國內也有望掀起一陣趨勢，從而帶來算法、算力及數據等多個產業鏈環節的爆發。

百度2022年營收1237億元多項業務將和文心一言整合。

在家靠海外抖音副業月入3w+：成年人的世界錢是底氣！。

硬剛GPT-4，文心一言開口講四川話！做海報剪視頻，今日開測！。

百度2022年營收1237億元 多項業務將和文心一言整合。

在家靠海外抖音副業月入3w+：成年人的世界錢是底氣！。

百度2022年營收1237億元多項業務將和文心一言整合。