文 | Blink162、Congerry
頂著昨日艷驚四座的GPT-4的壓力,百度今日正式發佈了文心一言。
『沒那麼完美』是李彥宏(Robin)和王海峰《百度CTO》在本場發佈會中頻繁提到的一句話。
一個月前,『ChatGPT+ 一切』成為李彥宏給文心一言劃下的應用路徑。
一個月後,今天發佈會上,李彥宏展示著文心一言的五大能力,但彈幕裡討論的卻是趁現在抄底百度股票。
是的,在發佈會開始不到20分鐘,百度港股股價就暴跌超9.8%,後來股價略有上升,但跌幅仍超5%。
『沒那麼完美』這五個字的出現多少有些『硬著頭皮』的意味,但為何還要發出來,按Robin原話:
『因為有市場需求,百度各個產品線嗷嗷待哺,客戶合作夥伴也都等著用這樣的技術』
發佈會上,文心一言展示了什麼能力,導致了此次股票的大跳水?
P.S. 李彥宏表示為了節省大家時間,對文心一言的提問都是提前錄屏好的,並非現場提問。
5組對話,五個能力,更多的呢?回頭再說
在展示文心一言能力前,Robin就表示:『大家對它《文心一言》的期待是對標ChatGPT甚至是昨日發佈的GPT-4,這要求確實很高,但百度是世界上第一個發佈對標產品的,壓力很大』
能力還未展示,就有些為觀眾降低預期的意味。
李彥宏也提到為何不完美但依然要發出來的原因,除了合作夥伴的應用需求,還有『有了用戶的反饋,迭代就會更快』。
換句話說:我們不完美,但發展空間很大。
好了,預防針打了,下面上五大能力展示:
第一大能力:文學創作
這一輪對話主題是圍繞著科幻作品《三體》,一共進行了6輪對話。
問題中有事實提問,例如詢問《三體》作者是哪裡人,於和偉和張魯一誰更高等等。
可以看出百度設計這些問題的背後邏輯是考驗模型的知識積累,比如問作者哪裡人,首先需要誰是作者。
而真正體現『文學創作』的問題,『如果要續寫的話,可以從哪些角度出發?』,文心一言又是如何回答的:
它給了四個角度:角色塑造、情節設計、文化背景和哲學思考,給了一些操作上方法論,但未展開。
對於其中哲學思考進行了更深的追問,它又細化了一下答案,以下是答案:
第二大能力:商業文案創作。
一共有三個問題。
如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?
數智雲圖這個名稱不錯,給我起一個公司的服務Slogan,表達共贏的概念。
以下是一個可能的Slogan:『數智共贏,智繪未來』
這個名稱突出了公司的目標和使命,即通過大模型技術和機器學習算法,為企業提供數據分析和可視化服務,幫助企業更好地了解自身的業務和市場,實現共贏。
同時,『數智共贏』這個詞語也強調了公司與客戶、合作夥伴和社會的共贏關系,表達了公司的社會責任和價值觀。
最後李彥宏還讓文心一言『生成一篇公司成立的新聞稿,數智雲圖以共贏的服務理念用大模型服務中小企業數字化升級,600字』
第三大能力:數理邏輯推算
文心一言確實很本土化,被問的數理問題都是經典的『雞兔同籠』。
文心一言還可以識別問題中的bug,第一次問的是個無解題,它也指出來了,第二次在問題正確的前提下給出了答案和解析過程。
李彥宏原話:『很像小學生在解應用題』
emmm沒別的意思,但昨天GPT-4演示的是參加美國高考考進前10%耶
李彥宏在發佈會上表示,文心一言目前的中文能力明顯優於英文能力,特地展示了文心一言的第四大能力:中文理解。
李彥宏先是問了文心一言『洛陽紙貴是什麼意思?』
然後問了『當時洛陽的紙到底有多貴?』
接著問『這個成語在現在的經濟學原理裡,對應的理論是什麼?』
最後,李彥宏還展示了一下文心一言的創作能力,『用洛陽紙貴四個字寫一首藏頭詩』
第五大能力:多模態生成
這部分算是五大能力中相對精彩的部分。
展示過程就是:先讓文心一言設計一張智能交通大會的海報↓
然後問它智能交通最適合在哪個城市發展,給出一段文字回答後,李彥宏讓它用四川話讀出來,後來又讓它根據這些文字生成一段視頻。
也就是說目前的文心一言在多模態上,已經擁有文字轉圖像、文字轉語音、文字轉視頻的技能。
五大能力至此展現完畢。
接下來談到基於大模型的生成式AI對未來世界有何影響,李彥宏列了三點:
話都說到這裡了,按常理來說,應該有些具體案例展示吧。
但完全沒有。
總結一下Robin對這三點的介紹:
- 新型雲計算:百度智能雲過段時間會發佈相關新品,到時候大家再看,但並非重點;
- 行業模型精調:可以不斷精湛,但也並非重點;
- 應用開發:是重點!潛力無限,很看好,但沒舉例。
啊這…
李彥宏:論佈局,百度就是那個唯一
後來李彥宏還談到了現在AI的全棧佈局逐漸發展為四層:
應用層、模型層、框架層和芯片層。
他表示若做好人工智能,四層缺一不可,而在這四層中都有頂尖產品的公司,百度是世界上唯一一個。
因此,哪怕這次文心一言尚不完美,百度仍有信心。
話說回來,百度這次發佈會確實『沒那麼完美』,但李彥宏和百度對AI的佈局確實已有一定積累。
早在2010年,百度就創立了自然語言處理部,在語音、圖片等技術上佈局。
在研發投入上,以剛剛過去的2022年為例,百度研發投入約214億元,占百度核心收入22.4%,並且百度研發投入近年來總體上都在增長。
在百度官宣文心一言時曾提到,百度在人工智能四層架構中,有全棧佈局,包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。
文心一言,正處於於模型層。
ChatGPT背後的大模型是GPT3.5,文心一言背後的大模型是文心大模型ERNIE,擁有『產業級』、『知識增強』兩大特性。
2019年3月,百度提出知識增強的語義理解框架文心《ERNIE》。
文心ERNIE目前已迭代到3.0版本,具備跨模態、跨語言的深度語義理解與生成能力,參數規模達到2600億,是目前全球最大中文單體模型。
作為對比,GPT-3.5的參數規模為1750億,Google最近推出的PaLM模型參數規模為5400億。
當然,參數並不是類ChatGPT產品是否強大的唯一標準,還涉及清洗、標註、模型結構設計、訓練推理的技術積累等多個方面。
但不得不說是,ERNIE 3.0在中文NLP方面會比ChatGPT更具有天然的語言優勢。
當然,大模型的背後離不開龐大的算力支持。
文心一言背後的算力基礎設施是由百度陽泉智算中心,於2021年4月正式投入使用,並於2022年12月對外開放服務。
陽泉智算中心目前是亞洲最大單體智算中心,算力規模達4EFLOPS《每秒400億億次浮點運算》,可以支持各種AI應用場景,如語音識別、圖像識別、自然語言處理、機器學習等。
百度自研的昆侖芯2代也在百度文心大模型中應用,百度搜索和AIGC產品也是基於昆侖芯,國內部署規模已達到兩萬片以上。
從十年前的技術積累和長遠佈局,百度還是有希望在人工智能的浪潮中兌現自己的優勢。
關於ChatGPT,百度不得不戰,且不能輸
2021年3月23日,百度港股敲鐘。
李彥宏發表致辭時稱,回港上市是百度的『二次出發,二次創業』,2005年在美國上市的是搜索引擎公司百度,16年後,歸國赴港上市的是AI公司百度。
百度找到了新的故事著力點——AI,用AI講述新故事也意味著:
在人工智能這個本就前沿的科技領域,一定要做到頭部。
2023年2月22日,百度發佈了截至2022年12月31日四季度及全年未經審計財報。
其中創新業務《百度智能雲、自動駕駛、小度等》收入為259億元,同比增長22%。
圖片來源:虎嗅
而在百度2022年Q4及全年財報中,文心一言是絕對的主角。
『百度即將在3月份推出新一代的大語言模型‘文心一言’,它也是繼文心一格之後百度的又一個生成式AI產品』
從財報,到李彥宏發給全員的財報信,再到財報電話會,『文心一言』、『 ChatGPT』的含量極高。
但資本市場的表現並不算那麼樂觀:當天百度股價美股盤前一度大漲 7.6%,開盤後卻由漲轉跌,最終當天收盤後百度股價下跌 2.6%。
據36氪報道,2月7日百度官宣文心一言項目時,高層下了死命令,要在一個月時間內看到產品。
負責文心一言的團隊,主要由TPG《技術中臺事業群》、MEG《移動生態事業群》兩大部門協同。
前者負責技術攻堅,後者進行搜索、內容產品承接。
百度CTO王海峰任項目總指揮。
今天文心一言誕生了,其相關生態圈也早已佈局好,但依然是萬裡長征的第一步。
例如,如何平衡短期內文心一言的投入與產出比,就是李彥宏需要解決的問號之一。
微軟 CEO 納德拉在 ChatGPT 應用到必應中後曾提到,這一技術會『降低搜索的利潤率』。
誕生 8 年的 Open AI,至今已投入十多億美元的訓練成本,且仍處在需要巨頭微軟輸血的高昂虧損狀態。
以百度 6.5 億的月活用戶量測算,一旦文心一言正式向用戶開放,其日需求量走向億級隻是時間早晚問題,滿足這些訪問需求背後的運營成本,將是一項更大的挑戰。
搜索一直是百度的盈利支柱,一旦短期利潤折損,該怎麼平衡、該怎麼找到下一個增長點,問題還太多,再多給點時間吧,無論是我們對百度,還是百度內部對文心一言。
誒,這個問題也有網友問了ChatGPT,看看它是如何看待自己『競品』的吧。
隻能說:
你對本次發佈會有什麼看法?歡迎屏幕前你們在評論區留言討論!我們將為點贊、評論、關注的靚女、靚仔們送上紅包🧧不限量喲~
參考文章:
1、雷鋒網-《文心一言發佈前夜:GPT-4的「搶跑」與中國版ChatGPT的「長跑」》
2、品玩-《『文心一言』上線前,我們去看了看它的心臟》
3、智東西-《文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜》
4、虎嗅-《文心一言能帶百度起飛嗎?》
5、華爾街見聞-《文心一言:李彥宏不能輸的關鍵一戰》