出品 | 搜狐科技
作者 | 梁昌均
趕在『國產版ChatGPT』文心一言發佈前夕,OpenAI搶先發佈了功能更為強大的多模態大模型GPT-4,巨大的壓力給到了百度。
前後腳發佈,高調宣傳的百度難免會被拿來對比,或將面臨發佈即落後的尷尬。
毫不誇張地講,如果明日發佈的文心一言達不到市場預期,百度很可能再次會讓外界恨鐵不成鋼,甚至遭受新一輪輿論炮火。
在目前行業較為普遍的認知中,國內有實力能真正做出類似ChatGPT這樣的語言大模型僅有百度等少數有長期技術積累,更為關鍵的是有強大現金流支撐的科技巨頭。
百度則是國內打響這第一槍的大廠,在2月初率先宣佈將推出類似產品,並持續進行預熱宣傳,廣泛開展生態夥伴的合作,目前已有近500家企業宣佈將接入文心一言。
在國內大模型發展進度落後且無法廣泛體驗ChatGPT的情況下,外界對百度的文心一言有所期待,但同時對在如此匆忙的時間下推出的產品效果保留質疑,畢竟連google也在這個問題曾吃了大虧。
為了文心一言順利上線,百度CTO王海峰領導的數百人團隊加班加點工作,同時對智算中心也進行了升級。
百度相關團隊也在為明天的發佈工作進行準備,今日已正式向參加發佈會的投資人、合作夥伴及媒體等發送了參會信息。
現在,距文心一言發佈已不到20小時。
百度在邁向人工智能的路上將迎來一個重大節點,是成是敗或在此一舉。
發佈即落後,未來或將多模態融合
隨著GPT-4的發佈,讓文心一言難逃被對比的命運。
此次GPT-4也實現了更為強大的性能和功能,在原來的文本生成基礎之上新增了圖像識別,根據OpenAI的演示,其『看圖說話』的能力毫不遜色。
在此前被詬病的真實性、準確性、不會做數學和物理題等方面,GPT-4也通過訓練和調校得到了一定程度的改善。
即將發佈的文心一言,基於百度擁有2600億參數的文心大模型打造,其參數規模超過GPT-3.5《1750億》。
OpenAI並未透露GPT-4的參數規模,而該公司CEO此前稱它不會比GPT-3大很多,市場分析稱其參數規模可能會在1750-2800億之間。
有科技博主提到,文心一言可能在推出之後,並不會是一個十全十美的產品,因為AI需要通過不斷使用才能變的更智能,而多模態的能力可能會在合適的時機和文心一言結合,未來的文心一言更值得期待。
根據百度文心一言的名稱和此前透露的情況來看,其大概率還處於文本處理階段,也就是和早前版本的Chat-GPT一樣僅能進行對話互動的任務,此次將不會是一個多模態大模型。
近些年,多模態已經成為人工智能發展的重要趨勢,它包含文本、圖像、音頻和視頻等多種形式,諸多應用場景往往都需要綜合能力的加持。
google在上周也推出了參數量高達5620億的具身多模態語言模型PaLM-E,是目前已知的最大的視覺-語言模型。
從這個角度來看,百度已經落後於OpenAI和google的進度。
同時,對於Chat-GPT此前暴露出的虛假、胡說八道等諸多問題,文心一言恐怕也難以避免。
關鍵在於有了前車之鑒後,百度是否在一定程度上解決,但如此倉促的時間,改善的效果如何存疑。
OpenAI在GPT-4的這些方面則花了6個月的時間,使用對抗性測試程序和從ChatGPT得到的經驗教訓,對GPT-4進行迭代調整,從而實現真實性、可控制性等取得了有史以來最好的結果,但仍遠非完美。
因此有互聯網行業分析師認為,如果單從功能、效果上來對比,文心一言和GPT-4可能根本不在一個量級,被按在地上摩擦是大概率事件,認為文心一言能達到此前版本的ChatGPT的水平就算是超出預期。
文心一言背後的文心大模型定位於產業級知識增強大模型,最早推出在2019推出,目前具備跨模態、跨語言的深度語義理解和生成能力,是全球最大中文單體模型。
其中的NLP大模型主要為ERNIE系列模型,其目前已迭代到3.0版本,是打造文心一言的關鍵。
此前,百度基於文心大模型已推出應用AI作畫的文心一格和端到端搜索引擎文心百中,文心一言則具備相似定位。
華泰證券認為,技術上來說,文心大模型已經具備了搜索、文圖生成等功能,並成功得到應用,這些能力或將集成於文心一言,並增加預置作文生成、文案創作、情感分析等任務處理能力。
中文語言能力受關注,將采取多種落地方式
百度CEO李彥宏此前表示,百度的文心大模型是中國市場非常本土化的大語言模型,基於此而研發的文心一言將比國外開發的模型更適合中文和中國市場,其先進性不僅體現為對中文語言的理解,還體現為對中國文化的理解。
因此相較在中文能力方面表現較差的ChatGPT,百度在中文語言文本上的表現值得期待。
公開信息顯示,ERNIE 3.0作為文心一言的核心模型引擎,在英文版的測試中本身已經取得了優秀結果。
華泰證券認為,在中文NLP方面,ERNIE 3.0會比ChatGPT更具有天然的語言優勢,或將更好的支持中文搜索問答、內容創作生成、虛擬人物、智能客服、智能寫作等應用。
不過,前述互聯網分析師認為,百度積累的整體數據規模和質量相對ChatGPT的訓練數據要弱一個量級,同時在數據的處理上也要與國內具體實情相結合,需要比ChatGPT考慮更多的維度,因此處理難度也會更大,中文表現能力如何還要看百度如何處理。
數字經濟專家高澤龍評論稱,雖然百度文心大模型參數量已達到2600億,但百度在這個領域處於第三梯隊,落後於OpenAI和google,技術能力相比ChatGPT約晚1-2年。
從數據、算力、模型維度來看,主要是差在模型環節,包括清洗、標註、模型結構設計、訓練推理的技術積累。
對於後續的落地情況,華泰證券認為,微軟證明了搜索引擎+類GPT產品是可行路線,文心一言+百度搜索在國內具有較大優勢,並或也將提供大模型API相關功能。
同時,文心一言可能打造與文心一格、文心百中類似的產品級應用,通過直接的方式提供服務,類似ChatGPT通過網頁即可實現訪問。
此外在生態融合上,結合百度自身的自動駕駛、視頻等已有生態,融合文心一言的新搜索形態,或可以接入Apollo自動駕駛平臺、愛奇藝、小度等平臺和終端,擴展使用場景。
此外,文心一言還將通過智能雲對外提供服務,目前已有近500家企業宣佈接入文心一言生態圈,涵蓋互聯網、媒體、金融、汽車、企業軟件等行業。
有觀點認為,百度本身就具備數億用戶,如果能借助AIGC創新的浪潮,提供更好的服務,未來就不會被淘汰,甚至完全可以在應用層面碾壓ChatGPT。
智算中心升級,加快推動文心一言應用
作為基於千億大模型打造的文心一言,其背後也需要龐大的算力支持。
為支持文心一言的超大規模計算需求,實現文心一言的產業化落地,百度智能雲近期動作頻頻,除了去年12月發佈AI大底座,今年2月又升級AI研發運營一體化能力,並在今年3月百度陽泉智算中心完成升級。
文心一言未來將依托AI大底座落地,其屬於百度AI大底座的芯片、框架、模型、應用四層架構中的模型層。
作為國內首個全棧自研的AI基礎設施,AI大底座可以提供端到端、全要素AI解決方案,由百舸異構計算平臺《整合百度自研的昆侖芯》、AI中臺《飛槳深度學習框架、文心大模型》兩大部分組成。
百度智能雲雲計算產品解決方案和運營部總經理宋飛表示, 大模型創造了一個AI開發的新范式,而百度AI大底座可基於實際業務數據進行不斷調優,使得資源利用率提升至70%,企業開發效率提升100%。
與此同時,算力已經成為類似ChatGPT等大模型背後的核心。
數據顯示,ChatGPT的總算力消耗約為3640PF-days《即假如每秒計算一千萬億次,需要計算3640天》。
微軟為此花費數億美元為 OpenAI 建造了一臺巨大的超級計算機,使用了上萬顆英偉達GPU計算芯片,並稱願意投入更多資金。
前述互聯網分析師也提到,對文心一言等類似大模型來說,最重要的還是算力。
『這次百度搶先在國內最早發佈類ChatGPT應用,可以說是調動了公司內的最大算力資源,但和ChatGPT調用的高端芯片相比,估計不足十分之一』
文心一言背後的算力基礎設施則是由百度陽泉智算中心支持,它於2021年4月正式投入使用,並於2022年12月對外開放服務,後續百度多個智算中心也將為文心一言面向產業的規模化落地提供底層支撐。
陽泉智算中心是亞洲最大單體智算中心,算力規模達4EFLOPS《每秒400億億次浮點運算》,可以支持各種AI應用場景,如語音識別、圖像識別、自然語言處理、機器學習等。
搜狐科技近日實地探訪時了解到,為保證文心一言順利上線,百度陽泉智算中心專門為其搭建了GPU集成的服務器中心,該地運維人員也在緊急進行壓力測試。
據了解,百度陽泉智算中心采用的也是英偉達芯片,而百度也在推動芯片研發,其量產的7納米昆侖芯2代在FP16精度下達128TFLOPS,鹽城智算中心即基於昆侖芯打造。
昆侖芯科技戰略負責人宋春曉透露,昆侖芯2代已在百度文心大模型的應用中廣泛落地,百度搜索和AIGC產品也是基於昆侖芯,國內部署規模已達到兩萬片以上,明年還將推出算力更高的三代產品。
此外,對文心一言等大模型後續落地來說,還離不開AI工程化水平,這需要基於具體業務場景進行二次適配開發,決定了AI能否突破產業落地的『最後一公裡』,這也對百度的研發運營一體化能力提出更高要求。
李彥宏此前表示,ChatGPT是AI技術發展到一定階段後的新機會,但怎麼把這麼酷的技術,變成人人需要的產品,才是最難的,也是最偉大、最能夠產生影響力的。
而對百度來說,推出文心一言僅僅是其加速人工智能大模型發展的第一步。