張一鳴:今日頭條將把人工智能在信息領域的應用,推向世界。

張一鳴:今日頭條將把人工智能在信息領域的應用,推向世界。

11月17日,今日頭條創始人、首席執行官張一鳴在2016年世界互聯網大會表示,今日頭條是人工智能的先行者,能在4年內成長為一款全民資訊閱讀平臺的秘密,就是讓每一個用戶時刻都能看到屬於他們自己的資訊頭版。

並在演講中透露,目前,今日頭條正在推動一個新項目『頭條問答』,『傳統意義上的問答,基本都是社交模式,存在很多的問題,在我看來這恰恰是人工智能和算法可以解決的』。

下為張一鳴演講全文:

一、最早的人工智能+信息平臺

大家好,剛剛放的片子是我們今日頭條一個公益項目『頭條尋人』的介紹。

給大家看這個片子,是因為頭條尋人項目,是我們做精準信息分發的一個特別典型的例子。

大家知道,今日頭條是一個信息分發平臺,我們用個性化推薦引擎,把人和信息更高效的連接起來。

具體到尋人,把走失者、尋找者和知情者,這些原本孤立的點都被今日頭條連接起來,這是一個典型的連接信息的應用場景。

今天在場的各位朋友,肯定對十幾年前報紙上的豆腐塊《尋人啟事》有記憶。

那時候,《尋人啟事》隻能刊登在報紙的夾縫或者不起眼的角落裡。

為什麼呢?因為頭版是非常稀缺、非常昂貴的,要留給重大的社會議題。

所以,要讓尋人啟事上頭條的辦法隻有一個,就是把頭版的成本降下來。

把頭版的成本降下來,讓每個用戶擁有屬於他們自己的頭版,在傳統媒體的時代,是無法實現的,拋開昂貴和稀缺的渠道不說,也沒有那麼多有經驗的媒體編輯。

今日頭條最終借助於人工智能技術,真正實現了資訊分發的千人千面。

讓每一個用戶,每時每刻,都能看到屬於他們自己的資訊頭版。

這是今日頭條能把《尋人啟事》從報紙的夾縫裡送上頭條的秘密所在;也是今日頭條在4年內成長為一款全民資訊閱讀平臺的秘密所在。

不謙虛的說,今日頭條是人工智能的先行者:作為一款個性化信息推薦引擎產品,我們當然離不開數據挖掘、神經網路、自然語言理解、機器學習這些人工智能技術。

可以說,我們是國內最早一批把人工智能結合到移動應用場景上的產品。

鑒於頭條的累積激活用戶,已經達到6億,今日頭條可以說是目前人工智能在實際應用層面,應用最廣泛的一款科技產品。

總有人跟我說,一鳴,頭條這個媒體不錯,很懂我。

我都很無奈。

我覺得,說頭條是一家媒體,跟說AlphaGo是一款『圍棋教學軟件』一樣。

AlphaGo,是人工智能技術在圍棋領域的應用;同樣,今日頭條,是人工智能在信息分發領域的應用。

四年過去了,頭條上的內容越來越豐富,圖片、視頻、直播甚至問答,包括尋人。

在今年,我們還成立了專註於人工智能的頭條實驗室,很多人也開始慢慢理解頭條是一家技術公司。

從數據上來看,截至2016年10月底,除去累計6億的激活用戶,我們的日活已經超過6600萬,月活1.4億,單用戶日均使用時長則超過76分鐘,按照第三方數據公司QuestMobile的統計,我們在人均時長上僅次於微信。

在今天這個人工智能的時代,我覺得自己還是可以很自信地說一句,我們是把算法、工程、產品、運營這幾個方面在應用層面結合得最好的一家公司。

我們理解用戶需求,懂算法、工程,理解產品並且還能做細致的運營。

二、人工智能不止個性化推薦

一提到今日頭條的人工智能,大家就會想到個性化推薦,但實際上人工智能在頭條的應用遠不止這些。

今日頭條是內容的創作以及分發平臺,至少有4個環節是跟人工智能的算法非常非常相關。

就是創作、分發、討論,還有一部分可能讀者不太會直接看到,就是低劣內容的篩選過濾。

1、創作:人工智能直接介入創作

可能很多今日頭條的用戶不知道,今年奧運會的時候他們看到的新聞,或許是一個名叫Xiaomingbot的AI機器人來完成的。

在整個奧運會期間,Xiaomingbot寫了四百多篇新聞稿,一條稿件的寫作時間平均下來大概不到兩秒鐘。

最後AI寫的稿子大概有一百多萬的閱讀,有的閱讀率甚至略高於記者的稿件。

有媒體對比了今日頭條和華盛頓郵報的寫稿機器人,發現頭條的機器人不但信息量更豐富,能寫配圖長文,而且文字也更生動有趣。

這個AI機器人是我們頭條實驗室和北大計算機所合作完成的項目,也是國內第一個綜合運用了自然語言處理、視覺圖形處理和機器學習技術的寫稿機器人。

此前國外開發的寫稿機器人,基本都是寫一些簡單的資訊,做一個模板,填上數據結果,Xiaomingbot則可以通過獲取網上對相關賽事的文字和討論,總結歸納生成出一篇較長的賽事資訊,並且還能自己選圖。

其實頭條一直在嘗試類似寫稿機器人這樣的項目,我們希望用人工智能來幫助創作者創作更優質的內容。

比如,頭條號作者寫文章的時候,選擇一個合適的封面圖常常是個難題,我們頭條實驗室現在做的工作之一就是用人工智能的算法去幫助頭條號作者選出更好的圖,或者取一個合適的標題。

2、分發:人工智能的數據進化

去年我去波士頓的時候見到一個哈佛的學生,他問我,為什麼自己在哈佛會收到長沙老家的新聞推送?我說你是不是在過去兩年春節回家了?他說,是。

我告訴他,我們是用了過去兩年的日志。

機器識別出你在波士頓,但是春節回過長沙,所以會給你推薦長沙的新聞,但不是長沙所有的新聞給他,而是離開長沙的人通常會感興趣的新聞才會推給他。

這個例子其實包含了人工智能在今日頭條個性化推薦裡的三個關鍵之處:個性化、泛化和數據積累。

首先是個性化,隻有用的越久才越好用。

這個哈佛學生用了兩年,機器對他的了解才更深入,才能知道他是春節回的長沙。

其次是泛化,用的人越多效果越好,把一個人的推薦泛化到其他有共同特質的人身上。

假如都是長沙本地人用今日頭條,那機器不可能知道一個離開長沙的人會喜好什麼樣的信息,隻有用戶量達到一定程度,才可能實現個性化推薦。

到最後一步,就是越多的人用越長的時間,人工智能的訓練樣本就會越大,通過數據積累最終實現數據進化,完成精準推送,告訴在哈佛讀書的長沙人,這條關於人才的信息你不該錯過。

現在今日頭條可以說正在數據進化的路上,我們擁有800名工程師, 每天150億條訓練樣本量,20000臺服務器,每日處理數據6.3PB,用戶請求60億次。

這是我們實現精準推送的基礎。

3、討論:人工智能提升互動

說到人工智能在互動中的應用,我可以給大家介紹一個頭條的新項目,叫頭條問答。

傳統意義上的問答,基本都是社交模式,存在很多的問題,在我看來這恰恰是人工智能和算法可以解決的。

比如,頭條上是算法來幫用戶找到適合回答問題的人,在同一個問題下,機器會知道怎麼樣排序能夠對不同的用戶更友好更合適。

算法就可以把類似『長沙人在哈佛讀書會不會吃不慣』這樣的問題推送到剛剛提到的那位學生的手機上。

另外,算法現在還在嘗試,在熱門事件裡自動生成問題,並且插圖,對相似問題去重。

我們頭條實驗室負責人李磊博士對這方面頗有研究,今年召開的ACL 2016就收錄了他關於問答的一篇論文,主要研究的問題是要解決知識類問答。

知識表示和推理是人工智能領域的研究難題,也是最核心的問題,它的研究一般會涉及到深度學習、概率圖模型、矩陣分解和稀疏方法、核方法、決策樹等。

這項研究成果也正在頭條問答項目中應用,我們希望對於一些簡單的問題和事實類的問題可以通過自動回答的方式去解決,這樣就可以節省專家人力。

4、低劣內容的智能過濾

最後一個,低劣內容的過濾。

剛剛說了,我們做的事情是希望增加信息的吞吐量和分發效率,其實增大信息吞吐量最大的瓶頸就是怎麼能更快的過濾篩出低劣內容。

在此前算法不成熟的情況下,我們有一個小組會和機器一起來進行低質文章的初篩,也就是機器先圈出一個范圍,再由人工來完成細致的篩選,今日頭條每天能通過篩選呈現的文章超過15萬篇。

一般來說,一個人一天能夠處理的文章數量大概是1000篇,相比之下,機器一秒鐘就能處理100篇文章。

也就是說,即使隻是這十五萬篇呈現出來的文章,全部交由人工來篩的話,一個人需要工作一百五十天才能看完,機器則隻需要25分鐘。

可能很多人會覺得,人工審核會比較準,但其實我們內部做過測試,把文章打上不同的標簽,讓不同的人來判斷,這時候就發現,人和人之間的判斷差別是很大的,準確率大概是75%,算法的準確率則有87%。

更重要的是,相比人工,算法的邊際成本可以低到忽略不計,並且算法還能不斷學習。

我們後來就更新了初篩的算法,現在今日頭條上低質文章的初篩已經不再依賴人工,全部由機器完成,當然,初篩之後,我們還有人工抽檢等手段去配合機器,讓他們變得更聰明。

經常看到有人擔心機器人會搶走人類的飯碗,我並不這樣覺得。

機器解放了我們的生產力,從汽車的發明到電腦的出現,是機器讓人們從低質、重復的工作中解脫出來,這樣人們有機會去做創造性的工作。

信息行業也是如此,在人工智能的浪潮下,我們解放了網路編輯,讓創作者集中精力更好的創作,這才帶來了真正的內容創業的繁榮。

三、今日頭條希望成為信息分發的基礎設施

上面講了很多頭條關於人工智能的探索和嘗試,大家不難發現,人工智能實際上早已經嵌入了頭條的產品基因。

對於今日頭條來說,人工智能的意義最終是要落到應用層面的,是為了讓信息在碎片化的場景中實現最高效的流動。

我相信技術沒有邊界,最近可能有人關注到,我們投資了印度的一家和我們類似的公司,Dailyhunt,是當地最大的信息分發平臺。

其實,2015年6月今日頭條就已經啟動國際化,通過Build&Buy的方式在海外擴張,現在在日本、印度、東南亞、北美、巴西,頭條都有一些佈局。

在未來,在人工智能浪潮的推動下,我們希望今日頭條能成為全球信息分發的基礎設施。

謝謝大家。

-END –

邦哥的好朋友毒舌科技l ID:dushekeji

長 按 二 維 碼 , 一 鍵 關 註

更多精彩文章: