百度大腦是怎樣工作
人工智慧就是“百度大腦”。百度選擇了在9月1日開學季這一天,舉行了2016年百度世界大會,那麼的呢?小編整理了百度大腦的最新訊息,希望可以幫助大家!
:李彥巨集:人工智慧就是“百度大腦”
今日***2016年9月1日***上午百度世界大會在京召開。百度董事長兼執行長李彥巨集在開場時釋出了關於百度人工智慧的主題報告。
本屆百度世界大會的主題是“AI is the new Electricity”,亦即“人工智慧是新電能”。
今年6月份李彥巨集曾在百度峰會上表示,網際網路即將進入以“人工智慧”為平臺的下一幕場景中。隨著上網的人數越來越多,每一個上網者都用上了智慧手機,李彥巨集認為,網際網路的增長不能再用人口驅動,移動網際網路的快速發展正在逐漸遠離。
李彥巨集表示,過去五六年間,百度花了很大的精力投入到人工智慧的研發當中,人工智慧就是“百度大腦”。三四年前,百度大腦就相當於兩三歲孩子的智慧。但是人腦和電腦還是有很大區別的,而百度大腦主要有人工智慧的演算法、計算能力和資料這三大板塊。
其中人工智慧演算法由超大規模神經網路、萬億級引數、錢一樣本和遷移特徵訓練組成。計算能力由數十萬臺伺服器以及中國最大GPU叢集組成。資料包括全網數萬億網頁內容,每天數十億次搜尋資料,百億級別定位資料。
隨後,李彥巨集介紹了百度大腦的四大功能,分別是語音、影象,自然語言處理和使用者畫像這四大能力。
語音包括語音合成和語音識別兩大能力。今年MIT Technology Review把百度的DeepSpeech評為了2016改變世界的十大科技緊張。李彥巨集表示,我們更感興趣的是有了這些能力,應該在什麼領域進行應用。緊接著李彥巨集在現場演示了語音識別功能的實時話術推薦,可以實時在聊天中提醒說話者如何應對。
語音合成是李彥巨集的下一個演示。現場出現了張國榮的合成音,並按照正常人的語調播放了出來。
影象演示在現場出現了一個笑點。李彥巨集表示,現在人臉識別的準確率已經達到了99.7%,大螢幕上突然出現了現場視訊,並在一片笑意中由百度大腦順利識別出了百度副總裁朱光等人。
除了面部識別外,百度地圖識別等現在也取得了很大進展。李彥巨集說,計算機視覺,即影象識別也應該是百度無人車技術的最後一塊壁壘。百度無人車的車輛檢測能力,李彥巨集表示,現在已經在國際上排名第一,車輛跟蹤能力的6項指標中也有4項拿到了第一。
AR***增強現實能力***,李彥巨集認為,可以把現實世界中的物品和虛擬世界結合在一起,也需要影象識別技術的助力。而如何讓技術落地消費者生活,廣告主也需更好的創意。
自然語言處理的成熟程度尚不如上兩種技術。李彥巨集在演講中表示,現在百度也有了“度祕”和百度翻譯這樣的產品,除了識別語音和影象外,更重要的功能是用人類的語言進行互動,理解使用者的意圖。李彥巨集請了籃球評論員楊毅上臺,並現場點評了度祕的一場籃球比賽解說。使用者也可以在百度翻譯上進行實時語音翻譯。
使用者畫像的用處在哪兒呢?李彥巨集舉了百度本身的一個例子。手機百度搜索欄下的Feed流就是根據使用者畫像進行的個性化推薦。百度描繪了61.5萬個標籤,每個使用者都是標籤的組合,因此才能做到千人千面。今年《魔獸》在中國上映期間就是根據百度的工具和資料進行人群篩選,帶來了200%的票房提升。
百度錢包代言人胡歌的上臺引起了現場的轟動。胡歌在臺上與李彥巨集進行了互動,演示了百度大腦的語音合成、使用者畫像等諸多功能。李彥巨集開玩笑稱,百度大腦以後可以模擬人的動作,能把胡歌的戲給演了,嚇得胡歌連忙表示演戲還是自己來比較好。
李彥巨集拆解“百度大腦”,稱語音和影象正取代文字成為表達需求的主流方式
百度選擇了在9月1日開學季這一天,舉行了2016年百度世界大會。這個一般作為百度釋出戰略內容的大會,看做是它給自己的新學期也不為過。
作為百度的大家長,李彥巨集Robin在大會上不談金融、不談O2O,全部的內容就圍繞著一個關鍵詞“百度大腦”。“網際網路的下一幕,就是人工智慧”,李彥巨集在大會的主旨演講再次強調。
“人工智慧對百度意味著什麼?那就是“百度大腦”。三年前,百度就講過百度大腦這個概念,那個時候的百度大腦已經具備了大概兩三歲孩子的智力水平。”
在大會上,李彥巨集就百度大腦的語音識別與合成、影象識別、自然語言的處理和使用者畫像的處理四個方面,進行了講演。
李彥巨集稱,“百度語音識別的準確率能夠達到97%,已經超過了人對語音的識別能力。”而百度的新型情感語音合成系統能夠讓機器擺脫平鋪直敘的發聲,為使用者帶來更自然、更接近真人朗讀的聽覺體驗。
百度世界大會的現場播放了一段張國榮的合成聲音,是根據張國榮在影視、電臺等留存下來的原聲進行建模,最終實現智慧模擬。任何一個人只要用30分鐘按照要求錄製50句話,就可以用百度大腦的語音合成技術模擬出來這個人的聲音。
不出意外,週末剛在朋友圈刷屏、載狗狗參加駕校測試的百度無人車也別拿來當做例子來講解影象識別。
在現場播放的視訊中,兩個螢幕分別展示了汽車駕駛當中,人所獲取的資訊百度汽車獲取的資訊。除了路面上的車、路標以及各種各樣的障礙物等,百度無人汽車的探測範圍還包括了馬路周邊的各種建築物資訊,像是門牌號、停車場標識等等。
李彥巨集在現場演講中透露,百度地圖的全流程資料生產自動化程度已超過80%,全景影象的自動化識別提取準確率高達95%。百度地圖與影象智慧識別技術的結合,讓資料無限逼近現實世界。
今年加入籃球解說界的度祕,這次則被李彥巨集拿來講解”自然語言的理解能力”。他還透露,“現在人們與度祕的互動,有56%是通過語音或者影象來完成的,語音和影象的互動正逐步超越傳統文字的使用頻次,成為人們表達需求的主流方式。”
至於使用者畫像的能力,李彥巨集用《魔獸》利用它提升票房的方法來解釋在實際應用中可能存在的使用場景。
據《魔獸》製作公司傳奇影業首席分析師Matt介紹,傳奇影業把影片目標人群分了三類,一類是肯定會去看的,不需要做宣傳了,一類是肯定不去看的,他宣傳了也沒有用。主要著力點是怎樣把那些搖擺的、可被說服的人群轉化為真正去電影院看的人群。傳奇影業運用百度的工具和資料進行人群篩選。最終,百度使用者畫像能力為《魔獸》帶來了200%的票房提升。
“百度大腦”無疑是這一屆百度大會的核心,李彥巨集在回答百度大腦智力水平的時候,稱其很難與人腦相比較,因為百度大腦和人腦的正常發育過程很不一樣。百度大腦的構成,主要包括了三個部分:
第一部分,計算方法。包括超大規模的神經網路、萬億級的引數、千億樣本和千億特徵訓練;
第二部分,百度的計算能力。包括數十萬臺伺服器構成了“百度大腦”的實體,幾年前百度便開始自建中國最大的GPU叢集;
第三部分,資料。全網的網頁資料、十多年來累積的搜尋資料,以及百億級的影象、視訊、定位資料。
作為BAT中以技術見長的百度,不管是在大會前做的“載狗測試”公關,還是大會上請來楊毅給度祕背書,請來胡歌給”使用者畫像能力”造勢,反正將核心迴歸到技術領域的百度,應當還是讓人欣慰的。
相交於國外不時就曝光一個又一個的黑科技,國內的科技領域太過於“平淡無奇”。不管是百度,還是別的技術公司,有一家有技術信仰,忠於科技的企業,能夠經常給我們腦洞大開的創新,能夠讓我們對於未來有著更多的暢想,這才是國內技術團隊應當追求的理想。
忘掉那些憑空創造的偽需求,時不時給業界來一個驚天的“小驚喜”,這才是技術人員的驕傲,不是麼?