勤學勵志文章
勤學是我們每個人最應該做到的習慣,那麼都有哪些呢?一起來看看吧。
:深度學習是什麼
作者:獵豹CEO傅盛
人工智慧,就好像第四次工業革命,正從學術界的私藏,轉變為一種能夠改變世界的力量。尤其,以深度學習取得的進步為顯著標志。它讓匍匐前進60年的人工智慧一鳴驚人。我們正降落到一片新大陸。深度學習帶來的這場重大技術革命,有可能顛覆過去20年網際網路對技術的認知,實現技術體驗的跨越式發展。
那麼,深度學習到底是什麼?怎麼理解它的重要性?
我們先從概念和現象入手。我總結了一句話,學術上看未必嚴謹,但從我的理解角度看——深度學習是基於多層神經網路的,海量資料為輸入的,規則自學習方法。
這裡包含了幾個關鍵詞:
第一個關鍵詞叫多層神經網路。
深度學習所基於的多層神經網路並非新鮮事物,甚至在80年代被認為沒前途。但近年來,科學家們對多層神經網路的不斷演算法優化,使它出現了突破性的進展。以往很多演算法是線性的。而這世界上大多數事情的特徵是複雜非線性的。比如貓的影象中,就包含了顏色、形態、五官、光線等各種資訊。深度學習的關鍵就是通過多層非線性對映將這些因素成功分開。
那為什麼要深呢?多層神經網路比淺層的好處在哪兒呢?
簡單說,就是可以減少引數。因為它重複利用中間層的計算單元。我們還是以認貓為例好了。它可以學習貓的分層特徵:最底層從原始畫素開始學習,刻畫區域性的邊緣和紋;中層把各種邊緣進行組合,描述不同型別的貓的器官;最高層描述的是整個貓的全域性特徵。它需要超強的計算能力,同時還不斷有海量資料的輸入。特別是在資訊表示和特徵設計方面,過去大量依賴人工,嚴重影響有效性和通用性。深度學習則徹底顛覆了“人造特徵”的正規化,開啟了資料驅動的“表示學習”正規化——由資料自提取特徵,計算機自己發現規則,進行自學習。
你可以理解為——過去,人們對經驗的利用,靠人類自己完成。在深度學習呢?經驗,以資料形式存在。因此,深度學習,就是關於在計算機上從資料中產生模型的演算法,即深度學習演算法。
問題來了,幾年前講大資料,以及各種演算法,與深度學習有什麼區別呢?
過去的演算法模式,數學上叫線性,x和y的關係是對應的,它是一種函式體現的對映。但這種演算法在海量資料面前遇到了瓶頸。國際上著名的ImageNet影象分類大賽,用傳統演算法,識別錯誤率一直降不下去,上深度學習後,錯誤率大幅降低。在2010年,獲勝的系統只能正確標記72%的圖片;到2012年,多倫多大學的 Geoff Hinton利用深度學習的新技術,帶領團隊實現了85%的準確率。2015年的ImageNet競賽上,一個深度學習系統以96%的準確率第一次超過了人類人類平均有95%的準確率。
計算機認圖的能力,已經超過了人。尤其影象和語音等複雜應用,深度學習技術取得了優越的效能。為什麼呢?其實就是思路的革新。
舉幾個腦洞大開的例子。
先說計算機認貓。我們通常能用很多屬性描述一個事物。其中有些屬性可能很關鍵,很有用,另一些屬性可能沒什麼用。我們就將屬性被稱為特徵。特徵辨識,就是一個數據處理的過程。傳統演算法認貓,也是標註各種特徵去認。就是大眼睛,有鬍子,有花紋。但這種特徵寫著寫著,有的貓和老虎就分不出來,狗和貓也分不出來。這種方法叫——人制定規則,機器學習這種規則。
深度學習方法怎麼辦呢?直接給你百萬張圖片,說這裡有貓,再給你上百萬張圖,說這裡沒貓。然後再訓練一個深度網路,通過深度學習自己去學貓的特徵,計算機就知道了,誰是貓。
第二個例子是谷歌訓練機械手抓取。
傳統方法肯定是看到那裡有個機械手,就寫好函式,move到xyz標註的空間點,利用程式實現一次抓取。而谷歌現在用機器人訓練一個深度神經網路,幫助機器人根據攝像頭輸入和電機命令,預測抓取的結果。簡單說,就是訓練機器人的手眼協調。機器人會觀測自己的機械臂,實時糾正抓取運動。所有行為都從學習中自然浮現,而不是依靠傳統的系統程式。
為了加快學習程序,谷歌用了14個機械手同時工作,在將近3000小時的訓練,相當於80萬次抓取嘗試後,開始看到智慧反應行為的出現。據公開資料,沒有訓練的機械手,前30次抓取失敗率為34%,而訓練後,失敗率降低到18%。這就是一個自我學習的過程。
有人問了,深度學習,能學習寫文章嗎?
來看這個例子。斯坦福大學的計算機博士andrej kapathy曾用托爾斯泰的小說《戰爭與和平》來訓練神經網路。每訓練100個回合,就叫它寫文章。100個回合後,機器知道要空格,但仍然有亂碼。500個回合後,能正確拼寫一些短單詞。1200個回合後,有標點符號和長單詞。2000個回合後,已經可以正確拼寫更復雜的語句。
整個演化過程是個什麼情況呢?以前我們寫文章,只要告訴主謂賓。而以上過程,完全沒人告訴機器語法規則。甚至,連標點和字母區別都不用告訴它。不告訴機器任何程式。只是不停將原始資料進行訓練,一層一層訓練,最後輸出結果——就是一個個看得懂的語句。一切看起來都很有趣。人工智慧與深度學習的美妙之處,也正在於此。
我還去矽谷看過一家公司——完全顛覆以往的演算法,利用深度學習實現影象深度資訊的採集。
眾所周知,市面上已經有無人機,可實現人的跟蹤。它的方法是什麼呢?一個人,在影象系統裡,一堆色塊的組合。通過人工的方式進行特徵選擇,比如顏色特徵,梯度特徵。拿簡單的顏色特徵舉例:比如你穿著綠色衣服,突然走進草叢,就可能跟丟。或,他脫了件衣服,幾個人很相近,也容易跟丟。此時,若想在這個基礎上繼續優化,將顏色特徵進行某些調整,是非常困難的。而且調整後,還會存在對過去某些狀況不適用的問題。
總之,這樣的演算法需要不停迭代,迭代又會影響前面的效果。而矽谷這個團隊,利用深度學習,把所有人腦袋做出來,只區分好前景和背景。區分之後,背景全部用數學方式隨意填充,再不斷生產大量背景資料,進行自學習。只要把前景學習出來就行。
據我所知,很多傳統方法,還在採用雙目視覺。用計算機去做區域性匹配,再根據雙目測出的兩個匹配的差距,去推算空間另一個點和它的三角位置,從而判斷離你多遠。可想而知,深度學習的出現,使得很多公司辛苦積累的軟體演算法直接作廢了。“演算法為核心競爭力”,正在轉變為,“資料為核心競爭力”。技術人員必須進入新的起跑線。
最後再舉個例子。
大家都做過胃鏡。尤其胃痛,很痛苦。腸胃鏡要分開做,而且小腸看不見。有一家公司出了一種膠囊攝像頭。吃進去後,在你的消化道,每5秒拍一幅圖,連續攝像,此後再排出膠囊。所有關於腸道胃部的問題,全部完整記錄。但醫生光把那個圖看完,就需要五個小時。原本的機器主動檢測漏檢率高,要醫生複查。後來,他們採用深度學習。採集8000多例圖片資料灌進去,用機器不斷學,不僅提高診斷精確率,減少了醫生的漏診,以及對稀缺好醫生的經驗依賴。只需要靠機器自己去學習規則。
深度學習演算法,可以幫助醫生作出決策。
瞭解完深度學習,接著思考一個問題——20世紀70年代末80年代初,個人電腦突飛猛進時,人工智慧的商業化卻步履維艱。喬布斯曾這樣定義個人計算機的價值——“它是我們思維的自行車”。那麼,今天的人工智慧呢?深度學習呢?它給我們真正帶來的東西是什麼?未來,對行業和社會有什麼影響?中國公司的機會在哪?
:學習的捷徑從模仿和重複開始
作者:劉思言
最近終於有能量去拾起以前丟下的興趣愛好。由於時間關係,只能買書自學。也有在微博上關注一些水彩大觸。仔細研究發現,他們開班教授的水彩課,大都一個模式。就是老師先示範一遍怎麼畫,然後學生再按照老師的步驟,去把老師畫過的畫重新畫一遍。如果一遍不行,達不到預期效果,那就重複多遍。
這種學習方法,適用於很多地方。據我觀察,我們的人生經歷中,有很多課程都是通過這種方法所習得。
最早先的時候,當我們還是襁褓中的嬰兒,又或是牙牙學語的幼兒,我們所有的行為模式,包括脾氣性格,都是在模仿大人。我們會模仿大人說話,走路,做動作。也會學到大人不好的行為習慣。
在動物界,成年的動物也會教授幼年動物捕獵技巧,生存技能。所有的教授,都是讓幼年的動物模仿自己。通過一遍一遍的模仿,最終變成自己所掌握的技能。
這些是因為肌肉具有記憶效應。同一種動作重複多次以後,肌肉就會形成條件反射。所以英語學習中常說的語感,其實也是一種肌肉記憶。通過不斷練習模仿,模仿標準發音,重複閱讀,使肌肉和舌頭形成條件反射,以此來增強我們的語感。
所以一開始學習英語的時候,老師都會教我們如何朗讀,也會讓我們去聽英語原聲磁帶。還有一些同學是喜歡聽VOA和BBC這樣的英文廣播,或是去聽一些英語演講,比如美國總統就職演說一類的,還有些同學喜歡看原聲電影或電視劇。所有這些,都是一個模仿的過程。當我們的發音還不那麼標準的時候,我們就通過去模仿那些標準的發音,來糾正自己。同時也提高了我們自己的聽力水平。
同樣適用的還有畫畫和書法。我至今都清楚地記得小學三年級的時候,學校搞了個畫畫比賽。我回家對著家裡的年畫年年有魚畫了一幅。是一個穿著紅肚兜的中國傳統娃娃騎坐在一條大紅色錦鯉身上,特別喜慶。那是我第一次認認真真地畫完一幅畫。我儘量模仿年畫的樣子,儘量百分百地還原那副年畫。
後來那副畫得了一等獎。那是我第一次感覺,畫畫好像沒那麼難。後來也斷斷續續地畫。那個時候最喜歡的就是畫花仙子。也是儘量地模仿書本上花仙子的樣子。所以臨摹一定是畫畫的第一步。當我們還不會自己構圖的時候,當我們對事物還沒有那麼深刻理解的時候,臨摹也許是最簡單最有效也最捷徑的方法了。
而對於書法來說,臨帖更是必不可少。臨帖是書法家終生的必修課。但臨帖一定要臨那些經典的作品。因為好的書法作品,一定能帶給你不一樣的啟發。你每次臨完之後一定會有不同的收穫。可是不好的作品同樣也會帶給你不好的影響。重複與模仿這種方法可行,是因為我們模仿的物件是值得學習的。如果一開始你模仿的物件就是一個偽物件,你不但會失去真正模仿的意義,也會把那些壞習慣學過來。
所以為什麼我們總愛說要樹立好的榜樣。因為壞榜樣一旦有人模仿,後果也是不堪設想。
最近看浙江衛視有檔歌唱類節目叫我是大歌神。裡面的選手就叫模唱選手。模唱選手和歌手本尊在挑戰間裡面唱,下面有猜評團的評委來猜哪個才是真正的歌手本尊。有那麼一些模唱歌手,真的能以假亂真,讓人分不清真偽。
所以主持人說雖然現在是模唱歌手,但將來也有可能找到自己的方向,成為真正的歌手。天后那英沒成名以前去參加歌唱比賽,也可以說是模唱。她當時模仿的是蘇芮。所以,在我們還沒有足夠的力量形成自己的風格以前,模仿也不失為一個好方法。我覺得這種方法最適合我這種音痴。
我一直唱歌都五音不全,老走調。有段時間覺得應該要好好改變一下,最好能一雪前恥。於是對著電腦一遍一遍地練習丁當的《我愛他》,後來有次去KTV,一個唱歌很好的朋友居然說這首唱得不錯,是練過的吧?嘿嘿,我會告訴你為了唱好這首歌我練了三個月?
同樣的,我覺得重複和模仿還適用於學習舞蹈。大家想想為什麼有那麼多人模仿MJ呢?那些舞蹈工作室的學員們,有哪個不是一遍遍地對著碟片認真練習那些經典的舞蹈?當你還沒有掌握基礎的舞蹈動作,沒有能力編舞的時候,那麼還是老老實實地從模仿和重複開始吧。
然後我想最適用這種方法的,應該要算某些體育運動了。這大概也是因為運動靠的就是肌肉啊,當然鍛鍊的也是肌肉。學乒乓球和羽毛球的同學都知道,教練教給你手的動作,然後就會讓你重複練習,增強肌肉記憶。而標準的握拍、揮拍、拉球等動作一旦習得,就一輩子都不會忘記。諸如鮑春來,王楠這樣的羽壇乒壇大咖,即使退役多年,參加某些綜藝節目的時候,人家一上手,分分鐘就知道什麼叫專業範。至於像體操跳水那些動作,哪個不是靠上千上萬次的練習來掌握的?
所以你看,重複和模模擬的是一條捷徑,能幫助你學習基礎,掌握技巧,提高技藝,然後才是形成自己的風格。也許很多時候不是我們學不會什麼,而是我們願不願意花點時間去重複與模仿。不要覺得重複與模仿可笑無聊低階。因為這是每一次學習的必經之路,是所有後天學習的基石。基礎打好了,要蓋高樓大廈那還不是遲早的事兒嗎?