什麼是AI人工智慧 關於它的七大誤解
什麼是AI人工智慧
如果你是一名企業主管(而不是資料科學家或機器學習專家),你可能已經從主流媒體的報道中接觸過人工智慧。你可能在《經濟學人》和《名利場》讀過相關文章,或讀過有關Tesla自動駕駛的故事,或史蒂芬·霍金寫AI對人類的威脅的文章,甚至還看過有關人工智慧和人類智慧的諷刺漫畫。 所以,如果你是關心你的企業發展的高管,這些有關AI的媒體報道可能會引出兩個惱人的問題: 第一,AI的商業潛力是真是假? 第二,AI如何應用於我的產品? 第一個問題的答案是肯定的,AI具有商業潛力。今天,企業已經能應用AI改變需要人類智慧的自動作業流程。AI能讓人力密集型企業處理的工作量增加100倍,同時把單位經濟效益降低90%。 回答第二個問題需要多一點時間。首先,我們必須消除主流媒體宣傳的AI神話。只有消除這些誤解,你才能對怎樣應用AI到你的業務中有一個框架。
關於人工智慧AI的七大誤解
神話1:AI是魔術
許多主流媒體把AI的描述得想魔術一般神奇,好像我們只需要對谷歌、Facebook、蘋果、亞馬遜和微軟這些大公司的高階魔術師使勁鼓掌。這種描述是幫倒忙。如果我們希望企業採用AI,那麼我們就需要讓企業家們理解AI。AI並不是魔術。AI是資料、數學、模型以及迭代。要想讓AI為企業接受,我們需要更加透明,以下是3個有關AI的關鍵概念的解釋:
訓練資料(TD):訓練資料是機器學習的初始資料集。訓練資料包括輸入和預回答輸出,所以機器學習模型能夠為任何給定輸出尋找模式。例如,輸入可以是帶有客戶和企業支援代表(CSR)間的電子郵件執行緒的客戶支援ticket,輸出可以是基於企業特定分類定義的從1到5的分類標籤。
機器學習(ML):機器學習是能從訓練資料中學習模式,並讓這些模式應用於新的輸入資料的軟體。例如,接收到帶有客戶和CSR間的電子郵件執行緒的一個新的客戶支援ticket時,機器學習模型能預測它的分類,並告訴你它對這個預測的置信度。機器學習的主要特點是它學習新的、而非適用固有的規則。因此,它能通過消化新的資料調整自己的規則。
Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三個核心要素。我們不能指望機器學習模型絕對可靠。一個好的機器學習模型可能只有70%的準確率。因此,當模型的置信度較低時,就需要人使用Human-in-the-Loop作業流程。
所以,不要被AI是魔術的神話所迷惑。理解AI的基礎公式是:AI=TD+ML+HITL。
神話2:AI只為技術精英專屬
媒體報道很容易讓人產生一種錯覺,就是AI只屬於技術精英——大公司例如Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它們能夠組建大型機器學習專家團隊,並獲得億美元級的投資。這種觀念是錯的。
今天,不用10萬美元就能著手應用AI到你的業務中。所以,如果你是美國收益大於5000萬美元的26000家企業之一,你就可以把收益的0.2%投資於AI應用了。
所以,AI不是技術精英專屬。它屬於每個企業。
神話3:AI只為解決十億美元級別的問題
主流媒體的傾向於報道未來主義的事物,例如自動駕駛汽車或用於運送快遞的無人飛機。像Google,Tesla,Uber這些公司由於“贏者通吃”的心態,為了搶佔未來無人車市場的龍頭老大地位,已經投資進去數百億美元。這些給人的印象是AI只用於解決十億美元級別的新問題。但這又是一個錯誤。
AI也應用於解決現存的較小的問題,例如百萬美元級別的問題。讓我解釋一下:任何一個企業的核心需求都是理解客戶。從古希臘的agora市集和古羅馬的個人買賣廣場就是如此。今天也是如此,哪怕生意買賣爆發性地轉移到了網際網路上。許多企業坐擁來自客戶的非結構化資料寶藏,這些資料來自電子郵件執行緒或Twitter評論。AI能應用於這些分類支援ticket的挑戰,或用於理解推文情緒。
所以,AI不僅能應用於十億美元級別的令人興奮的新問題,例如自動駕駛汽車。AI也用於現存的“無趣”的小問題,例如通過支援ticket分類或社交媒體情緒分析更好地理解客戶。
神話4:演算法比資料更重要
主流媒體中有關AI的報道傾向於認為機器學習演算法是最重要的要素。它們似乎把演算法等同於人類大腦。它們暗示正是演算法讓魔術發生作用,更精細複雜的演算法能超越人類大腦。有關機器在國際圍棋和象棋中戰勝人類的報道就是例子。媒體關注的是“深度神經網路”、“深度學習”以及機器如何做決定。
這樣的報道可能帶給企業這樣的印象:想要應用AI,他們得先聘請到機器學習專家來建一個完美的演算法。但假如企業不考慮怎樣獲得更高質量、更大量的定製訓練資料以讓機器學習模型學習,就算有了完美的演算法也可能得不到理想的效果(“我們有超棒的演算法”和“我們的模型只有60%的準確率”間的落差)。
從Microsoft,Amazon和Google這些公司購買商用機器學習服務,卻沒有一個訓練資料規劃或預算,就好比買了一輛汽車,卻沒法到達加油站。你只是買了一大塊很貴的金屬而已。汽車和汽油的類比雖然不夠恰當,因為如果你給機器學習模型補給越多的訓練資料,模型就能變得越好。這就像汽車每用完一箱汽油,積累的里程數越大。所以訓練資料甚至比汽油更重要。所以,訓練資料的質量和數量至少是與演算法同等重要的。
神話5:機器>人
過去30年來,媒體一直喜歡把AI描述為比人類強大的機器,例如《終結者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒體這樣做也可以理解,因為媒體想建立起機器和人類之間誰會贏的簡單敘述結構。但是,這和實際情況不符。
例如,最近Google的DeepMind/AlphaGo戰勝李世石的新聞被媒體簡單描述成機器戰勝了人類。這是不準確的,真實情況不是這樣簡單。更準確的描述應該是“機器聯合許多人戰勝了一個人”。
消除這種誤解的核心理由是機器和人類具有互補的能力。請看上圖。機器的特長是處理結構化計算,他們會在“找出特徵向量”任務上表現良好。而人類的特長是理解意義和上下文,他們在“找出豹紋連衣裙”任務上表現良好,讓人類做“找出特徵向量”的任務就不那麼容易了。
因此,對企業來說正確的框架是實現機器和人的互補,AI是機器和人的共同工作。
神話6:AI就是機器取代人類
主流媒體喜歡描繪反烏托邦的未來,因為它們認為這能吸引眼球。這樣或許確實能吸引讀者眼球,但是,它對真正理解機器和人類如何共同工作沒有一點幫助。
例如,讓我們再回到企業分類支援ticket的業務上來。在現今的大多數企業,這還是100%人工的過程。所以,這個過程又慢成本又高,能做的數量受到限制。假設你在分類了10000個支援ticket之後得到了一個準確率為70%的模型。30%的時候結果錯誤,但這時Human-in-the-loop就可以介入了。你可以把可接受置信度設定為95%,只接受置信度是95%或高於95%的輸出結果。那麼機器學習模型最初就只能做一小部分工作,比如說5%-10%。但是當模型得到新的人工標記資料時,它就能學習、進步。因此,隨著時間的推移,模型能處理更多的客戶支援ticket分類工作,企業也能大大增加分類的ticket量。
所以,機器和人聯合可以增加工作量,同時保持質量,降低重要業務的單位經濟效益。這就消滅了機器取代人類的AI神話。真相是,AI是機器強化人類。
神話7:AI=ML
主流媒體有關AI的最後一個神話是把人工智慧和機器學習當做一回事了。這可能讓企業管理層以為只要買下Microsoft,Amazon或Google的某個商用機器學習服務就能把AI轉變為產品。
實現一個AI解決方案,除了機器學習,你還需要訓練資料,需要human-in-the-loop。缺了訓練資料的機器學習就像沒汽油的汽車,雖然很貴,但去不到任何地方。缺了human-in-the-loop的機器學習也會導致不良後果。你需要人去推翻機器學習模型低置信度的預測。
人工智慧在未來的應用
交通運輸方面肯定會有很大的轉變,從現在的人工駕駛逐步轉換成以後的無人駕駛。現在在美國矽谷就時常可以見到那些無人駕駛的車投入使用了,不僅是無人駕駛的汽車,飛機也可以利用無人駕駛技術翱翔在天空中,餓了麼商業用途的小型無人機已經開始送外賣了。所以在交通上,肯定會有著一大轉變。 醫療方面也肯定會有著巨大的差距。人工智慧通過自動瀏覽使用者的病情將自動化進行診斷,同時,可穿戴醫療裝置,移動應用,都能夠讓我們在未來的人工智慧醫療方面更進一步。在輪椅、智慧骨骼等方面也能能夠進一步的提升。 安全方面人工智慧在未來必定也是不可少的一份子。在未來人工智慧在治安方面將會成為非常重要的一份子,無論是從監控上的人臉識別技術還是從未來的機器人警察法官等都會有著重要的地位。在目前人臉識別技術已經用在了大部分的攝像頭上,對警察在尋找嫌疑人方面有著巨大的幫助,相信在未來人工智慧對於警察會有更大的幫助。