繼IBM開發的“深藍”在1997年擊敗卡斯帕羅夫之后,韓國棋手李世石與谷歌旗下公司DeepMind開發的AlphaGo再度展開人機大戰。這一次依舊以機器的勝利告終,并且AlphaGo很早就取得了3比0的絕對優勢。與國際象棋不同,圍棋需要的計算量更大,并且需要棋手在關鍵步數的走法上擁有良好的“直覺”和“棋感”,尤其是在大局觀上要有敏銳的判斷,而這些曾經都是機器的弱點。是什么讓機器有這么快的進步,連圍棋也被AlphaGo攻克-就是計算機的深度學習能力。
與前幾代人工智能不同,擁有深度學習能力的人工智能技術是一項重大突破,機器開始可以模仿人類的神經系統進行有效學習并且進步神速,本期“酷創新”,我們來關注幾大科技巨頭公司最近推出的具有“深度學習”能力的人工智能技術。
臉書的Big Sur
2015年底,臉書人工智能研究部門宣布,之前已經開放了多數軟件源代碼的人工智能計算服務器Big Sur會將其硬件設計也開源。臉書此次開源的是最新的大規模人工智能計算服務器設計,并將其提交給開源計算項目——這個項目分享了很多大公司的數據中心產品設計。這款名為Big Sur的人工智能計算服務器,內部集成了用于處理大量數據的GPU。Big Sur的目的是訓練神經網絡,而現代化人工智能研究項目幾乎都要依賴這種系統。Big Sur服務器是依托Nvidia的GPU而打造的。GPU在人工智能中的應用十分廣泛,因為這種芯片上搭載的處理核心數量多于Intel生產的傳統處理器,使得它們十分適用于AI軟件所需要的海量計算。Big Sur的設計特點是易于維修的主板,它裝有8個NVIDIA的Tesla M40。臉書表示,CPU的散熱器是該硬件中唯一一個需要用螺絲刀拆卸的東西。
AlphaGo的新功能
AlphaGo是谷歌旗下公司DeepMind開發的一款具有深度學習功能的圍棋軟件。早在2013年,DeepMind就創造出了可以模仿人類思維,學習如何玩兒電子游戲的人工神經網絡。AlphaGo的工作原理是,由兩個不同功能的“大腦”網絡組成:策略網絡(Policy network)和價值網絡(Value network)協同工作。策略網絡負責在當前局面下判斷“最好的”下一步,可以理解為落子選擇器;價值網絡負責評估整體盤面的優劣,淘汰掉不值得深入計算的走法,協助前者提高運算效率,可以理解為棋局評估器。然后,兩個“大腦”取各自選擇的平均值,做出最終的決定。
不過,DeepMind的技術并不是專門用來下圍棋的,所謂深度學習只是通過機器自身的學習來模仿人類思維,并且不斷提高完成各種特定任務的能力,而下圍棋只是其中一種特定任務罷了。目前DeepMind正在與英國NHS(國家醫療服務體系)進行合作,并已經成立了“DeepMind健康”項目,并希望通過技術手段,幫助有意向參與的醫護人員提高服務質量。
Watson正變得越來越聰明
Watson是IBM已經開發了十幾年的人工智能技術,Watson正在變得越來越“聰明”。通常意義上,Watson已經進入了與巨量文獻和信息搜索密切相關的政府部門和醫療機構,并且在圖像識別方面已經具備了幫助醫生診斷癌癥的能力。然而這還不是全部。
IBM開發人工智能技術的目的并不是為了替代人,而是更好地服務于人。在此之前,人類在各個行業中產生了大量的“非結構數據”,其中80%以上是計算機無法“讀懂”的,IBM正是要訓練Watson“讀懂”這些數據,并且找出之前必須通過聘用具有高度洞察力的人類專家才能發現的一些數據之間的內在相關性,其中的意義極為深刻。在Watson的商業應用中,IBM已經與眾多企業建立合作,包括與輝瑞制藥聯合利用大數據建立慢性病風險預測模型,和科大訊飛推動云平臺架構合作,與Under Armour合作推出“認知訓練系統”IBM開發人工智能技術的目的并不是為了替代人,而是更好地服務于人。在此之前,人類在各個行業中產生了大量的“非結構數據”,其中80%以上是計算機無法“讀懂”的,IBM正是要訓練Watson“讀懂”這些數據,并且找出之前必須通過聘用具有高度洞察力的人類專家才能發現的一些數據之間的內在相關性,其中的意義極為深刻。在Watson的商業應用中,IBM已經與眾多企業建立合作,包括與輝瑞制藥聯合利用大數據建立慢性病風險預測模型,和科大訊飛推動云平臺架構合作,與Under Armour合作推出“認知訓練系統”,與美敦力合作為病患提供個性化的糖尿病管理服務等等。
微軟的“深度殘差學習”
2015年底,微軟亞洲研究院視覺計算組在ImageNet計算機識別挑戰賽中憑借深層神經網絡技術的最新突破,以絕對優勢獲得圖像分類、圖像定位以及圖像檢測全部三個主要項目的冠軍。這次,微軟亞洲研究院視覺計算組首席研究員孫劍博士帶領的團隊在深層神經網絡方面進行了算法的更新,稱之為“深層殘差網絡”(deep residual networks)。目前普遍使用的神經網絡層級能夠達到20到30層,在此次挑戰賽中該團隊應用的神經網絡系統實現了152層。深度神經網絡以“層”的形式分布。每一層都具有不同系列的運算——也就是算法。某一層的輸出會成為下一層的輸入?;\統地說,如果一個神經網絡是設計用來進行圖像識別的,其中某一層神經將負責尋找圖片的一系列特性——邊、角、形狀或者紋理——而下一層神經則負責尋找另一個系列的特性。這些層級就構成了神經網絡的“深度”。一般來講,神經網絡的層級越多,機器學習的難度也就越小。
據悉,微軟在視覺領域的研究成果已經轉化到了諸多自身產品當中,包括Windows 10中的Windows Hello“刷臉”開機功能、必應的圖像搜索、微軟小冰的多個圖像“技能”,OneDrive中的圖片分類功能,以及廣受好評的口袋掃描儀Office Lens等等。
科大訊飛的語音“深度學習”
語音識別給人們的想象空間非常大,比如會聊天的機器人,甚至會考試的機器人。語音識別中的深度學習涉及到算法、模型、平臺,是一個非常復雜的過程??拼笥嶏w深度學習平臺的一位負責人表示,要做深度學習并不難,買臺機器,弄套相關的軟件就可能做起來,但真要上了一定的規模后,系統的搭建是有講究的??拼笥嶏w目前使用的機器大致分兩種,一種是2:4,一種是2:8,其中2代表一臺機器中CPU的數量,4和8則代表GPU的數量。之所以用這樣的機器,并非出于他們的本意,而是由于當前供應商的機器就是這樣設計的。從他們實際應用的角度來看,則更希望有1:4這樣的產品出現,因為CPU在其中確實不承擔太多的作用,只作為基礎的軟件運行平臺。據悉,當前科大訊飛深度學習平臺這一團隊所用的GPU有400多塊。已經是一個不小的規模,不過,現在的神經網絡鏈接數只有10的8次方,跟真正的人腦差了近6個數量級,顯然這400塊是遠遠滿足不了實際需求的,由此也帶出了第二個問題的探討,即除了關注機器中CPU和GPU的配比,做深度計算還關注哪些內容。