Machine

Platform

Crowd

CH3. 最像人腦的機器(後)

郭秉閎 王禮恩

CONTENTS

1

MOTIVATION

2

3

review

conclusions

14

rise of ai

6

usage of ai

10

MOTIVATION

.機器卓越的判斷力和分析能力有目共睹,已被廣泛的投入在各個領域當中。為了比競爭對手更出色的運用這項技術,我們必須對「機器學習」的概念有所掌握。

.透過了解這門技術的沿革,我們方能認知這門技術的潛力所在。哪個領域在飛速進步、哪個領域正遭逢困境?以此為據尋求適當的策略。

.熟悉這門技術運用成功的案例有助於我們建立實際的方案,並根據自身擁有的預算決定使用機器學習技術形式。

2

review

3

.規則式及符號式為初期人工智慧研究的主要領域。前者仿照成人學習,注重教導機器規則。後者則仿照小孩學習,希望讓機器藉由學習辨明邏輯,並從自身發展出判別方法。

.然而,兩種做法都在各自的領域中碰壁,人工智慧寒冬就此降臨。

.前者的代表為「邏輯理論家」,後者的代表為「感知器」。儘管這些嘗試並未成功,但其中的經驗是導向如今機器學習技術的基礎。

review

4

.規則式人工智慧所面臨的困難,在於各項事物中的規則,尤其是現實世界中隱藏的規則,往往難以被簡單的論述。

.大量的例外以及各個概念中的模糊界線,導致規則式人工智慧的表現差強人意,遠不如人類。

.「常識」是大部分人類理解世界的方式。但直到2014年,機器都未能發展出令人滿意的常識推理系統。波蘭尼弔詭不只發生於特定領域,更無處不在我們的日常生活中。

review

5

.至於克服波蘭尼弔詭的嘗試,那便是「神經網路」的雛形。藉由模擬人腦經驗、重複、反饋、改進的過程,讓機器在一次次的演算中比前一次更加進步、貼近真實狀況。機器學習這個領域於此誕生。

.然而,人腦中1000億個神經元的複雜通訊,以當時甚至現代的技術顯然無法完全重現。在某些基本的分類工作都無法完成的情況下,感知器這個想法宣告失敗。

rise of ai

6

.人工智慧的發展貌似陷入困境,究竟是什麼契機讓這門技術起死回生,並如雨後春筍般蓬勃發展?雖然原因眾多,但主要可歸因於以下數項。

硬體規模的發展及雲端演算的實現:前者擴大了機器學習的深度及廣度,後者則讓小預算的團體也有辦法進行相關研究。

大數據現象:於網際網路上流通的大量文本、影像、音訊是訓練機器的絕佳材料。

新的演算法:減少對人類介入的仰賴,更強調機器本身學習能力的「深度學習」領域。

rise of ai

7

.TENSORFLOW是由GOOGLE團隊開發,並使用在自家多項服務已改善使用者體驗的機器學習開源軟體庫。源自2010年初的distbelief,為google大腦的第二代機器學習系統。已開源供群眾使用,並有開授課程指導機器學習知識。github上已有上千個使用TENSORFLOW的庫。

.同時,張量處理單元tpu的發佈,更顯著影響了機器學習的效能,為專門為機器學習打造的積體電路。deepmind團隊日後所開發的alphazero即使用了tpu來進行運算。

硬體規模及雲端演算

rise of ai

8

.大量的參考資料對機器學習而言的重要性不言自明,不亞於硬體的影響。神經網路的本質是模擬人腦的學習過程,而對人類而言同樣也須要大量的接觸吸收資訊才能有所成長。

.imagenet便是由這個概念而產生的計畫,透過全世界群眾的貢獻,將超過十億張照片進行分類而成的資料庫。對於圖像辨識領域的貢獻超乎想像。

大數據現象

rise of ai

9

.在前述兩者的興起之下,「非監督式學習」開始出現。與以往問題與答案配對的「監督式學習」做法不同。非監督式學習僅提供機器所需的環境以及目標,由機器本身尋找適當解法。

 

新的演算法

.以走迷宮為例:

.Agent:機器本身

.ENVIRONMENT:迷宮

.REWARD:出口

.STATE:位置

.action:改變狀態的策略

.CONTROL POLICY:採取策略

 

usage of ai

10

.隨著人工智慧日漸強大,使用這項技術成功的案例遍布各領域,方式也各有不同。主要可以分為以下三種。

.藉由收集數據資料強化演算法

.藉由模仿人類經驗建構演算法

.不仰賴人為介入的完全自主化

.根據領域的不同以及預算的差異,每個人/企業有辦法採取的策略不盡相同。大部分現行ai依然採用監督式學習的方式,但若以通用人工智慧為目標,便不得不鑽研非監督式學習。

usagee of ai

11

.google資料中心的維護工作十分不易,考量到本身的運算負荷量以及天氣等不確定因素,過去並沒有降低溫度的確切作法,僅交給工作人員判斷。

.deepmind欲知道機器學習技術能否應用於這個問題上,便搜集了資料中心多年來的資料:運算負荷、感應讀取數值、溫度、濕度等等,來訓練演算法。他們讓藉由讓模型盡可能獲得高分(也就是更節能),來強化演算法。最後得到了總耗能減少40%、間接成本減少15%的驚人成果。

收集數據資料

usagee of ai

12

.軟體工程師小池誠在老家的小黃瓜農場突發奇想,想嘗試利用機器學習的方式取代原本由母親進行的小黃瓜分撿工作。他利用7000張圖像以及前述的tensorflow技術訓練系統。結果正確率高達70%,並且可預期正確率還能更高。

.日本的富國生命保險公司則採用ibm的華生人工智慧技術,欲將一部份理賠員的工作自動化。他們先參考一部份過去的理賠資料,再將結果交由最終審查員審查。在這個過程中,機器學習了難以被說明但依然源於人類的經驗,並且隨著自身的進步可以往更高比率的自動化工作發展。

學習人類經驗

usagee of ai

13

.2016年夏季,一輛特斯拉自駕車撞上一部連結車的側方,導致車主當場死亡。推測原因是在當地的強烈光照下,導致攝影機未能注意到卡車。

.僅管這起案例聽起來像對完全自駕技術的警鐘,但GOOGLE自駕車發展計畫的領導人認為人終究會粗心大意,因此更應該完全排除人類參與。他們設計的自駕車就算在道路上遇到了難以預測的狀況,仍然能保持安全行駛。

完全自動化

conclusion

14

.硬體及系統的成長、大數據現象以及演算法的進步是開啟ai時代的三個主因。其中可以採取的策略組合千變萬化,發展ai技術應審視最終目標以及自身的能力,同時具備超越時代的眼光,找到適合由ai完成,並且更加經濟的工作

.儘管監督式學習是目前的主流,但人類的學習行為更接近非監督式學習,而這個尚未被人們了解的領域正是機器學期正在逐步前往的下一階段。

.機器從無法勝過人類的「感知器」沿革到現在大量取代分類辨識工作的ai,已將大量的工作自動化。然而,機器仍然缺乏常識這點依然是我們需要克服的最大問題,也是波蘭尼弔詭中最難以跨越的門檻。

Thanks for listening

15

Copy of MACHINE PLATFORM CROWD CH3. (後)

By spacezpr

Copy of MACHINE PLATFORM CROWD CH3. (後)

  • 7