Nantu, Taiwan, photo by Sean Yeh

AI時代已經來臨。我們除了學習AI領域常用的Python語言外,還可以做什麼?這是「AI學習筆記」系列想要探討的議題。包括AI是什麼?AI可以做什麼?以及AI未來的發展該與如何應用AI等問題。筆者個人的願望是要在今年(雖然已經Q4了)與明年好好的學習並理解AI領域相關的知識。筆者並非所謂的理工男,在學習的過程中透過閱讀相關書籍、參加線上課程,並且加上實作等等方式來學習。期間並非一帆風順。藉此將這段時間學習的心得做紀錄,希望對其他所謂的「文科生」,卻想要學習AI相關知識的朋友有所幫助。如有理解錯誤之處請不吝指教。

雖然AI人工智慧這個名詞的定義不是很清晰,但是作為AI人工智慧技術之一的機器學習卻是實實在在的存在著。

機器學習,不僅是AI人工智慧的分類之一,也可以說是目前AI人工智慧範疇裡面最成熟的技術,已經活用於各式各樣的領域。例如「判斷郵件是否為垃圾信」的技術,可以說是機器學習的經典範例。

何謂機器學習

那麼倒底什麼是機器學習?

所謂「學習」是指電腦透過一個過程,將工程師輸入的資料進行分析,並且依照資料改良工程師原先給予的規則。這個過程就像是人類在「學習」一般。

在機器學習出現之前,AI人工智慧的主流為「專家系統」,間單來說,電腦可以處理「若A,則回傳B」的規則,但是當我們輸入C的時候,因為不曾給過電腦處理C時應該要如何的規則,電腦就笨笨的不知道該回傳什麼結果。

因此,若要讓專家系統概念下的電腦「變聰明」,就需要讓電腦將「全部的答案」背下來。但是天下之大,事情之多,我們怎麼可能知道全部的答案呢?更不可能讓電腦背下天地間所有問題的全部的答案。於是,透過這種方式設計出來的電腦是無法預測與解答未知的資料。

近年來拜科技進步之賜,大數據的取得變得比以前容易,我們可以用比過去低的成本取得與累積數據資料。有了海量的數據資料,加上電腦運算能力的提升,就可以反覆的訓練模型,即便輸入未知之資料也可以判斷出答案。

因此,機器學習一詞隱含了「電腦不僅僅是執行預先規劃好的事」。它與過去單靠「記憶」學習不同,這個「機器」本身可以自己「學習」,透過這樣的學習,讓電腦可以做到超出工程師原先所設計的程式外之事。

為何要使用機器學習

我們為何要使用機器學習?難道不能使用人工來處理?就算不用人工,難道不能將規則寫入電腦程式中?使用機器學習是基於下面的幾個理由:

可以大量處理資料

最直覺最簡單的理由之一,是「電腦不會累」。它自始至終可以用一貫的標準來處理大量的資料。也可以比人類更快速的處理大量資料。

人類無法定義出完美的規則

以處理垃圾郵件為例,假設我們在D Day定義了一組「何謂垃圾郵件」的規則,剛開始這項規則固然可以攔截到各種垃圾信,但是道高一尺,魔高一丈,隨著時間的經過,出現了日新月異的逃脫技術與方法,讓先前機關算盡定義出來的規則『近似完美』的規則開始捉襟見軸,常常讓漏網之魚逃脫,信箱中又開始出現了垃圾郵件。這時候,就必須重新回過頭去定義新的規則,來適應新的現象。而事實是,百密一疏,不管我們添加了多少規則,都有可能出現例外。反之,機器學習的優點就在於從人類無法處裡的巨量資料裡面,找出規則與模式,進行分類與預測。

便於維護

此外,當出現原本規則無法分類的新型態垃圾郵件時,機器學習可以自動新增規則,將該郵件分類為垃圾郵件。方法很間單,只要透過再一次的學習,就可以訂定適當的規則。

訓練機器學習模型的流程

「機器學習模型」(簡稱模型)對機器學習來說非常重要。當電腦接收資料後,透過模型運算來輸出結果。模型相當於我們的大腦,模型的好壞會決定電腦輸出結果的適當與否。因此,訓練出好模型就非常重要。

機器學習透過下面的流程進行學習。

  • 取得原始資料
  • 資料清理與探勘
  • 資料特徵工程
  • 訓練機器學習模型:包括評估訓練出來的模型,並且調整參數。
  • 測試模型:將測試資料輸入到訓練出來的模型中測試結果。
  • 預測結果:對未知的數據進行預測。

--

--

Shimbashi, Japan, photo by Sean Yeh

面對AI時代的來臨,除了學習AI領域常用的Python語言外,對於AI是什麼?AI可以做什麼?以及AI未來的發展該與如何應用AI?等問題,是「AI學習筆記」系列想要探討的主題。今年(雖然目前已經是Q4了)與明年的期望,就是要好好的理解並學習與這個領域相關的知識。對於完全沒有背景知識的我來說,為了理解這些知識,不僅透過書籍的閱讀,線上課程的學習,並且加上自己的實作經驗等等。在此,將這段時間學習的心得做個紀錄,希望對其他像我一樣不具備理工背景的所謂「文科生」,而想要學習相關知識的朋友可以有所幫助。如有理解錯誤之處請不吝指教。

「AI人工智慧」可說是目前火紅的名詞。一提到它,一般常常會聯想到電影中常見的會自行走動、會聊天、會煮飯甚至於會嫉妒會戀愛的機器人。

--

--

Sean Yeh

# Taipei, Internet Digital Advertising 「樂於發現與分享,才是最大贏家」