縝密的思考後下人生的圍棋吧!(AlphaGo VS李世乭이세돌)

alphago deep mind

神經網路系統發展已經超越一般人的認知,這也是本次比賽中大家錯估電腦實力的一大原因,仔細了解就會發現資訊科技發展已經超出我們的想像,這篇文章用簡單易懂的方式說明AlphaGO的系統架構與本次圍棋賽帶給人的啟發

電腦與人類對戰

關於人機對戰,最有名的莫過於由IBM開發的深藍(Deep Blue),它在1997年5月擊敗西洋棋冠軍卡斯巴羅夫。
以前的方式是窮舉法,也就是把所有的可能性都計算出來,然後評估贏面最大的,但是跟其他棋類相比:
1.圍棋格子數量最多是19X19的方格
2.且每一個棋子權重一致
3.規則較其他棋類複雜
導致在電腦上模擬遇到了瓶頸,不可能將所有的可能性都計算出來,另外圍棋有許多情勢的判斷,要讓電腦去理解棋局的優劣勢是非常困難的事情。

人工智慧?電腦會自己思考

逐點說明Alpha Go的幾個核心技術:
神經網絡系統:使用CNN(Convolutional Neural Network)能夠協助電腦進行影像的辨識,圖片搜尋就有使用這種技術,這部分幫助電腦讀懂棋盤的內容。
神經網路
電腦眼中的圍棋落子思路。(Source:Google deepmind 官網 AlphaGo | Google DeepMind)

這次在對弈中,協助電腦落子的黃士傑(Aja Huang)為核心開發成員之一,他大學就讀交大資工系,碩、博士班就讀師大資工所,碩士論文「電腦圍棋打劫的策略」,開發能分析圍棋中的一個狀況「劫」的演算法。
圍棋劫
「劫」是連一般選手處理時都要特別慎重的狀況,當一方可以提掉對方一子,對方下子時會馬上被提子回來,但若是這樣無限循環下去,比賽就沒完沒了,所以規則上對方無法直接下另外一個位子來提子。 這造成比賽多了額外的變因,簡單來說一般棋類先攻都會有優勢,但是劫處理不好甚至會有被反守為攻的情況,此外還會有雙劫、三劫等更複雜的狀況。

博士論文則著手使用蒙地卡羅樹搜尋法,試圖透過隨機程序的計算找到更精準的解法,2011年博士班畢業的黃士傑加入了DeepMind的團隊,2016年年初將AlphaGO發表在Nature期刊上,論文中Aja Huang與 David Silver並列為第一作者,可見其在團隊中的貢獻度之高。

aja huang

資訊科技崛起

機器學習(Machine Learning)的崛起有兩大原因,第一是電腦運算效能提升、第二是數學上找到更簡便的演算法。這樣的技術跟人工智慧還是有差異,我們期盼的人工智慧是機器真的具備人的思維,但是機器學習則是使用了「向量空間」距離比對的方式,舉例來說:電子鼻感測器味,之後把不同的氣味標註在一個空間中,如果任兩點距離越近,我們就知道兩者的相似度越高,並請電腦做出判斷到底一不一樣。

不過這件事情電腦是在N個維度下去計算,N可能是十幾個維度甚至更高,你沒有聽錯,人腦連四維空間都無法模擬,但是藉由強大的運算能力,它將訓練好的棋譜記憶在這個十幾維度的向量空間中。它的做法就是把現在比賽中的狀況跟向量空間的這些記憶點比較,如同上頭氣味的例子一般,距離最近的就是最佳的解。
AlphaGo利用目前最尖端的深度學習(deep learning)進行訓練,這樣的運算模式是比賽結果令人跌破眼鏡的一大主因,因為電腦現在的「計算模式」以經到了人類無法比擬的狀態。

alphago棋譜

電腦完美的佈局

在首戰中李世乭在第七子時沒有按常規佈局在上邊連片,而選擇走在右邊。李世石自己在職業比賽中,從未使用過這一開局,甚至整個職業圍棋界沒有人見過這下法,推測是他想試探電腦,想知道如果下出一個不可能會有人下的位置,電腦會不會誤判,但是如同上提到,電腦並不是採取窮舉法與棋譜做對照,而是用勝率來做評估,所以在開局時的錯誤判斷,竟然導致在收官(接近比賽尾聲時),這一子之差讓黑子表現每況愈下,對於電腦而言越接近尾盤,可下的位置可能性越來越少,因此計算上會越來越精準,讓李世乭以投降做結局。

圍棋與人生

我對於這次比賽很有感觸的部分是,之前聽過業餘六段的學長分享,在2012年時鄭明析牧師分享過關於圍棋的教導,當時配合的畫面正是李世乭與對手進行九段對決的影片,比賽白熱化,面臨要處理「劫」的狀況。雖然一般人就這樣看過去,但是學長當下就得到了很大的衝擊:「我完全體會牧師為什麼用圍棋來舉例了!」

“你們會下圍棋嗎?
我想要用這個做比喻來說明關於「太單純」的部分。
如果太單純地下圍棋,對方就會立刻把自己的棋子吃掉。
因此,必須要先思考:「如果我下在這邊,對方應該會下在某處吧!」之後再下棋才行。如果都沒有思考對方會下在哪裡,就想要吃掉對方的棋子,只思考自己的部分來下棋,這樣是不行的。
「人生」也是一樣,對於稱為「自己」的身軀,要如同圍棋棋盤上的棋子一般,慎重地思考之後再移動並行動才行。"––2012/10/31證道


對照這次的戰況,我自己也深入的經歷這個部分,大多數的人都不會因著這個比賽走上資訊工程、成為職業棋士,但是每個人都要面對一日二十四小時的人生,必須要縝密地思考後再行動,當下一個決定,現在看不出來,但是只有走到底才發現這是一個明智的選擇、錯誤的選擇。

“「人生」也是一樣,對於稱為「自己」的身軀,要如同圍棋棋盤上的棋子一般,慎重地思考之後再移動並行動才行。"——鄭明析牧師

參考資料:
為什麼支持Alpha GO獲勝
李世乭:我在開局犯了錯誤
不是電腦打敗人類,是人類打敗人類
李喆微信評論

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s