
文章來源:星陣圍棋
近期星陣專業(yè)版上線測試后,廣受高水平棋手和普通圍棋愛好者的好評。與此同時,網(wǎng)絡上出現(xiàn)了一些關于星陣的不實信息,其中很多言論與事實明顯不符?,F(xiàn)選取比較有代表性的幾點質疑進行回應,以正視聽。為了更客觀地還原事實真相,這幾天來我們尋找了大量的資料,包括之前的新聞報道、棋譜等最直接的證據(jù)。本文中的幾點質疑由網(wǎng)友“百年孤獨”陳列,并均為其原話。
質疑1:“由說katago是星陣一年前的技術,也就是去年9月份就有的技術。令人存疑,據(jù)我所知,星陣的任意路數(shù)也是11月份以后,8月份的9路大賽,星陣下出的棋負于人類,和katago差不少,而且卡塔狗支持任意路數(shù)(大于19也支持,還有長方形棋盤),在去年的宣傳中,星陣方面并沒有說過支持任意棋盤,也沒有說過支持19路以上的棋盤,我懷疑星陣支持小棋盤用的縮圖法,并不是卡塔狗方法?!?/p>
回應:事實上在2018年4月人機大戰(zhàn)時,星陣已經(jīng)擁有任意路數(shù)的技術。目前搜索當時的新聞仍然可以找到相關報道,在此僅舉一例:
澎湃新聞:柯潔執(zhí)白不敵國產(chǎn)人工智能“星陣”,但他的勇氣格外珍貴http://news.sina.com.cn/o/2018-04-27/doc-ifztkpip3073988.shtml
此時并沒有公開測試,但中間有多位棋手參與了私下的測試。之后經(jīng)過多次測試改良,在2018年8月南寧中國圍棋大會上進行了公開9路挑戰(zhàn)賽,在2018年12月在弈客進行了天弈17路挑戰(zhàn)賽。并且在弈客的比賽籌劃階段曾經(jīng)在17路和21路之間選擇,后來因為21路一盤棋時間較長因此沒有進行比賽。關于星陣支持任意路數(shù)的方法,早在2018年9月的相關新聞中就已經(jīng)有明確報道:
新浪體育:劉鶴副總理視察星陣圍棋 并與人工智能現(xiàn)場對弈(圖)
http://finance.sina.com.cn/china/gncj/2018-09-19/doc-ihkhfqns7459116.shtml
以上證據(jù)可以說明所謂“星陣的任意路數(shù)也是11月份以后”、“去年的宣傳中星陣方面并沒有說過支持任意棋盤”說法不實。希望今后再有此類疑問時首先查閱公開資料,不要人云亦云。
質疑2:“星陣比賽(2018年4月星陣對leelazero七番棋)的時候為什么要求lz公布權重,而且lz公布權重和實際權重不一樣的時候反而取得了勝利,這個很容易讓人有針對性訓練的遐想?!?/p>
回應:公布權重是星陣方向組織者弈客提出的,目的是賽后驗證招法真實性和數(shù)據(jù)分析,為了人機大戰(zhàn)做準備,得到了leelazero方代表的同意。并且規(guī)則只要求公布權重信息(而且是賽前半小時),沒有對leelazero使用權重的選擇做出任何限制(包括賽前不公開的權重)。所謂“l(fā)z公布權重和實際權重不一樣的時候反而取得了勝利”更是缺乏說服力。這里找到了2、3、4局的權重公示情況。
第2局:
https://home.yikeweiqi.com/#/gonews/detail/16941?type=1
第3局:
https://home.yikeweiqi.com/#/gonews/detail/16972?type=1
第4局:
https://home.yikeweiqi.com/#/gonews/detail/16995?type=1

可以看到第2局和第3局均沒有使用官方權重(星陣方不清楚這兩個權重賽前是否公開),第4局公示使用官方權重但據(jù)說實際使用的是非官方權重并取得勝利(問題的由來)。首先比賽前半小時才會公示使用權重,每一局leelazero使用的均是不同權重,而且很多權重是當天才更新。本身就不存在針對性訓練這種技術,更何況權重賽前未知、并且不斷更新。而且從棋的內容看,前三局星陣贏的并不輕松,第四局也是苦戰(zhàn)惜敗,不存在明顯的差別。所謂“公布權重和實際權重不一樣反而取得了勝利”只是一種巧合衍生出的猜測。
質疑3:“星陣最開始說租機是最新權重,然后后來用ox測試,ox并不弱,然后立刻改口說穩(wěn)定版權重,在索要ox權重后,進行升級,突然對ox碾壓,根據(jù)實際elo曲線,如果不靠針對性方法這個進步至少200分以上,能在短時間內進步200分,這種神奇的速度,然而比賽仍負絕藝,令人費解?!?/p>
回應:首先拿來測試的據(jù)我們所知被稱為oxb02權重,和ox有所區(qū)別。并且某棋友當時在野狐公開測試星陣12x對5卡2080ti的oxb02權重戰(zhàn)成1:1平,之后當晚24x執(zhí)黑0:1 oxb02。然而第二天開始有人開始在各個qq群微信群大肆宣傳,聲稱“oxb02同配置2:0星陣”。
我們得知這一消息后,馬上進行自查。通過在野狐測試和自戰(zhàn)測試發(fā)現(xiàn)最新權重可能存在一定問題。為了保險起見把權重回退到最新的穩(wěn)定版權重(8月份比賽版本)。因此在10月19日之后到目前為止,網(wǎng)頁版使用的均為8月份的穩(wěn)定版權重,那么8月份的星陣是如何針對后面出現(xiàn)的ox(b02)進行針對性訓練的?如果有興趣驗證的話,由于權重時間較早,網(wǎng)頁版目前開局階段黑棋勝率整體比當時所謂“2:0星陣”時要高,可以和當時“第一視角”截圖做對比。同時還可以拿目前的網(wǎng)頁版來分析9月份在野狐上“FuzzyPants”賬號的招法重合度。各種證據(jù)都可以說明網(wǎng)頁版是回退到舊權重,而不是所謂的“升級”,“針對性訓練”謠言不攻自破。
從另一個方面看,星陣出道以來在大賽中多次戰(zhàn)勝非開源AI,在決賽番棋中以較大優(yōu)勢戰(zhàn)勝過AQ、小愛,同時星陣也是在鳳凰圍棋后唯一在正式比賽贏過絕藝的AI。同時ELF(賽后放出最新權重v1)、Leelazero等開源AI在比賽中均使用了未公開的權重,可以說在AI大賽中本來就不存在公開權重的AI,如果星陣是靠所謂的“針對性方法”提升水平,那么是如何在歷屆AI大賽中面對各種對手都取得好成績的?
質疑4:“星陣認為已經(jīng)超過zero的天花板,這個并未有證據(jù)?難道星陣自己跑到過zero的天花板?如果沒有,如何認為zero天花板沒有master方法高?”
回應:首先zero指的是AlphaGoZero論文中40B模型,想對比的是該模型的水平而不是算法的優(yōu)劣。比較水平最直接的方法是對戰(zhàn),但是這個驗證方式基本不可能實現(xiàn)。該論文中包含各版本的等級分推算,可以看到Raw network也就是純神經(jīng)網(wǎng)絡輸出的水平是3055elo分(這里是goratings的分數(shù),并不是中國圍棋等級分)。而星陣對應的Raw network就是星陣陪練小程序9d所使用的。從小程序的使用反饋以及其他相關的對比測試,猜測星陣的Raw network可能超過了3055分,并不是嚴格的證據(jù),星陣也從未發(fā)表過“證明了”超過AlphaGoZero這種言論。
關于zero天花板的master對比,論文中沒有提到過AlphaGo Master的模型大小,主流的非官方消息為20Block。而論文中并沒有提到20Block的zero版本與master版本的棋力對比,因此只看論文無法說明zero天花板高于master。星陣只發(fā)表過類似“master方法天花板不一定低于zero方法”的言論,所謂“認為zero天花板沒有master方法高”完全是曲解原意。
質疑5:“星陣支持日本規(guī)則尚存疑問,日本規(guī)則雙活無目,請問如何用中國規(guī)則模擬日本規(guī)則,如果只是看誰收后的方法,不是真正意義上的日本規(guī)則?!?/p>
回應:日本規(guī)則是一種存在大量人為規(guī)定棋例的規(guī)則,本身很難程序化,星陣也沒有聲稱過支持“真正意義上的日本規(guī)則”。星陣設計了一種“實戰(zhàn)解決的數(shù)目法”,與日本規(guī)則近似度很高,并在17路挑戰(zhàn)賽中使用,并不是簡單的只看誰收后的方法。在2019年3月日本進行的人機配對賽中,星陣和搭檔芮乃偉老師執(zhí)黑半目(盤面7目)險勝對手,過程中星陣判斷精準,已經(jīng)可以說明問題。如果一定要較真的話,星陣確實支持不了“真正意義上的日本規(guī)則”。
質疑6:“去年5月ai大賽,星陣10卡打單卡elf(雖然elf是v100,但是計算速度其實并不高),星陣宣稱那時候已經(jīng)達到elf水平,最終結果確是2:3險勝?!?/p>
回應:“雖然elf是v100,但是計算速度其實并不高”這個前提毫無根據(jù)。根據(jù)elf公開的論文https://arxiv.org/abs/1902.04522,50秒約計算80000個盤面,折合1600playouts/sec。而星陣的10卡是1080ti,平均速度為1500 playouts/sec,考慮到elf模型較小,性能上星陣可以算稍占優(yōu)勢,3:2的比分也說明了當時星陣與elf水平相近。
后記:星陣團隊近期正在全力開發(fā)星陣網(wǎng)頁版,目的是讓每個喜歡圍棋的棋友都能無門檻用上高水平的圍棋AI。從星陣圍棋在去年4月公開亮相開始,各種陰謀論的猜測就陸續(xù)出現(xiàn)了。多次世界圍棋AI大賽星陣均取得了上佳的成績,對人類的讓先、17路、讓二子挑戰(zhàn)賽也表現(xiàn)出色,同時今年開放的微信小程序“星陣陪練”(純神經(jīng)網(wǎng)絡)也受到廣大棋友的一致好評,其中的9D水平被公認明顯強于已有的任何開源AI的純神經(jīng)網(wǎng)絡,這些都證明了星陣的水平和技術創(chuàng)新。
然而不斷有人刻意忽略部分事實,例如將“星陣12x 1:1、24x 0:1 5卡”的結果宣傳為“2:0同配置星陣”。還將星陣團隊成員的一些正常言論進行“加工”,去掉上下文、曲解原意,修改變成有爭議的言論并廣為傳播。包括本次質疑的內容,其中有很多前提就存在明顯的錯誤,由此推論出的星陣種種自然毫無說服力可言。為了澄清這些質疑,盡量還原事情的真相,我們力求每一個問題都找到當時的新聞報道、對局記錄等,做到言之有據(jù)。
關于網(wǎng)頁版的水平,較少盤數(shù)水平的測試原本就存在較大波動,對星陣有利的結果被歪曲成“星陣使用了各種不光彩的手段”,對星陣不利的結果自然被解釋成“星陣就是這個水平”。并且先后出現(xiàn)了大量自相矛盾的說法:當有人詢問星陣水平的時候,可以說“星陣同配置與XX權重差不多”;為了說明星陣“針對性訓練”,又會說“星陣碾壓XX權重”。
星陣團隊認可每一個開源AI對圍棋所做的貢獻,肯定每一個開源AI的實力。同時歡迎客觀公正的對比測試,接受合理的意見,為廣大真正熱愛圍棋的愛好者們做出自己的貢獻。
