張衛國一聽又重新平靜下來,繼續問著關鍵問題:
“那你落子時如何選擇的?選擇方案是什麽?”
“根據我了解的相關論文文獻,到現在為止所有研究所設計的相關系統,落子時的選擇都是基於兩方面的考慮。”
“一是通過訓練形成一個‘策略網絡’,主要是將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。
然後,訓練出一個‘價值網絡’對自我對弈進行預測,以-1(對手的絕對勝利)到1的標準,預測所有可行落子位置的結果。
這兩個網絡自身都十分強大,而目前國際上所有的相關文獻描述的都是,將這兩種網絡整合進基於概率的蒙特卡羅樹搜索中,實現了它真正的優勢。”
張衛國推了推眼鏡,額頭微點,這個陳家濤肚子裡倒是有不少貨啊,他說的正是他們的設計思路。
“而我的系統在設計如何落子時是將上述兩個神經是網絡合二為一,摒棄了棋譜,通過它自己產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。
讓它從低級的對戰慢慢成長,從而讓它能得到更高效的訓練和評估”
陳家濤停頓了一下,觀察了一下評委,發現他們差不多消化了他所說的信息,繼續道:
“在獲取棋局信息後,圍棋系統會神經網絡中根據策略網絡功能,探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。
在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為阿爾法圍棋的最終選擇。
在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,圍棋系統的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。”
前世包括阿爾法系統的舊版本,都是結合了數百萬人類圍棋專家的棋譜,以及強化學習的監督學習進行了自我訓練。
而現在陳家濤所講述的方法,還沒有任何期刊雜志發表過,毫不過分的說陳家濤現在的方法是全球首創也不為過。
當然這是在獲得深度睡眠學習系統後,在夢裡附身前世阿爾法的機器人的主創人員學到的辦法,只是時間有些短,現在還有一些問題沒有解決。
......
台上,陳家濤對著一堆博雅的教授副教授繼續侃侃而談,回答者他們各種各樣的問題。
陳家濤根本不像是在進行答辯,反而像是在給他們開報告會,只是地點有些不對罷了。
問題回答的差不多了兩方又開始分析系統沒達到預期效果的原因,集思廣益,所有的評委都參與進來,眾人開始討論。
“我覺的進化到專業五段就停止,問題還是在你構建的單一神經網絡上,會不會是你的網絡太簡略,已經到達了極限無法支撐其繼續自我博弈。”
“我不這麽覺得,既然可以自我學習,就代表神經網絡應該沒問題。
可能是你的電腦硬件的方面的問題,儲存空間有限,畢竟你是自己在單打獨奏,設備跟不上是有很大可能的。”
一個皮膚黝黑,理著光頭三十歲左右的老師開口道,這還是他今天第一次開口詢問。
陳家濤從上午看到這位老師,就有點疑惑他真的是研究計算機的麽?
隔著衣服都能感覺到他身上的肌肉塊棱角分明,出去說他是健身教練一點都不為過。
......
所有評委都在發表自己的看法,
場面頓時熱鬧起來,你反駁我我反駁你,大家都說的有理有據的,誰都說服不了誰。 陳家濤反而被忽略,他在台上津津有味的聽著給位大佬的討論,覺得受益匪淺。
陳家濤和評委根本沒察覺到,已經過去一個多小時了。
台下的其他選手有些坐不住了,一開始他們還可以聽懂一些,越往後他們越聽不懂,現場開始出現了一些竊竊私語。
“怎麽還沒完?”
“都一個多小時了!我們還上不上了。”
“嘖嘖,不愧是國預滿分大佬,直接和博雅的大拿聊上了。”
“看這架勢,估計我們沒戲了,特等獎應該就是他的了吧。”
場下出現一點混亂,這才使會長從熱烈討論的狀態醒悟過來。
這可不是在學院開會,是在答辯現場,他咳嗽了兩聲,右手敲了敲桌子,大家一下都停下來。
有幾位老師還有些不滿的看著會長,雖然沒有明說,但眼神裡那意思明顯就是, 我們交流呢,你打斷我們幹嘛!
會長沒理他們,對著陳家濤說道:“同學,你的系統我們已經大概了解了,你可以下午休息了,之後我們可以在比賽結束後在交流。”
那幾位不滿的老師這才反應過來,這是在比賽,自己太入迷,以為是平時系裡開會,頓時羞愧的低下頭。
最後博雅計算機主任提議道:“你可以給你的系統起個名字嘛?”
從陳家濤重生的那一刻起,‘蝴蝶效應’就已經發揮作用了,在陳家濤這個小蝴蝶的煽動下,這一世阿爾法可能不會在出現在美國,名字更不可能叫阿爾法了。
陳家濤覺得自己是該起個名字,可是叫什麽呢的?
陳家濤沉思了一下說道:“就叫做源夢系統吧!來源的源,夢想的夢。”
陳家濤覺得目前的計算機技術都是從夢裡學的,自己也希望這個系統可以達到前世阿爾法的水平,挑戰世界圍棋冠軍,雖然目前距離這個夢想還有很長的路要走。
故名字取了一個‘夢’字
前世的一切對陳家濤也仿若一場夢一樣,前世自己對曹源總是求而不得,這一世一切都不一樣了。
這個系統是陳家濤第一次直接影響前世的事情,阿爾法可能不會再出現,雖然陳家濤自信自己以後還會改變的更多。
取一個‘源’表示對陳家濤對曹源的情深意重,第一次總歸是個紀念。
‘源夢’的諧音剛好是圓夢,陳家濤希望這個系統是,自己圓自己兒時想一名當科學家,奔向宇宙夢想的第一步。