九九在线精品视频播放_明知AlphaGo變得無(wú)法戰勝，柯潔為何還迎難而上？_手機報

柯潔與AlphaGo對弈

　　柯潔輸了，在與AlphaGo的第一場(chǎng)對決中，以四分之一子的落后惜敗。

　　這個(gè)結果在很多人意料之中，其中也包括柯潔。

　　第一場(chǎng)賽后發(fā)布會(huì )上，柯潔直言AI的進(jìn)步速度太快了，并且每一次都是巨大的進(jìn)步。這也是為什么他在大賽前夕發(fā)布微博稱(chēng)，此次將是他與人工智能的最后三盤(pán)對決。

　　柯潔心中已經(jīng)清晰的知道，人類(lèi)已經(jīng)無(wú)法戰勝AlphaGo。他形容AlphaGo越來(lái)越像“圍棋上帝”，想贏(yíng)它只能去找一些BUG，但目前，他還沒(méi)看到AlphaGo的任何弱點(diǎn)。

　　這里引用搜狗CEO王小川在知乎上發(fā)布的內容，再向大家科普一下AlphaGo。

　　去年的AlphaGo 混合了三種算法，即蒙特卡洛樹(shù)搜索+監督學(xué)習+增強學(xué)習。

　　其中蒙特卡洛樹(shù)搜索是一種優(yōu)化過(guò)的暴力計算；監督學(xué)習，是通過(guò)學(xué)習3000萬(wàn)部人類(lèi)棋譜，對六段以上職業(yè)棋手走棋規律進(jìn)行模仿，也是AlphaGo獲得突破性進(jìn)展的關(guān)鍵算法；而增強學(xué)習作為輔助，是兩臺AlphaGo從自我對戰中學(xué)習如何下棋。

　　每當獲取棋局信息時(shí)，AlphaGo 會(huì )根據策略網(wǎng)絡(luò )探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性，進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結束時(shí)，模擬過(guò)程中被系統最頻繁考察的位置將成為AlphaGo 的最終選擇。

　　簡(jiǎn)單來(lái)說(shuō)，AlphaGo下棋依靠的是概率，而概率的得出則依靠前期學(xué)習。而這次與柯潔對戰的AlphaGo相較于去年，已經(jīng)判若兩人。

　　最初的AlphaGo主要依靠監督學(xué)習，即學(xué)習對象幾乎全部來(lái)自人類(lèi)棋手，而新版的AlphaGo則強化了增強學(xué)習，主要對機器自我對弈產(chǎn)生的棋局進(jìn)行學(xué)習。

　　難怪柯潔會(huì )覺(jué)得，去年AlphaGo的下法還很接近人類(lèi)，但今年自己對戰時(shí)，AlphaGo已變得更加不合乎“常理”，下了很多人類(lèi)棋手不可能下的棋子。

　　第一局結果

　　DeepMind創(chuàng )始人、AlphaGo之父Demis Hassabis證實(shí)了這一點(diǎn)，他說(shuō)與柯潔對戰的AlphaGo更多的是根據自身學(xué)習，對人類(lèi)數據的依賴(lài)性越來(lái)越小。

　　除了開(kāi)始脫離人類(lèi)數據，更讓人類(lèi)望塵莫及的是其恐怖的進(jìn)步速度。我們常說(shuō)要“取長(cháng)補短”，AlphaGo則可以把這個(gè)過(guò)程加快成百上千倍。

　　取長(cháng)方面暫不多說(shuō)，AlphaGo的研發(fā)團隊一直在找它的缺口。去年輸給李世石之后，他們回去馬上改善了AlphaGo的知識缺口，并且投入更多精力去改進(jìn)算法，讓AlphaGo變得更強。

　　這次的AlphaGo在算法上就強大了很多。去年，AlphaGo還是通過(guò)分布式的計算機來(lái)運作，而今年只用了一個(gè)單一的機器。所以，柯潔非但沒(méi)有讓AlphaGo的CPU因為飛速運轉而發(fā)熱，相反，今天的AlphaGo的計算能力比去年要小10倍。

　　從比賽用時(shí)上來(lái)看，柯潔幾乎是AlphaGo的兩倍。雙方第一場(chǎng)比賽共耗時(shí)4小時(shí)17分37秒，其中柯潔用時(shí)2小時(shí)46分43秒，AlphaGo用時(shí)1小時(shí)30分54秒。

　　學(xué)的又多又快，人類(lèi)棋手確實(shí)很難看到勝算。柯潔也看到了這一點(diǎn)，但他為什么還要應戰。

　　這也是普通網(wǎng)友最關(guān)心的問(wèn)題了，柯潔的輸贏(yíng)到底是否需要將其上升到“人類(lèi)尊嚴”這種高度？答案肯定是不能。

　　圍棋如同所有競技賽事一樣，柯潔也是專(zhuān)業(yè)的運動(dòng)員。對于運動(dòng)員來(lái)說(shuō)，勝敗乃兵家常事，面對實(shí)力懸殊很大的對手，任何人都很難取勝。

　　現在柯潔面對的就是這樣一個(gè)對手。所以對于比賽接下來(lái)的關(guān)注點(diǎn)不該是柯潔能否勝一局，而是AlphaGo所代表AI技術(shù)將為人類(lèi)帶來(lái)什么。

　　目前來(lái)看，AlphaGo已經(jīng)顛覆了傳統的圍棋。柯潔在比賽中也嘗試了一些“非常規”下法，他認為AlphaGo已經(jīng)改變了自己很多最初的看法，現在覺(jué)得比賽中沒(méi)有什么棋是不能下的。

　　Demis Hassabis在賽前的致辭中說(shuō)道，圍棋的樣式變化繁多，可能再過(guò)一萬(wàn)年，人類(lèi)也無(wú)法窮盡圍棋的打法。

　　而AlphaGo可以作為一個(gè)工具，通過(guò)它去幫助人類(lèi)對于圍棋的理解，讓偉大的棋手去發(fā)現圍棋更多的奧妙。

　　這確實(shí)是一種很奇妙的感覺(jué)。當你認為一件幾乎是唯一的事情，突然有了另外一種可能，這就像哥倫布發(fā)現新大陸后，給未來(lái)開(kāi)啟了一扇新的大門(mén)。

　　柯潔說(shuō)活到現在，最大的榮幸是和AlphaGo進(jìn)行了對戰，很感謝能有這樣的對手。他從AlphaGo身上獲得了很多比賽的快樂(lè )，這種快樂(lè )來(lái)自于競技，而非結果。

　　比賽結束以后，柯潔更希望把AlphaGo當做幫助自己提升棋藝的工具。在人與機器之間，他選擇跟人類(lèi)下棋，他笑著(zhù)說(shuō)，“我跟人類(lèi)比賽的勝率還是可以的。”

国产日韩在线播放,欧美日韩中文字幕在线,大蕉香蕉国产在线视频,丝袜情趣在线资源二区

明知AlphaGo變得無(wú)法戰勝，柯潔為何還迎難而上？

網(wǎng)友

網(wǎng)友

相關(guān)服務(wù)

友情鏈接