国产日韩在线播放,欧美日韩中文字幕在线,大蕉香蕉国产在线视频,丝袜情趣在线资源二区

明知AlphaGo變得無(wú)法戰勝,柯潔為何還迎難而上?

圍棋如同所有競技賽事一樣,柯潔也是專(zhuān)業(yè)的運動(dòng)員。對于運動(dòng)員來(lái)說(shuō),勝敗乃兵家常事,面對實(shí)力懸殊很大的對手,任何人都很難取勝。現在柯潔面對的就是這樣一個(gè)對手。
明知AlphaGo變得無(wú)法戰勝,柯潔為何還迎難而上?
柯潔與AlphaGo對弈

   柯潔輸了,在與AlphaGo的第一場(chǎng)對決中,以四分之一子的落后惜敗。

  這個(gè)結果在很多人意料之中,其中也包括柯潔。

  第一場(chǎng)賽后發(fā)布會(huì )上,柯潔直言AI的進(jìn)步速度太快了,并且每一次都是巨大的進(jìn)步。這也是為什么他在大賽前夕發(fā)布微博稱(chēng),此次將是他與人工智能的最后三盤(pán)對決。

  柯潔心中已經(jīng)清晰的知道,人類(lèi)已經(jīng)無(wú)法戰勝AlphaGo。他形容AlphaGo越來(lái)越像“圍棋上帝”,想贏(yíng)它只能去找一些BUG,但目前,他還沒(méi)看到AlphaGo的任何弱點(diǎn)。

  這里引用搜狗CEO王小川在知乎上發(fā)布的內容,再向大家科普一下AlphaGo。

  去年的AlphaGo 混合了三種算法,即蒙特卡洛樹(shù)搜索+監督學(xué)習+增強學(xué)習。

  其中蒙特卡洛樹(shù)搜索是一種優(yōu)化過(guò)的暴力計算;監督學(xué)習,是通過(guò)學(xué)習3000萬(wàn)部人類(lèi)棋譜,對六段以上職業(yè)棋手走棋規律進(jìn)行模仿,也是AlphaGo獲得突破性進(jìn)展的關(guān)鍵算法;而增強學(xué)習作為輔助,是兩臺AlphaGo從自我對戰中學(xué)習如何下棋。

  每當獲取棋局信息時(shí),AlphaGo 會(huì )根據策略網(wǎng)絡(luò )探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結束時(shí),模擬過(guò)程中被系統最頻繁考察的位置將成為AlphaGo 的最終選擇。

  簡(jiǎn)單來(lái)說(shuō),AlphaGo下棋依靠的是概率,而概率的得出則依靠前期學(xué)習。而這次與柯潔對戰的AlphaGo相較于去年,已經(jīng)判若兩人。

  最初的AlphaGo主要依靠監督學(xué)習,即學(xué)習對象幾乎全部來(lái)自人類(lèi)棋手,而新版的AlphaGo則強化了增強學(xué)習,主要對機器自我對弈產(chǎn)生的棋局進(jìn)行學(xué)習。

  難怪柯潔會(huì )覺(jué)得,去年AlphaGo的下法還很接近人類(lèi),但今年自己對戰時(shí),AlphaGo已變得更加不合乎“常理”,下了很多人類(lèi)棋手不可能下的棋子。

柯潔與AlphaGo對弈
  第一局結果

  DeepMind創(chuàng )始人、AlphaGo之父Demis Hassabis證實(shí)了這一點(diǎn),他說(shuō)與柯潔對戰的AlphaGo更多的是根據自身學(xué)習,對人類(lèi)數據的依賴(lài)性越來(lái)越小。

  除了開(kāi)始脫離人類(lèi)數據,更讓人類(lèi)望塵莫及的是其恐怖的進(jìn)步速度。我們常說(shuō)要“取長(cháng)補短”,AlphaGo則可以把這個(gè)過(guò)程加快成百上千倍。

  取長(cháng)方面暫不多說(shuō),AlphaGo的研發(fā)團隊一直在找它的缺口。去年輸給李世石之后,他們回去馬上改善了AlphaGo的知識缺口,并且投入更多精力去改進(jìn)算法,讓AlphaGo變得更強。

  這次的AlphaGo在算法上就強大了很多。去年,AlphaGo還是通過(guò)分布式的計算機來(lái)運作,而今年只用了一個(gè)單一的機器。所以,柯潔非但沒(méi)有讓AlphaGo的CPU因為飛速運轉而發(fā)熱,相反,今天的AlphaGo的計算能力比去年要小10倍。

  從比賽用時(shí)上來(lái)看,柯潔幾乎是AlphaGo的兩倍。雙方第一場(chǎng)比賽共耗時(shí)4小時(shí)17分37秒,其中柯潔用時(shí)2小時(shí)46分43秒,AlphaGo用時(shí)1小時(shí)30分54秒。

  學(xué)的又多又快,人類(lèi)棋手確實(shí)很難看到勝算。柯潔也看到了這一點(diǎn),但他為什么還要應戰。

  這也是普通網(wǎng)友最關(guān)心的問(wèn)題了,柯潔的輸贏(yíng)到底是否需要將其上升到“人類(lèi)尊嚴”這種高度?答案肯定是不能。

  圍棋如同所有競技賽事一樣,柯潔也是專(zhuān)業(yè)的運動(dòng)員。對于運動(dòng)員來(lái)說(shuō),勝敗乃兵家常事,面對實(shí)力懸殊很大的對手,任何人都很難取勝。

  現在柯潔面對的就是這樣一個(gè)對手。所以對于比賽接下來(lái)的關(guān)注點(diǎn)不該是柯潔能否勝一局,而是AlphaGo所代表AI技術(shù)將為人類(lèi)帶來(lái)什么。

  目前來(lái)看,AlphaGo已經(jīng)顛覆了傳統的圍棋。柯潔在比賽中也嘗試了一些“非常規”下法,他認為AlphaGo已經(jīng)改變了自己很多最初的看法,現在覺(jué)得比賽中沒(méi)有什么棋是不能下的。

  Demis Hassabis在賽前的致辭中說(shuō)道,圍棋的樣式變化繁多,可能再過(guò)一萬(wàn)年,人類(lèi)也無(wú)法窮盡圍棋的打法。

  而AlphaGo可以作為一個(gè)工具,通過(guò)它去幫助人類(lèi)對于圍棋的理解,讓偉大的棋手去發(fā)現圍棋更多的奧妙。

  這確實(shí)是一種很奇妙的感覺(jué)。當你認為一件幾乎是唯一的事情,突然有了另外一種可能,這就像哥倫布發(fā)現新大陸后,給未來(lái)開(kāi)啟了一扇新的大門(mén)。

  柯潔說(shuō)活到現在,最大的榮幸是和AlphaGo進(jìn)行了對戰,很感謝能有這樣的對手。他從AlphaGo身上獲得了很多比賽的快樂(lè ),這種快樂(lè )來(lái)自于競技,而非結果。

  比賽結束以后,柯潔更希望把AlphaGo當做幫助自己提升棋藝的工具。在人與機器之間,他選擇跟人類(lèi)下棋,他笑著(zhù)說(shuō),“我跟人類(lèi)比賽的勝率還是可以的。”
讀者們,如果你或你的朋友想被手機報報道,請狠戳這里尋求報道
相關(guān)文章
熱門(mén)話(huà)題
推薦作者
熱門(mén)文章
熱門(mén)評論