Svetovni prvak Lee Sedol je moral priznati premoč programu AlphaGo, ki se je takorekoč sam priučil izjemno obsežne in zahtevne igre go. Foto: Reuters
Svetovni prvak Lee Sedol je moral priznati premoč programu AlphaGo, ki se je takorekoč sam priučil izjemno obsežne in zahtevne igre go. Foto: Reuters
GO
Strokovnjaki so do zdaj ocenjevali, da bi lahko računalnik go izmojstril šele v desetih letih od zdaj. Na fotografiji igralna površina s "kamenčki". Foto: Goban1

Včasih smo utrujeni, včasih smo pod pritiskom želje po zmagi. Program pa ni tak. Zelo je močan in stabilen, kot zid.

Fan Hui, Nature
šahovnica
Pri šahu je možnih kombinacij manj, zato je metoda surove računske sile uporabnejša kot pri igri go. Foto: BoBo
nevron, možgani
Možgani so za človeške potrebe izjemno prilagodljiv in učinkovit aparat procesiranja informacij, njihove hrambe in sprejemanja odločitev. Računalnik, ki bi jih lahko prekašal po vsej plejadi opravil, najbrž še zelo dolgo ne bo obstajal. Foto: freedigitalphotos.net
SYNAPSE
Se pa proizvajalci strojne opreme, denimo IBM, trudijo ustvariti čipe, ki delovanje možganov posnemajo. Za zdaj jim uspeva, a v majhnem obsegu. Čip Truenorth ima v sebi nekaj tisoč "kvazinevronov", v možganih pa jih je v povprečju od 80 do 90 milijard. Foto: IBM
AlphaGo premagal človeka

Digitalni program in človek sta se pred očmi zainteresiranega sveta soočila v hotelu sredi prestolnice Južne Koreje, Seulu. Ker je AlphaGo dobil tudi tretji dvoboj od predvidenih petih, je že osvojil nagrado Google DeepMind v višini milijona dolarjev.

Program AlphaGo ima podporo osebja podjetja Google DeepMind in računsko moč Googlove infrastrukture za oblačne storitve, prvak v igri go Lee Sedol pa najbrž čez 90 milijard nevronov v možganih. Oboje je bilo v dvoboju temeljito na preizkušnji, saj sta svoje zmogljivosti uporabljala pri izzivu, kjer je možnih več kot 10170 različnih iger - več kot pri šahu in več, kot naj bi bilo atomov v vidnem vesolju.
Zmaga AlphaGo je eden večjih prebojev v zgodovini razvoja umetne inteligence (UI), saj deluje po nekaterih principih, ki so bili do zdaj v skoraj izključni domeni živih bitij.

Osnove igre go
(delo Go zveze Slovenije)

Ena zadnjih "trdnjav"
Večina drugih miselnih iger je že padla. Križce in krožce so "zlomili" že v drugi polovici prejšnjega stoletja in zdaj popolne igre na njih izvajajo celo DNK-računalniki. IBM-ova Globoka modrina (Deep Blue) je šahovskega prvaka Garija Kasparova ugnala pred skoraj 20 leti, Watson istega podjetja pa v znanem kvizu Jeopardy. Dama je padla še prej. Primerov je preveč za naštevanje. Go, tisočletja stara azijska igra izjemne kompleksnosti in globine, pa je bila do zdaj ena zadnjih trdnjav, kjer računalnik še ni bil uspešen. Največji poznavalci tako na področju računalništva kot same igre so sicer domnevali, da se bo to nekoč zgodilo, toda nikakor ne prej kot v kakšnem desetletju.
Go je namreč igra, kjer zaradi ogromne količine različnih možnosti veliko pomenita intuicija in psihologija. Kot so, denimo, zapisali pri Go zvezi Slovenije: "Kljub preprostosti osnovnih pravil - vsak otrok se je sposoben naučiti osnov goja v eni uri - lahko igra postane tudi zelo zapletena in prav neizmerne možnosti različnih razpletov so tiste, ki dajejo goju čar še po štirih tisočletjih."
Računalnik za zdaj premočan
Toda računalnik je - presenetljivo - napredoval precej hitreje. Lee in AlphaGo sta v sredo in četrtek odigrala dve igri od načrtovanih petih in obe je dobil digitalnež, so sporočili iz Googla, lastnika DeepMinda od leta 2014. Z zmago v tretji rundi je program postal uradni zmagovalec, ne glede na izid naslednjih v nedeljo in torek.
Lee Sedol je bil pred soočenjem prepričan, da bo sam odnesel milijonsko nagrado z rezultatom kar pet proti nič. Toda že po prvem krogu, ki ga je bil prisiljen predati, presenečenja ni skrival, po drugem pa je ostal "brez besed", je poročal britanski BBC. Kot eden najboljših igralcev goja vseh časov je ugotovil, da je program izpeljal "skoraj popolno igro".
Lee je kot eno izmed težav, s katerimi se je spoprijel, izpostavil tudi pomanjkanje fizične prisotnosti nasprotnika, saj si ni mogel pomagati s psihologijo, pogledi in telesno govorico, ki izkušenim očem lahko razkrije marsikaj (ali celo namenoma vara).
Demis Hassabis, soustanovitelj DeepMinda, je na Twitterju dosežek primerjal s pristankom na Mesecu.
To sicer ni bila prva zmaga računalnika nad homo sapiensom v tej igri. DeepMindov skupek kode je že konec lanskega leta premagal evropskega prvaka Fana Huija, kar so iz podjetja skupaj z znanstvenim pojasnilom, kako koda deluje, javno razglasili januarja letos. Toda Hui je uvrščen več kakovostnih razredov (danov) nižje kot Lee. Prvega profesionalca je pred leti ugnal program Crazy Stone, ampak človek je začel s hendikepom (zaostankom), za raznovrstne neznalce ali začetnike pa so bili že zdavnaj preveč tudi desetletja stari simulatorji UI-ja.
Kaj umetna inteligenca počne
Go se igra na kvadratni plošči 19 krat 19 (šah jih ima osem krat osem polj). Na površino nasprotnika uvrščata svoje kamenčke, vsak v svoji barvi, s čimer osvajata teren, s tem pa točke; ali pa z obkrožanjem drug drugemu odstranjujeta koščke. Iz poteze v potezo količina možnosti skokovito narašča, tako hitro, da gola računska moč ne zadostuje za določitev najboljše poti. Na neki točki bi jih bilo toliko, da bi še tako močan skupek procesorjev začel računati v nedogled.
Tudi pri šahu je tako, a tam se partije navadno končajo po okoli 40 potezah. Šahovski DeepBlue se je zato lahko večinoma zanašal na statistično iskanje najboljših potez s pomočjo procesorske surove moči (a ne le zgolj na to).
Poleg tega so modreževo programje do zadnje črke napisali programerji ob budnem očesu šahovskih strokovnjakov. Sami so poskušali predvideti čim več mogočih situacij in izpiliti ravnanje v njih.
Po drugi strani najboljše možnosti AlphaGo spočetka išče sam. Je simulacija nevronskih omrežij v možganih, ki delujejo s pomočjo vzpostavljanja medsebojnih povezav. Pravzaprav je le za ščepec prirejena izvedenka DeepMindove osnovne kode, ki se je sposobna učiti v katerem koli okolju, potrebuje le osnovna pravila in točkovnik, nato trike in taktike pili sama. Do zdaj je izmojstrila številne računalniške igre, resda jih večina izhaja iz preprostih konzol prejšnjega stoletja, a pri marsikateri ji je že uspelo v kozji rog ugnati najboljše človeške ljubitelje.

Igre go se je naučila tako, da je - opremljena s pravili in nekaj osnovnimi programskimi usmeritvami - najprej preučila 30 milijonov položajev iz dostopnih spletnih dvobojev. Nato je v 50 za mišjo dlako različnih izvedenkah na prav toliko različnih napravah igrala sama proti sebi.
AlphaGo je tako počasi spoznaval, katere možnosti so na določeni točki in v določenem kontekstu boljše; katere so večkrat pripeljale do končne zmage. Neutrudno. Človek je na dan zmožen opraviti le omejeno število iger, medtem ko je program lahko izkušnje nabiral neprestano, dan in noč. In tudi surova moč ni kar za odmet - Google je zanj priskrbel zadosten del svoje zmogljive infrastrukture za oblačne storitve, kar je delovanje pohitrilo.
In kot kaže dogajanje v Seulu, se je tudi od zmage nad Evropejcem učinkovito uril. Uspel je izmojstriti odločanje v negotovih okoliščinah, kjer ni niti približno dovolj informacij za učinkovito odločanje. Podobno temu, s čimer se navadno soočajo poveljniki v vojnah.
UI še vedno v zibelki
Dejstvo, da je še tretja zmaga prinesla ogromen preboj v razvoju, še ne pomeni, da je umetna inteligenca prišla iz razvojne zibelke, ali pa da je človeštvo kjer koli blizu simulacije delovanja možganov.
AlphaGo je izid izjemnega napora ene največjih družb na svetu, ki je prinesel "zgolj" rešitev za eno samo, točno določeno situacijo. Ljudsko pamet prekaša na zelo omejenem področju. Spoznanj ni sposoben prenesti drugam po sistemu analogij - pri tem se možgani zelo dobro obnesejo - kakor tudi žepni kalkulator ni zares uporaben drugje kot v računstvu in geometriji.
Obenem je res, da se DeepMind precej razlikuje od dozdajšnjih poskusov po tem, da se z zelo široko zmožnostjo učenja lahko uri in preizkuša v zelo različnih okoljih (npr. Deep Blue je vekomaj priklenjen na šah). DeepMind je že napovedal uporabo v britanskem zdravstvu, pa tudi v trirasežni streljanki Doom. Pri tem ostaja presenetljivo, da se v nekaterih izjemno enostavnih okoljih, denimo stari igri Pac-Man, enostavno ni znašel.
Res je tudi, da so človeški možgani prav tako rešitev za situacijo, le biološkega izvora. So prikrojen mehanizem za reševanje problemov, s katerimi se soočamo ljudje, mehanizem, ki ga je skozi milijarde let razvoja življenja in v milijonih let razvoja človeške vrste izdelala (in ga še dopolnjuje) narava.
Kaj določa človeka in zavest
Številne veje znanosti že dolgo grizejo v vprašanje, ali je zavest nekaj, kar nastane v možganih iz živčnih signalov in kemičnih reakcij; ali pa je več kot le vsota sestavnih delov.
AlphaGo se v tem sotvarju zagotovo ne da enačiti z zavestjo, kaj šele s kakršno koli grozečo umetno inteligenco, pred katero strašijo veliki umi (Stephen Hawking in drugi). A ker temelji prav na osnovnem principu delovanja možganov, utegne biti prva lastovka. Pomladi sama ni prinesla, je pa morebiti njen kasnejši prihod naznanila. Morda bomo prav s simulacijami možganov, naj bo na programski način (DeepMind, Human Brain Project) ali pa celo strojniški (TrueNorth), naposled izvedeli, kaj zavest sploh je.

















Včasih smo utrujeni, včasih smo pod pritiskom želje po zmagi. Program pa ni tak. Zelo je močan in stabilen, kot zid.

Fan Hui, Nature
AlphaGo premagal človeka