NAUKA I TEHNOLOGIJA

AlphaZero: Šahovski program koji predstavlja revoluciju u mašinskom učenju

Velemajstori nikada nisu videli nešto takvo. AlphaZero posedovao je finese virtuoza i moć mašine
Piše: Stiven Strogac / The New York Times International Report
Datum: 01/03/2019

AlphaZero: Šahovski program koji predstavlja revoluciju u mašinskom učenju

Gari Kasparov, levo, igra 1997. protiv kompjutera DeepBlue. Kasparov je dobio u prvoj igri, ali je izgubio meč

Istraživači iz kompanije DeepMind – u vlasništvu kompanije Alphabet – koja se bavi veštačkom inteligencijom, u decembru su saopštili velike novosti iz sveta šaha.

Godinu dana ranije ovaj tim je najavio AlphaZero, algoritam koji prati šah i Go. Algoritam je počeo da radi bez ikakvih podataka o igrama osim osnovnih pravila. Zatim je protiv sebe odigrao više miliona partija i učio na svojim greškama. Za nekoliko sati, taj algoritam je postao najbolji igrač kojeg je svet ikada video. Dostignuća AlphaZero-a sada izučavaju stručnjaci iz branše, a rezultati su predstavljeni javnosti u decembru.

Program IBM-a Deep Blue 1997. godine pobedio je svetskog šampiona u šahu Garija Kasparova. DeepBlue je mogao da proceni 200 miliona pozicija po sekundi. Nije, međutim, mogao da misli kao Kasparov. Odigrali su šest igara, a u prvoj igri meča, DeepBlue je pohlepno prihvatio Kasparovo žrtvovanje topa za lovca, ali je izgubio 16 poteza kasnije.

Aktuelna generacija šahovskih programa i dalje igra u ovom neljudskom stilu. Ove šahovske "mašine" ne poseduju istinsko razumevanje igre. Njih je neophodno naučiti osnovnim principima šaha, a ti principi, koji se rafinišu decenijama iskustva, programirani su u mašine. AlphaZero je, međutim, otkrio osnovna pravila igre sam. Zgazio je Stockfish, prethodnog kompjuterskog šampiona u šahu. U meču od 100 igara, AlphaZero zabeležio je 28 pobeda i 72 puta nerešeno. Izgledalo je kao da igra intuitivno. AlphaZero je rizikovao.

Dok je izvodio napad u desetoj igri, AlphaZero je povukao kraljicu u ćošak table, daleko od Stockfishovog kralja, na mesto gde se kraljica u napadu inače ne stavlja.

Ipak, ovo čudnovato povlačenje bilo je otrovno: kako god da Stockfish odgovori, već je gotovo. Bilo je to kao da AlphaZero čeka da Stockfish shvati, nakon milijardi kalkulacija, u koliko se beznadežnoj poziciji nalazi, pa da zver može da se opusti i mirno zada poslednji udarac.

Velemajstori nikada nisu videli nešto takvo. AlphaZero posedovao je finese virtuoza i moć mašine.

Bio je to prvi susret čovečanstva sa novom vrstom inteligencije. Pitanje koje se postavlja sada jeste može li mašinsko učenje da odgovori na nerešena pitanja nauke i medicine.

Prošlog avgusta, dva članka u listu Nature Medicine istraživala su kako bi mašinsko učenje moglo da se primeni na polju dijagnostike.

U prvom tekstu, istraživači iz DeepMind-a udružili su se sa kliničarima jedne londonske bolnice kako bi razvili algoritam koji će klasifikovati širok dijapazon bolesti mrežnjače. (U oftalmologiji postoji ozbiljan nedostatak stručnjaka koji će tumačiti milione dijagnostičkih snimaka oka koji su urađeni protekle godine; veštački inteligentni asistenti bili bi od neizmerne pomoći.)

Drugi članak bavio se algoritmom koji određuje da li snimak sa skenera pacijenta pokazuje znake moždanog udara ili drugog neurološkog stanja koje je kritično. Za one koji dožive moždani udar, svaki minut je od neprocenjive važnosti; što se duže odlaže lečenje, to je gori ishod. Novi algoritam označio je hitne slučajeve sa istom preciznošću sa kojom bi to učinio i lekar, samo 150 puta brže.

Sa druge strane, ono što frustrira kada je reč o mašinskom učenju jeste činjenica da ne znamo zašto algoritmi rade, što znači da ne znamo ni da li im možemo verovati. AlphaZero deluje kao da je otkrio važne principe igre, ali ne može da ih podeli. Kao ljudska bića, želimo više od odgovora. Potreban nam je uvid. To će biti izvor tenzije u našim interakcijama sa kompjuterima odsad.

Zamislite dan kada će AlphaZero evoluirati u algoritam koji može da reši ozbiljne probleme; nazovimo ga AlphaInfinity. Pretpostavite da postoje dublji obrasci koji čekaju da budu otkriveni – način na koji se regulišu geni ili razvija rak; nastanak imunološkog sistema; ples subatomskih čestica. Kada bi AlphaInfinity mogao da ih identifikuje i razume, on bi za nas bio poput proroka. Ne bismo razumeli zašto je prorok uvek u pravu, ali bismo mogli da proverimo njegove proračune i predviđanja naspram eksperimenata i zapažanja, i potvrdimo njegova otkrića.

Nauka bi našu ulogu svela na posmatračku, da se čudimo i budemo zbunjeni. Možda nam konačno nedostatak uvida u stvari više ne bi toliko smetao. AlphaInfinity bi, naposletku, mogao da reši sve naše naučne probleme.

Nije nam loše išlo bez ikakvog uvida prvih 300.000 godina našeg postojanja kao Homo sapiensa. I neće nas mučiti zaboravnost: sećaćemo se s ponosom zlatnog doba ljudskog uvida, nekoliko hiljada godina dugačkog prekida između prošlosti koju nismo mogli da razumemo i nerazumljive budućnosti.

© 2019 The New York Times


Ukupno komentara: 0



Sva polja su obavezna.