Google-algoritme knækker på tre dage koden til brætspil, det har taget mennesker 2.500 år at udvikle

I hvad der kaldes for et gennembrud for kunstig intelligens, har Google-algoritmen AlphaGo Zero lært sig selv at spille det ældgamle kinesiske brætspil Go uden menneskelig hjælp. Holdet bag håber, at opfindelsen vil bidrage til ny viden.

Selv verdens bedste ’Go’-spiller måtte give op over for Googles supercomputer, der nu er blevet endnu ’smartere’. Foto: Ed Jones Fold sammen
Læs mere
Lyt til artiklen

Vil du lytte videre?

Få et Digital Plus-abonnement og lyt videre med det samme.

Skift abonnement

Med Digital Plus kan du lytte til artikler. Du får adgang med det samme.

Det tog kun algoritmen AlphaGo Zero tre dage at mestre det kinesiske brætspil Go og opfinde strategier langt overlegne dem, som mennesker har brugt godt 2.500 år på at udvikle.

Spillet Go er så komplekst, at program­mører for få år siden regnede med, at det ville tage omkring ti år, før en computer ville kunne slå et menneske. De forudsigelser blev gjort til skamme sidste år, da en tidligere udgave af algoritmen slog den sydkoreanske mester i Go.

Det er Googles underafdeling for kunstig intelligens, DeepMind, der står bag algoritmen. Den første udgave analyserede data fra tusindvis af spil med dygtige menneskelige Go-spillere. Det har AlphaGo Zero ikke brug for. I stedet er den blevet fodret med spillets regler, hvorefter den har spillet mod sig selv flere millioner gange.

Efter tre dage testede DeepMind den nye udgave imod den gamle, der har slået adskillige menneskelige mestre. Den nye udgave vandt 100 ud af 100 spil.

»Det er et meget naturligt næste skridt, og derfor er jeg ikke overrasket over, at de nu har opnået disse resultater,« siger Ole Winther, professor ved institut for Matematik og Computer Science på Danmarks Tekniske Universitet.

Han fortæller, at resultatet alligevel er opsigtsvækkende, fordi den nye algoritme, der kan starte fra bunden, faktisk er simplere end den gamle og kræver mindre computerkraft. Det kan gøre teknologien interessant og anvendelig i et hav af andre sammenhænge:

»Hvis vores selvkørende bil kan udføre 1.000 ekstra beregninger, vil det svare til, at tiden går meget langsommere for den. Når mennesker opfatter trafikken som hurtig, vil det gå i slowmotion for computeren, og det vil give den ekstra mulighed for bedre at undgå uheld og navigere.«

Computerspil er næste skridt

I årevis har programmører verden over været optagede af at designe robotter, der kan konkurrere med og vinde over mennesker. I 1997 var det en verdensnyhed, da skakcomputeren Deep Blue besejrede Garry Kasparov. Siden har computere givet mennesker kamp til stregen i mere komplekse spil som Poker og Go.

»Spil er interessante, fordi de repræsenterer simplificerede udgaver af problemer i den virkelige verden. Algoritmerne anvender observationer fra spillet som udgangspunkt for deres handlinger, og senere finder de så ud af, om de var gode eller dårlige. På den måde lærer de af deres handlinger,« fortæller Niels Justesen, ph.d.-studerende ved IT-Universitetet.

Det næste skridt i udviklingen er computerspil, der med tredimensionel grafik og millioner af mulige udfald langt overgår brætspil i kompleksitet.

Med sin vejleder Sebastian Risi er Niels Justesen ved at udvikle en algoritme, der skal lære at slå menneskelige modstandere i det populære computerspil StarCraft.

»Der er så mange forskelligartede problemer i spillet, og samtidig er der meget uvis information. Vi ved ikke, hvor modstanderen er, og vi ved ikke, hvad han har gang i. At træffe valg i et delvist kendt miljø er meget udfordrende,« forklarer han.

Foruden Niels Justesen forsøger både Googles DeepMind og Facebook at udvikle kunstig intelligens, der kan slå mennesker i StarCraft.

Bliver vi overflødige?

At en kunstig intelligens kan vinde over mennesker i et spil er interessant. Rigtigt spændende bliver det dog, når den samme viden kan overføres til virkeligheden. AlphaGo Zero-algoritmen bruges til at undersøge protein­folder, og en anden af DeepMinds algoritmer har reduceret Googles elregning for køling af datacentre med 40 procent gennem effektiviseringer af energiforbrug.

Ifølge Ole Winther fra DTU er udviklingen uundgåelig. Derfor opfordrer han til, at vi bekymrer os knap så meget om faren for de ukontrollerbare dræberrobotter, som vi kender fra science fiction-film.

I stedet bør vi forholde os til virkelige problemstillinger, som hvem der skal betale for genuddannelsen af de mennesker, hvis job bliver erstattet af robotter.

»Det er meget uforudsigeligt, hvor automatiseringen vil ramme. Det kan også ske for højtuddannede. Tag eksempelvis jurister, der pløjer sig igennem dokumenter til tusind kroner i timen – der kan man også forestille sig, at man kunne anvende nogle af de samme algoritmer til at finde de relevante mønstre,« siger han.