Il y a tout juste deux ans, AlphaGo, l’intelligence artificielle (IA) made in Google remportait la dernière manche d’un tournoi de cinq matchs contre le Sud-Coréen Lee Se-Dol, un des meilleurs joueurs de go au monde. Retour sur un moment historique.

Des débuts prometteurs

L’histoire commence dans les locaux de DeepMind, laboratoire d’innovation en IA basé à Londres et filiale de Google. Pour tester et améliorer le logiciel AlphaGo, Demis Habassis et son équipe proposent à Fan Hui, un Sino-français qui s’avère être champion d’Europe de go, de devenir son adversaire. Il accepte et se lance dans l’aventure, confiant.

AlphaGo gagne. C’est la première fois qu’une IA remporte un match de go face à un joueur professionnel. Bien entendu, la prouesse rappelle celle du match DeepBlue – Kasparov en 1997. Cependant, lorsque l’on sait que les combinaisons possibles au premier coup sont dix fois plus nombreuses au go qu’aux échecs (200 contre 20), l’exploit impressionne.

Lee Se-Dol : un nouveau défi

Forte de ce succès, et avec l’aide consultative de Fan Hui, l’équipe GoogleDeepMind se lance dans l’ascension d’un autre Everest : Lee Se-Dol, joueur Sud-Coréen parmi les meilleurs du monde. Alors que Fan Hui est 2e dan, Lee Se-Dol est 9e dan, le rang le plus haut qui existe.

La confrontation est programmée pour durer cinq jours, avec une manche par jour. Tout le pays encourage son champion : en Corée du Sud, le go fait partie intégrante de la culture, et les Coréens le placent au même rang que la musique, la peinture ou encore la poésie. Savoir jouer au go est un signe d’érudition. Le tournoi s’annonce donc passionnant.

Cinq jours passionnants et un résultat de 4-1, en faveur d’AlphaGo

Les trois premières journées sont éprouvantes pour Lee Se-Dol, car il s’agit de trois défaites. Faisant preuve de fair-play, il salue le travail de l’équipe GoogleDeepMind et présente ses excuses pour son jeu. L’émotion est palpable. Au-delà d’une simple tristesse due à la défaite, une certaine appréhension se fait ressentir : si l’on a réussi à créer une machine capable de surpasser l’un des meilleurs joueurs de go au monde, où se place la barre de l’impossible ? Les IA dépasseront-elles les humains et inverseront-elles la donne ? Les chercheurs s’accordent à dire qu’on en est loin ; Li Fei-Fei, directrice du Laboratoire des AI de Stanford, explique qu’on est plus proche d’un lave-linge intelligent que d’un méchant Terminator aux yeux rouges.

Le quatrième jour, unique défaite d’AlphaGo, est important à la fois pour Lee Se-Dol et pour GoogleDeepMind. Le Sud-Coréen a surpris l’IA qui a vu ses chances de victoire chuter et qui n’a pas été capable de redresser la barre. Cela a redonné confiance au joueur, gommé les peurs des spectateurs, et a permis aux concepteurs, malgré la déception, de récupérer ces informations pour améliorer le logiciel.

Trois composantes essentielles

Mais au fait, comment ça marche ? Thorpe Graepel, un chercheur de l’équipe GoogleDeepMind, explique qu’AlphaGo repose sur trois composantes essentielles : le réseau stratégique, l’arbre de recherches et le réseau de valeurs.

Le premier contient les parties de joueurs humains professionnels et met à disposition d’AlphaGo une base de données concrètes qu’il peut imiter. Le deuxième permet à l’IA d’analyser les différentes variations et d’anticiper les mouvements. Enfin, le réseau de valeurs comptabilise les probabilités pour déterminer le meilleur positionnement possible pour aller vers la victoire.

Cette version du logiciel dépend donc grandement du facteur humain : sans parties et coups à imiter, l’IA ne peut pas faire grand-chose. Mais depuis, le logiciel a bien évolué.

D’AlphaGo à AlphaGo Zero

Depuis la victoire d’AlphaGo sur Lee Se-Dol, le logiciel a bien évolué. Cette première version, baptisée AlphaGo Lee en honneur au joueur, a été remaniée pour lui permettre, en mai 2017, de gagner contre le numéro 1 mondial, un Chinois de 20 ans nommé Ke Jie.

Cette deuxième version, appelée AlphaGo Master, a elle aussi été améliorée pour donner naissance à AlphaGo Zero. Mais qu’est-ce qui a changé ? La grosse différence, c’est qu’en dehors des règles du jeu, aucun autre apport humain n’a été ajouté. Aucune partie jouée par des humains, aucun coup célèbre. Le logiciel a appris, seul, à maîtriser le go. En trois heures, il avait appris les bases du go. En trois jours, il battait AlphaGo Lee à plates coutures, par 100 à 0. En 40 jours, il l’emportait aussi sur AlphaGo Master (la version du match contre Ke Jie) par 89 à 11. Il ne reste plus qu’à attendre la prochaine étape.  

Sources :

http://www.lemonde.fr/pixels/article/2016/01/27/fan-hui-champion-europeen-de-go-je-suis-le-premier-joueur-pro-a-perdre-contre-une-machine_4854891_4408996.html

http://www.lemonde.fr/pixels/article/2017/05/23/comment-alphago-a-transforme-l-intelligence-artificielle-et-le-jeu-de-go_5132473_4408996.html

http://www.lemonde.fr/pixels/article/2017/10/18/intelligence-artificielle-toujours-plus-puissant-alphago-apprend-desormais-sans-donnees-humaines_5202931_4408996.html

https://www.huffingtonpost.fr/2017/10/18/en-3-jours-lintelligence-artificielle-de-google-a-appris-le-jeu-de-go-et-ecrase-la-machine-qui-a-detrone-lhomme_a_23247579/

https://www.numerama.com/tech/299070-alphago-devient-autodidacte-lia-na-plus-besoin-de-lhomme-pour-progresser-au-go.html

https://www.lesechos.fr/19/10/2017/lesechos.fr/030744604725_intelligence-artificielle---alphago-battu-par----alphago.htm#

http://www.businessinsider.fr/demis-hassabis-jeu-casse-briques-intelligence-artificielle-alphago

Documentaire AlphaGo, disponible sur Netflix US depuis le 29 septembre 2017, sur Netflix France depuis le 2 janvier 2018.

alphago