Qu’est-ce qui différencie fondamentalement une IA de l’intelligence humaine ? Sait-elle faire autre chose de gros calculs ? Quels sont les indices qui nous montrent que les IA sont en train de nous dépasser ?

C’est en 1997 que, pour la première fois, une machine a battu l’intelligence humaine. Développé par IBM, l’ordinateur Deep Blue a vaincu ce qui se faisait de mieux en matière de cerveau humain jouant aux échecs : le champion du monde Garry Kasparov.

La force de Deep Blue résidait dans sa puissance de calcul : il pouvait tester 200 millions de coups par seconde, et anticiper jusqu’à une dizaine de coups à l’avance. Mais surtout, il était capable de choisir les coups les plus intéressants, en prenant le risque de sacrifier intelligemment des pièces pour en retirer des gains plus importants.

Reste que cette capacité à faire ce genre de choix avait été programmée dans la machine par des humains. Du coup, on ne pouvait pas vraiment parler de défaite de l’intelligence humaine.

Intuition et vision organique

Près de 20 ans plus tard, en 2016, c’est au jeu de go que le programme AlphaGo de Google Deep Mind a battu le meilleur joueur du monde, Lee Sedol.

Normal, vous direz-vous. Ce qu’une machine a fait aux échecs, elle peut le faire avec d’autres jeux.

Sauf que le jeu de go est très différent. Chaque joueur dépose à son tour une pierre sur une intersection de la grille. On marque des points en capturant des pièces adverses qui sont encerclées.

La grille du Go fait 19 par 19, soit 361 intersections, ce qui implique, en début de partie, 361 coups possibles. Contre 20 en moyenne aux échecs… Au go, l’intuition et la vision « organique » du jeu comptent presque autant que la capacité d’anticipation et de calcul.

Or, AlphaGo a non seulement gagné, mais il l’a fait d’une manière qui a stupéfait tous les spécialistes.

Une erreur ? Non, non…

Au 37e coup de la deuxième partie l’opposant à Lee Sedol, AlphaGo a choisit de poser une pierre sur un endroit complètement inattendu. Les commentateurs ont même cru à une erreur ! Pourtant, ce coup a déstabilisé le joueur humain et a eu une influence déterminante sur la partie.

Comment AlphaGo en a-t-il été capable ? Doté d’algorithmes simulant le fonctionnement de réseaux de neurones, il a appris à jouer en exploitant une base de données de 160 000 parties jouées par des grands maîtres du Go, soit plus de 30 millions de coups.

Le coup gagnant qu’il a joué, qu’aucun joueur expérimenté n’aurait tenté, il l’a imaginé tout seul, en faisant preuve… de créativité ! Là, l’intelligence humaine est bel et bien battue.

Des programmes qui apprennent tout seul

Aujourd’hui, des algorithmes évoluant selon un système d’essais erreur/réussite sont capables d’apprendre de façon autonome : on ne fournit à l’algorithme que les règles du jeu, et on le laisse s’entraîner et progresser en jouant contre lui-même.

Le programme AlphaZero, lui aussi créé par Deep Mind/Google, est programme capable d’apprendre à jouer tout seul à des jeux abstraits comme les échecs ou le go sans aucune intervention humaine.

Après avoir a joué contre lui-même 140 millions de parties de go, on l’a fait jouer contre AlphaGo. Résultat : il l’a battu 100 parties à zéro. Idem aux échecs, auxquels il a battu le meilleur programme du monde, Stockfish. Détail important : alors que Stockfish peut évaluer 60 millions de situations par seconde, AlphaZero en évalue « seulement » 60 000…

En clair, il est capable de choisir les meilleurs coups avec une redoutable efficacité, au lieu de tout explorer bêtement en recourant à la puissance de calcul.

Conclusion : ce n’est pas pour vous faire peur, mais la singularité approche à grands pas !

Fabien Cluzel

Pour en savoir plus et retrouver le détail des exemples qui ont servi à illustrer ce billet, RDV sur la chaîne Science étonnante.

Image : Gerd Altmann / Pixabay