Les Investisseurs logo

L'IA bat les humains aux jeux vidéos

Les chercheurs des laboratoires OpenAI et UberAI ont développé une IA capable de maîtriser les jeux classiques d'Atari des années 1980.
mars 5, 2021
jeff brown

L'intelligence artificielle (IA) vient de faire un nouveau pas en avant

Les chercheurs des laboratoires OpenAI et UberAI ont développé une IA capable de maîtriser les jeux classiques d'Atari des années 1980. Croyez-le ou non, c'est une étape importante.

L'équipe de recherche a lancé l'IA sur de vieux jeux vidéo comme Centipede, Berzerk, Pitfall et Montezuma's Revenge. Ce sont tous des jeux auxquels j'ai joué quand j'étais enfant dans les années 80. Je suis sûr que de nombreux lecteurs s'en souviendront également.

Une IA de plus en plus forte

Bien que ces jeux semblent simples et basiques selon les normes d'aujourd'hui, ils sont trompeusement difficiles pour une IA. C'est en partie parce que l'évolution des jeux n'est pas un processus linéaire. Les joueurs doivent résoudre des énigmes, ce qui nécessite souvent de revenir sur des zones précédemment explorées dans le jeu.

Pour cette raison, même DeepMind de Google ne pouvait pas produire une IA capable de maîtriser ces vieux jeux. L'IA Agent57 de DeepMind s'en rapprochait, mais elle avait quelques défauts qui la retenaient.

ia 1

Agent57

Le principal problème de l'Agent57 est qu'elle fonctionnait avec ce qu'on appelle une motivation intrinsèque. Il s'agit d'un modèle où l'Intelligence Artificielle est récompensée pour la découverte de nouveaux aspects d'un jeu.

Mais cette approche conduit également à ce que les chercheurs en Intelligence Artificielle appellent le "détachement". Comme l'IA est récompensée pour apprendre à progresser dans de nouveaux domaines, elle oublie parfois de revenir en arrière et d'explorer d'anciens domaines plus tard dans le jeu. Elle se "détache" de ces parties du jeu.

ia

OpenAI et UberAI Labs ont résolu ce problème. Et leur solution était élégante dans sa simplicité.

L'équipe a programmé son Intelligence Artificielle pour "archiver" les zones du jeu au fur et à mesure de leur exploration. L'Intelligence Artificielle prend note de certaines zones qui peuvent être utiles plus tard. Puis elle les revisite plus tard dans le jeu. Elle revient pour voir s'il y a quelque chose de nouveau qui peut l'aider à progresser dans le jeu.

Et bien sûr, cette approche a aidé l'IA à maîtriser ces vieux jeux Atari. Elle peut maintenant battre ces jeux plus rapidement que les experts humains.

Je sais que cela peut sembler une application stupide pour l'Intelligence Artificielle, mais c'est une grosse affaire.

Maintenant que l'IA a prouvé sa capacité à archiver de vieilles informations pour les vérifier plus tard, cette même approche peut être utilisée dans d'autres domaines de recherche. Elle pourrait être appliquée à la gestion de la chaîne d'approvisionnement, à la conception des matériaux, au développement thérapeutique et à bien d'autres domaines de recherche plus pratiques.

J'ai hâte de voir cette nouvelle technologie appliquée à de difficiles problèmes d'optimisation. Je m'attends à ce que d'autres percées soient réalisées grâce à cette recherche dans les mois à venir.

Envie d'en savoir plus sur Uber AI 

Avant d'approfondir ce sujet précisément, Lucas Marchand, directeur de Vauban editions, vous propose de découvrir les 5 règles d'or de la bourse pour vous permettre d'atteindre vos objectifs financiers.
5 règles d'or de la bourse

Envie de découvrir des articles sur la technologie ?

0 0 votes
Évaluation de l'article
S’abonner
Notification pour
guest
3 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
VIOLETTE
VIOLETTE
2 années il y a

Bonjour Jeff
Grand merci pour tout ce que vous nous transmettez d'informations de premier plan, et merci de nous avoir permis de commenter cet article sur les tests de la Covid. Les plans ont en effet été mis depuis longtemps et nous savions depuis l'année dernière que les tests étaient biaisés par le seuil de mesure ou ce que vous appelez: réglage de sensibilité qui amplifie le matériel génétique, et aussi par la qualité technique d'une majorité d'entre eux, selon des experts censurés. Mais ces informations n'étaient pas disponibles à une majorité par la censure qui a opéré d'une manière musclée et qui cache autre chose que ce qui est visible. Cette mise en scène servait, et continue toujours par le biais d'autres moyens aussi, à amener vers l'exécution des objectifs annoncés par des alerteurs d'opinion dont certains ont été sanctionnés, dont la vaccination à outrance malgré les dangers annoncés et la mise sous contrôle de la majeure partie de la planète par le biais d'une OMS au service de ces plans criminels. Il reste à savoir si cette scène va continuer à être jouée ou si ce monde va se reveiller après s'être endormi tout ce temps écoulé au nom de son droit à la santé et la sécurité ? Les traumatismes de tout genre s'additionnent entre temps les uns aux autres avec ce virus trafiqué et le monde marche sur la tête jusqu'à nouvel ordre.Cordialement

Rolland Ratelle
Rolland Ratelle
2 années il y a

Merci pour votre artcle sur les teste pcr
Je savait depeuis lontemps se que vous dite ,vous confirmer se que j avais vu sur d autre site

AUBERT
2 années il y a

Il faudrait qu'un trés grand nombre de personne est accés a cet article et surtout des responsables de la santé est les desideurs,les gens on etait tromper des le debut de l'epidemie

Vauban Editions
Rue Neuve 3,
1003 Lausanne

Des questions ? N'hésitez pas à nous contacter

 

cross-circle
3
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x