Projet-IA-Madelaine/Spécifications_techniques.md

11 KiB
Raw Blame History

Projet Jetpack DinoAI

Comparaison de Différentes Intelligences Artificielles dans un Jeu Simple

Cahier des charges techniques

Par :

Victor Descamps
Simon Catanese
Ethan Richard

Tuteur :

Florent Madelaine

fait le 18/11/2023

Sommaire :

1. Contexte

Sujet :

Florent Madelaine. 

Expérimentation Bots pour un ou des jeux. 

Programmer un jeu original avec idéalement des éléments qui en font un challenge pour la réalisation dIA (hasard, phase denchère changeant le payoff, multijoueur, combinatoire importante, ...). Il conviendra de choisir un jeu pour lequel il est possible de réduire la combinatoire du jeu de manière naturelle et de désactiver/activer des règles pour en étudier des variantes naturelles. Il faudra ensuite créer, améliorer et expérimenter avec divers algorithmes pour converger vers des bots offrant un challenge raisonnable pour un humain.

2.Technologies envisagées :

2.1. Plateforme de développement

Le projet sera développé sur Unity, version 22.3.11f1.

Unity est un moteur de jeu gratuit et simple daccès offrant une grande liberté de création et une grande collection doutils divers.

De nombreux cours sont disponibles sur internet pour apprendre son utilisation. 

Unity est aussi compatible avec de nombreuses plateformes dont Windows, MacOs et Linux.

2.2. Langage de programmation

Le langage de programmation utilisé sera C# pour le développement dans l'environnement Unity. Il sagit du langage natif de la plateforme. 

C# est un langage de programmation objet très ressemblant au Java.

2.3. Utilisation de ML-Agents

ML-Agents sera intégré pour la conception et l'entraînement des intelligences artificielles. La version 2.0.1 de ML-Agents sera utilisée. 

ML agent est un asset (outil additionnel) interne à Unity qui permet d'encadrer un apprentissage neuronal. Les scripts d'IA seront développés en utilisant ML-Agents pour permettre aux bots d'apprendre à jouer au jeu de manière autonome. 

Les modèles neuronaux seront entraînés en utilisant des algorithmes d'apprentissage par renforcement.

2.4. Modélisation des personnages et des environnements

Des sprites 2D (images) seront créés pour représenter lavatar, les obstacles et l'environnement du jeu. 

Loutil de graphisme Photoshop sera majoritairement utilisé pour la conception des sprites.

2.5 Contrôles du jeu

Les contrôles du jeu seront mis en œuvre pour un joueur humain ainsi que pour les IA.

La seule commande permettra de modifier la position verticale du joueur tandis que le niveau défilera tout seul de droite à gauche.

2.6 Gestion du jeu

Un système de gestion de jeu sera mis en place, incluant le chargement du niveau, la gestion des collisions, la génération procédurale d'obstacles et la sauvegarde des scores et de données diverses.

Les données enregistrées durant lexécution de lapplication seront stockées dans des fichiers json ou xml dans le répertoire de lapplication.

2.7 Tests et débogage

Des scénarios de test exhaustifs seront élaborés pour chaque composant du jeu. 

Les fonctionnalités seront soumises à des tests unitaires. Des outils de débogage de Unity seront utilisés pour résoudre les problèmes potentiels.

3. Équipe de développement

  • Ethan, Simon et Victor portent tous les 3 le rôle de chef de projet et de développeur. 

  • Simon sera également responsable des tests de lapplication

  • Ethan sera aussi impliqué dans la documentation du projet

  • Victor sera plus spécifiquement impliqué dans limplémentation des systèmes neuronaux dans le jeu.

Loutil en ligne Trello nous servira à planifier les tâches. 

4.Les IA :

Les concepts dIA suivant sont expérimentaux et seront sujets à des changements suivant lavancée du développement du projet et de notre documentation sur la programmation de systèmes neuronaux.

Le rôle des bots est de décider à chaque instant T de faire monter ou de laisser descendre lavatar. Tous auront une source de données différentes leur permettant de prendre une décision.

Lomniscient (Neuronal)loading-ag-445

Ce bot connaît un grand nombre de données brutes. Entre autres : 

  • La vitesse de défilement du jeu,

  • La position verticale du joueur,

  • Les coordonnées des deux points des deux lasers les plus proches,

  • Les coordonnées de tout autre danger proche,

  • les coordonnées dune zone comportant des pièces

LIA devra réussir à faire les bonnes corrélations dans ce grand nombre de données pour prendre les bonnes décisions au cours du temps. Elle nobtiendra pas de données enrichies pouvant faciliter la prise de décision, ces données brutes seront son seul guide. 

Lobservateur (Neuronal)loading-ag-455

Ce bot reçoit en temps réel des données de proximité de lavatar avec les éléments de lenvironnement et des données sur la nature de ces éléments.

Un ensemble de RayCast partant de lavatar dans des directions précises seront utilisés pour recueillir les données nécessaires. 

A la manière dun radar de voiture, lIA devra analyser sa proximité avec des obstacles puis prendra une décision pour ajuster sa trajectoire.

Lobservateur devra apprendre à éviter les objets néfastes sapprochant trop de lavatar et essayer de se rapprocher des pièces pour maximiser son score. 

Cinq RayCasts couvrent probablement un champ de vision suffisamment large et dense pour une analyse efficace de lenvironnement, mais des nombres différents seront essayés pour essayer de maximiser les performances du bot.

La longueur des RayCasts correspondra à la taille de lécran, et les premiers objets rencontrés dans leur trajectoire seront traités comme des données utilisables par le système neuronal de lobservateur. Leur distance par rapport à lavatar et leur nature (bordure, obstacle, bonus, malus) seront transmises au bot. 

LItérateur (Procédural)loading-ag-463

Le bot itérateur ne fonctionne pas par apprentissage mais par itérations de calculs. 

Son fonctionnement consiste à calculer de nombreux chemins différents par itérations puis à sélectionner le meilleur chemin trouvé pour poursuivre la partie. À chaque intervalle , le bot pourra effectuer et maintenir une action (monter ou descendre) le temps de cet intervalle.  Lensemble des actions forme un chemin donné.

Le moteur de jeu va tester virtuellement les chemins à tester et le bot va itérer des calculs de suite dactions un certain nombre de fois. Les chemins proposés amenant à la collision avec un obstacle seront écartés. Le chemin sans collision et apportant le plus de points au score sera sélectionné et le bot recommencera une suite ditérations de calculs vers la moitié de ce chemin pour améliorer sa trajectoire. 

Si tous les chemins mènent à une collision avec un obstacle, le chemin retardant le plus la collision sera sélectionné. Lensemble des actions possibles dans une suite dintervalles représente un arbre binaire où chaque chemin est un parcours de la base de larbre vers une feuille. Litérateur procède à un parcours en profondeur de larbre pour trouver le meilleur chemin.

Nous envisageons dutiliser lapproche de l'algorithme glouton afin dobtenir un chemin satisfaisant sans dépenser trop de temps de calcul en parcourant larbre entier.Pendant le parcours de larbre, si un chemin testé mène à une collision avec un obstacle ou avec un bonus, litérateur reviendra avec une nouvelle suite dactions jusquà quelques itérations avant la collision puis procèdera à un nouveau parcours en profondeur à partir de cette nouvelle base pour essayer doptimiser son score et sa survie. loading-ag-468

L itérateur intelligent (Procédural et neuronal)loading-ag-481

Bot optionnel que lon implémentera si le temps nous le permet. 

Nous navons pas encore de concept clair pour ce bot, nous chercherons une possible implémentation de réseau neuronal fonctionnant de pair avec le calcul itératif de chemins pour améliorer les performances du bot précédent.

5. Livrables

Le dépôt git du projet contiendra le build de la dernière version fonctionnelle de lapplication en plus des documentations annexes. Le projet Unity en lui-même est partagé entre les membres du PT sur la plateforme de collaboration officielle du Unity. Nous veillerons à inclure le code source du projet final dans le dépôt git en plus du build complet de lapplication.

6. Bibliographie :

Apprentissage du C# : 

Série de vidéos sur les aspects du C# dans la programmation sous Unity

Learn C# BASICS in 10 MINUTES! - YouTube

Documentation unity : 

Documentation officiel de la plateforme, utile pour tout besoin technique.

https://docs.unity.com/

Documentation ML-Agents : 

Documentation officielle de ML-Agents qui nous servira  à implémenter des systèmes neuronaux.

Toolkit Documentation - Unity ML-Agents Toolkit

**