L’AWS Summit Paris 2024 s’est imposé comme le rendez-vous incontournable pour les passionnés du Cloud, de la Data et de l’Intelligence Artificielle. Cet événement a rassemblé une communauté autour des innovations et des solutions proposées par AWS.
L’équipe Starclay était présente à l’AWS Summit Paris 2024, où elle a exploré des innovations clés et assisté à des keynotes captivantes. Cette immersion nous a permis de saisir les dernières tendances en Cloud, Data et IA.
Voici un résumé de l’un des ateliers auxquels l’équipe a pu assister :
Améliorez vos applications d’IA générative avec RAG sur Amazon Bedrock
L’atelier s’est concentré sur l’amélioration des applications d’IA grâce à la personnalisation des modèles via le Retrieval-Augmented Generation (RAG) sur Amazon Bedrock. Cette approche novatrice permet d’intégrer des données internes dans l’IA générative, offrant ainsi des réponses fondées sur une connaissance interne spécifique, et non uniquement sur l’ensemble des données globales sur lesquelles le modèle a été entraîné.
Décryptage des méthodes de personnalisation des modèles de fondation :
L’atelier a mis en lumière la distinction entre plusieurs méthodes de personnalisation des Fondation Models (FM), notamment le fine-tuning, le prompt engineering, et le RAG, et a établi des directives sur quand et comment déployer chacune de ces techniques.
- Le Prompt Engineering : Cette méthode consiste à concevoir des entrées spécifiques pour guider le modèle d’IA vers les sorties désirées. Elle est adaptée pour des tâches simples et ne nécessite pas de ressources de calcul importantes.
- Le Fine-Tuning : Il s’agit d’affiner un modèle pré-entraîné avec un jeu de données spécifique pour améliorer son aptitude à exécuter des tâches nécessitant une grande précision. Cette technique exige plus de ressources computationnelles mais conduit à des performances spécialisées du modèle.
- La Retrieval-Augmented Generation (RAG) : Cette méthode améliore les réponses du modèle en extrayant des informations pertinentes de sources de données externes. Elle offre un compromis entre performance et efficacité, produisant des réponses riches tout en nécessitant moins de données que le fine-tuning pour des performances comparables.
Le choix entre ces méthodes varie en fonction de la complexité de la tâche, du besoin en précision, de la disponibilité des données, et des ressources computationnelles. L’atelier a illustré l’importance de choisir la bonne stratégie pour adapter les modèles de fondation aux applications spécifiques, en soulignant les avantages et les défis associés à chaque méthode.
Exemple concret de la RAG : L’UCPA et le collaborateur augmenté
Lors de l’atelier au AWS Summit Paris 2024, l’UCPA (Union nationale des centres sportifs de plein air) a illustré comment la RAG peut être appliquée dans des contextes réels. L’UCPA a présenté plusieurs cas d’usage, démontrant comment cette technologie a été utilisée pour :
- Résumé et catégorisation des appels clients
- Analyse et catégorisation des avis clients
- Intégration des factures fournisseurs
- Publication d’offres d’embauche
L’atelier a également exploré le concept de « collaborateur augmenté », une approche qui utilise la RAG pour créer des chatbots privés et sécurisés afin d’améliorer les capacités des collaborateurs. Cette intégration permet aux employés d’interagir avec des chatbots qui peuvent dialoguer avec des données internes, contribuant à un environnement de travail plus riche et collaboratif.
Le collaborateur augmenté : trois piliers fondamentaux
Pour le cas du collaborateur augmenté, trois piliers principaux ont été développés :
- Mise à disposition de chatbots privés : Plus de 200 chatbots ont été déployés pour les collaborateurs. Ces outils d’IA générative sont conçus pour être sécurisés et privés, assurant la protection des données et des interactions.
- Dialogue avec des données personnelles : Ces chatbots permettent aux employés de dialoguer avec l’IA en utilisant leurs propres données, créant des interactions plus pertinentes et personnalisées.
- Interaction avec les données de l’entreprise : Les chatbots sont également capables de puiser dans le réservoir de données de l’entreprise pour fournir des informations et des réponses qui sont en synergie avec la mémoire collective de l’organisation.
Grâce à la RAG sur Amazon Bedrock, l’UCPA a pu mettre en place ces solutions innovantes en seulement un mois de développement, un gain de temps significatif par rapport aux méthodes traditionnelles. Cette approche a permis d’augmenter l’efficacité des collaborateurs tout en assurant une sécurité et une confidentialité optimales.