Sujet de veille
Intelligences artificielles génératives

Mon sujet de veille porte sur l'évolution des intelligences artificielles génératices et leur impact sur les particuliers, entreprises et instances gouvernementales.

L'utilisation non officielle de l'IA générative dans certaines entreprises : Shadow AI

• Introduction
- Les IA génératives ont récemment intégré le monde professionnel, certaines avec l'approbation des entreprises, tandis que d'autres sont utilisées à leur insu, créant ainsi le concept de "Shadow AI".
- La mise en place d'une gouvernance, de mesures de sécurité et la sensibilisation des collaborateurs sont devenus des enjeux cruciaux pour les entreprises.

• L'essor des LLM (grands modèles de langage) et la généralisation de l'IA générative
- L'utilisation d'API publiques pour interagir avec les grands modèles de langage expose les entreprises à des risques de perte de données confidentielles et de compromission de la propriété intellectuelle.
- Les entreprises doivent faire preuve de diligence dans la sélection et la mise en œuvre de ces modèles, tout en mettant en place des mesures de sécurité solides.

• Les dangers du Shadow AI entre vulnérabilités et prévention
- L'utilisation de LLM grand public dans un contexte professionnel peut entraîner la diffusion involontaire de données confidentielles, comme illustré par l'exemple d'un marketeur faisant appel à ChatGPT pour des campagnes publicitaires.
- La majorité des employés ne comprennent pas pleinement le fonctionnement de ces modèles, ce qui accroît le risque de fuites de données.
- La sensibilisation des collaborateurs est essentielle pour prévenir ces incidents et protéger les données sensibles de l'entreprise.

• L'importance de la sensibilisation et de la maîtrise des LLM
- Interdire l'accès aux LLM pour le grand public peut entraîner un comportement de "Shadow AI" où les employés utilisent secrètement ces outils, ce qui nuit à l'innovation et à la productivité.
- Les entreprises doivent offrir des alternatives en autorisant l'accès à des IA sélectionnées, en mettant en place des outils de sécurité spécifiques et des mesures de contrôle pour superviser leur utilisation.
- La sensibilisation et la formation régulières des collaborateurs aux risques et aux bonnes pratiques sont essentielles pour garantir une utilisation sûre et efficace des LLM.

En résumé, pour faire face aux risques du Shadow AI, les entreprises doivent choisir avec soin leurs modèles de langage, sensibiliser et former leurs employés, et mettre en place des mesures de sécurité adéquates pour protéger leurs données confidentielles.

La révolution technologique de l'IA générative, selon Luc Julia

• Introduction
- Luc Julia, inventeur de Siri et actuel directeur scientifique de Renault, partage ses réflexions sur l'IA générative.
- Il souligne que cette évolution n'est pas une révolution vers une IA forte mais plutôt une transformation des usages.

• Contexte de l'IA générative
- L'IA générative est perçue comme une évolution du Machine Learning et du Deep Learning.
- Elle nécessite une quantité significative de données et de puissance de calcul, ce qui soulève des préoccupations environnementales.

• Le rôle du prompt
- Le prompt est souligné comme un élément clé de l'IA générative, permettant une interface basée sur le langage naturel.
- Il a contribué à une adoption rapide de cette technologie malgré des problèmes initiaux d'erreurs et d'hallucinations.

• Adoption de la GenAI
- Malgré les défis initiaux, l'adoption de l'IA générative a été rapide, notamment dans les entreprises.
- Des solutions telles que le Fine Tuning et la création de RAG (Réseaux d'Attention Guidée) sont utilisées pour améliorer la précision des modèles.

• Perspectives d'amélioration
- Luc Julia suggère des approches hybrides combinant la logique des systèmes experts avec les statistiques des LLM pour améliorer leur efficacité.
- Il insiste sur la nécessité de solutions plus économes en énergie pour contrer l'impact environnemental des grands LLM.

• Défis et solutions futures
- Les défis incluent la protection de la propriété intellectuelle et la sécurité des modèles contre le jailbreaking.
- L'Open Source est considéré comme un moyen de garantir la transparence et le contrôle sur les architectures IA.

• Conclusion
- Luc Julia met en évidence la nécessité de solutions plus éthiques, efficaces et respectueuses de l'environnement dans le développement et l'utilisation des LLM.

L'origine des données utilisées par les IA génératives

• Introduction
- L'intérêt croissant pour les IA génératives face à l'attente de GPT-5 et la compétition entre géants numériques.
- La différenciation des éditeurs alternatifs par la transparence et la qualité des données d'entraînement.
- Le débat sur l'importance de la taille du modèle par rapport à la pertinence des données d'entraînement.

• Origine des données d'entraînement
- Les IA génératives utilisent des jeux de données compilés à partir du milieu universitaire ou de la recherche.
- Les jeux de données compilent d'énormes quantités de contenus web sans l'autorisation explicite des auteurs ou éditeurs.
- Certains contenus posent problème s'ils sont utilisés en dehors de cadres scientifiques.
- La maîtrise des corpus documentaires est cruciale pour optimiser les IA génératives.
- Le manque de recul et de maturité renforce le besoin de transparence.

• Types de données d'entraînement
- Corpus de pages web comme Common Crawl, The Pile, OpenWebText2.
- Utilisation et purification de ces données pour des modèles spécifiques.
- Préoccupations concernant les contenus aspirés sans autorisation, notamment par les éditeurs de presse.

• Corpus de livres et de textes
- Problèmes soulevés par l'utilisation de corpus de livres sous licence.
- Réactions des auteurs concernant l'utilisation de leurs œuvres dans l'entraînement des modèles.
- Débat sur le partage vs. la rémunération des contenus.

• Corpus d'images
- Complexité de l'audit et du nettoyage des corpus d'images.
- Controverses autour de l'inclusion de contenus sensibles.
- Préoccupations des artistes quant à l'utilisation de leurs œuvres.

• Solutions et pratiques éthiques
- Initiatives de rémunération des créateurs de contenus.
- Développement de modèles spécifiques à des éditeurs ou langues.
- Besoin de corpus documentaires de qualité dans diverses langues.
- Réflexion sur l'utilisation de corpus internes pour des applications spécifiques.

• Transparence et éducation
- Importance de la transparence sur les données d'entraînement.
- Réglementation européenne sur l'IA et besoin de traceabilité.
- Besoin d'éducation et de sensibilisation pour favoriser l'adoption et atténuer les inquiétudes.

• Conclusion
- Le marché évolue vers une évaluation fine des modèles plutôt que vers une course à la taille.
- Nécessité d'une pédagogie rigoureuse pour expliquer les IA génératives et impliquer les utilisateurs.
- Importance de l'accompagnement pour éviter une méfiance accrue envers l'IA.

L'impact de l'IA sur les entreprises

• Introduction
- Le marché du cloud connaît une croissance exponentielle, boostée par des technologies telles que l'IA.
- L'importance de maîtriser l'IA avant qu'elle ne maîtrise les entreprises est soulignée.

• Adaptation à l'ère de l'IA :
- L'évaluation de la maturité de l'entreprise dans l'adoption de l'IA est cruciale.
- Il est nécessaire de développer une culture axée sur les données.
- La formation de tous les employés dans l'utilisation des données et des outils d'IA est recommandée.
- L'intégration de l'IA dans toutes les fonctions de l'entreprise est essentielle.
- Les startups proposent des solutions de formation ludiques et personnalisées.

• L'IA générative comme pilier stratégique :
- Prévisions sur l'adoption croissante de l'IA générative, notamment ChatGPT.
- La démystification de l'IA générative est importante pour favoriser son adoption.
- La démonstration de sa valeur commerciale est essentielle.
- Un retour sur investissement tangible est recherché.
- Une visibilité complète sur le processus est nécessaire pour renforcer la confiance.
- L'anticipation de son rôle crucial dans l'avenir est soulignée.

• Co-innovation et confiance avec les partenaires :
- La co-innovation est encouragée pour maximiser les avantages de l'IA générative.
- La collaboration avec des partenaires spécialisés est recommandée.
- La transparence sur l'origine et l'utilisation des données est primordiale.
- La co-innovation dès la phase de conception favorise la confiance.

En résumé, le texte met en évidence l'importance de maîtriser l'IA, en particulier l'IA générative, pour les entreprises, en soulignant la nécessité d'évaluer la maturité de l'entreprise dans l'adoption de l'IA, de démontrer sa valeur commerciale, d'assurer un retour sur investissement et de favoriser la confiance à travers la co-innovation avec des partenaires spécialisés.

Nouvelle règlementation Européenne sur l'IA

• Introduction :
- Accord de principe sur le projet de texte du Règlement Européen sur l'IA le 8 décembre 2023.
- Approche fondée sur les risques pour encadrer les cas d'utilisation des systèmes d'IA.

• Approche réglementaire fondée sur les risques :
- Interdictions pour les cas d'utilisation d'IA en violation des droits fondamentaux de l'UE.
- Obligations renforcées pour les systèmes d'IA à haut risque.

• Encadrement des modèles de fondation et des systèmes d'IA à usage général :
- Régime spécifique pour les modèles de fondation avec obligation de transparence.
- Dispositif spécifique pour les systèmes d'IA à usage général, notamment lorsqu'ils sont intégrés à un système d'IA à haut risque.

• Système de supervision national et européen :
- Autorités nationales chargées de la mise en œuvre et supervision.
- Création d'un Bureau de l'IA et d'un Conseil de l'IA au sein de la Commission européenne pour renforcer la convergence des régulateurs européens.

• Système de sanctions proportionnel au risque :
- Sanctions en cas de non-respect des obligations du règlement.
- Sanctions pouvant atteindre jusqu'à 35 millions d’euros ou 7% du chiffre d’affaires annuel de l’entité responsable.

• Prochaines étapes :
- Travaux techniques pour finaliser le texte.
- Soumission aux co-législateurs européens pour adoption formelle début 2024.

• Réflexions finales :
- Questions persistantes sur la finalisation, l'interprétation, l'impact sur l'innovation et les interactions avec d'autres textes législatifs et réglementaires.
- Le cadre réglementaire ne répondra pas à toutes les problématiques liées à l'IA et pourrait susciter de nouvelles interrogations.

L'augmentation de la productivité des entreprises grâce aux IA

• Automatisation du codage
- Développeurs utilisent l’IA générative.
- Automatisation des tâches, +55% de productivité.
- Suggestions de code, documentation.
• Conception de sites web
- Outils d’IA pour automatiser la conception.
- Gains de temps, mises en pages optimisée.
• Accessibilité numérique
- Commandes vocales pour le codage.
- Rend le développement plus inclusif.
- Synthèse vocale, retranscription audio.
• Perspectives futures
- Impact croissant, avenir « révolutionnaire ».
- Évolution constante des modèles d’IA générative.

Évolutions de ChatGPT dans sa nouvelle version majeure (ChatGPT-4)

• Nouvelle version de ChatGPT
OpenAI lance une version de ChatGPT permettant aux utilisateurs d'interagir par la voix et les images, similaire à des assistants vocaux comme Siri.

• Fonctionnalités améliorées
Les utilisateurs peuvent poser des questions vocales, télécharger des photos, et utiliser l'écran tactile pour délimiter des zones d'intérêt sur les images.

• Utilisations quotidiennes
La fonctionnalité permet des applications pratiques, de la recherche de recettes en prenant des photos du frigo à la résolution de problèmes divers.

• Conversation vocale
L'utilisateur appuie sur un bouton, pose une question vocale, et ChatGPT convertit la voix en texte pour générer une réponse, puis la convertit à nouveau en parole.

• Préoccupations sur la vie privée et la sécurité
Comparaison avec les préoccupations précédentes liées à des assistants vocaux comme Siri, Alexa, et Google Assistant.

• Parallèles avec IoT
Les dispositifs IoT, tels que Ring d'Amazon et Google, ont connu des incidents de partage non autorisé de données, soulevant des inquiétudes similaires.

• Historique de controverses
La fonctionnalité permet des applications pratiques, de la recherche de recettes en prenant des photos du frigo à la résolution de problèmes divers.

• Actions légales passées
L'utilisateur appuie sur un bouton, pose une question vocale, et ChatGPT convertit la voix en texte pour générer une réponse, puis la convertit à nouveau en parole.