IA générative : les enseignements de 2023

26 janvier 2024 Usman Javaid , Collaboration

2023 a été une année charnière durant laquelle l'IA générative (GenAI) s’est imposée comme une technologie transformatrice dans le domaine en constante évolution de l'intelligence artificielle (IA). Ce phénomène a été clairement catalysé par l'ascension fulgurante de ChatGPT, lancé en novembre 2022 ; un phénomène mondial dont la fréquentation mensuelle est passée de 58 millions à 1,8 milliard en à peine un mois. Une nouvelle ère numérique a vu le jour, ponctuée de mouvements captivants, inspirants et parfois spectaculaires au sein du secteur technologique, dont les géants du secteur rivalisent pour se hisser au rang de leader de l’innovation.

La GenAI est un ensemble de technologies capables de générer divers contenus tels que textes, images, extraits audio, vidéos, voire code informatique. Les dernières annonces d'OpenAI, par exemple, évoquent des capacités "multimodales" permettant à un seul modèle d'IA d’intégrer le langage, l'audio, la vision, la vidéo et la 3D, ainsi que des raisonnements complexes. Imaginez un assistant capable de comprendre la vidéo, la 3D, l'audio et la parole : les avantages en termes de productivité ne seraient-ils pas considérables ?

Au final, la GenAI se présente comme un assistant pouvant décupler l’efficacité de nos tâches. Apprendre à utiliser cet assistant de manière optimale est donc crucial car plus nous en comprenons les capacités, meilleurs sont les résultats obtenus. Envisagez le domaine médical par exemple : si chaque médecin disposait d'un assistant GenAI pour l'aider dans des diagnostics complexes en analysant des notes cliniques, des images médicales et des antécédents patients, quelles améliorations significatives pourrait-on observer sur notre santé ?

Dans cet article je voudrais dissiper les mythes entourant la GenAI et aider à envisager sa réalité pratique, à partir de l’expérience capitalisée par Orange Business dans l’interaction avec ses clients. Six points clés sont à prendre en considération pour savoir comprendre et se saisir des réalités offertes par la GenAI, mais aussi aider les entreprises à éviter les pièges les plus courants et à accélérer son adoption.

1. L'IA générative n'est que la partie émergée de l'iceberg

La GenAI est un type d’intelligence artificielle capable de créer de nouveaux contenus, en s’appuyant sur des algorithmes d’apprentissage et des données d’entraînement. La qualité d'un modèle dépend entre autres choses de la qualité et de la quantité de ces données. Pour traiter ces volumes de données, il est impératif de disposer de capacités étendues de calcul, de stockage et d'analyse, propulsées par le cloud/edge et facilitées par des réseaux de haute qualité. Les résultats de GenAI s'appuient sur les données sur lesquelles elle a été entraînée, et leur "créativité" découle du traitement d'informations existantes. La GenAI peut contribuer à l'intelligence augmentée grâce à ses capacités à traiter le langage naturel, ainsi qu’à utiliser ces éléments de manière dynamique pour générer de nouveaux résultats.

D'après notre expérience auprès d’entreprises clientes, les outils GenAI génériques utilisés dans un contexte professionnel risquent de ne pas saisir le vocabulaire spécifique, tel que les acronymes, les concepts techniques, ou encore les rôles professionnels propres à chaque organisation. Cette lacune s’explique par le fait que la plupart des modèles GenAI sont entraînés sur la base de données publiques. Par conséquent, la personnalisation (ou fine tuning) de l'outil GenAI avec des données spécifiques devient impérative pour la plupart des entreprises.

C'est là que la qualité des données se révèle être un défi majeur, au-delà même du choix judicieux des cas d'utilisation de GenAI. Les entreprises doivent investir dans la création de bases de données solides accompagnées d’une infrastructure de cloud, de connectivité et de cybersécurité de premier ordre pour libérer tout le potentiel de la GenAI. De plus, elles doivent mettre en place une robuste gouvernance des données, avec des politiques définies concernant la sensibilité et le cycle de vie des données. Cette démarche peut présenter des défis considérables, notamment dans les grandes organisations. La combinaison de la qualité des données et d'une gouvernance solide permet aux entreprises de réduire les risques associés à la GenAI, tels que la production de résultats inexacts ou la violation de la confidentialité des données.

2. L'IA générative : une approche personnalisée

Si l'on remonte dix ans en arrière, la création d'un modèle de génération de texte aurait nécessité un entraînement complet sur plusieurs mois. L'une des évolutions centrales de la GenAI réside dans le fait que nous disposons à présent de modèles fondamentaux pré-entraînés, appelés grands modèles de langage (ou LLM pour Large Language Models). Tels quels, ils sont déjà experts dans de nombreuses tâches. Mais surtout, ces modèles peuvent être améliorés, affinés et post-entraînés sur un ensemble de données bien plus restreint afin de contextualiser le résultat commercial visé. Ces approches revêtent une importance cruciale tant du point de vue de la valeur économique que de la réduction des barrières à l'entrée, offrant ainsi aux entreprises la possibilité d'innover en s'appuyant sur les LLM existants.

Parallèlement à ces nouvelles techniques d'exploitation des modèles fondamentaux, il existe une gamme de tailles et de capacités de modèles, allant des grands modèles qui répondent à la grande majorité des besoins, à de nombreux petits modèles linguistiques (SLM pour Small Language Model) conçus pour des tâches spécifiques. Les SLM, versions réduites des LLM, se révèlent plus efficaces pour des tâches ciblées, ainsi que plus rentables. Ils disposent de beaucoup moins de paramètres que les LLM, qui peuvent en compter des centaines de milliards, voire des billions. En contrepartie, ils sont toutefois moins performants concernant les questions "généralisées" de grande envergure et ne peuvent prendre en charge qu'un seul type d'entrée, tel que le texte ou les images, contrairement aux modèles multimodaux mentionnés précédemment.

Nos collaborations avec nos clients nous ont permis d’apprendre qu'il est essentiel d'adopter une approche centrée sur les résultats afin d’identifier la solution adéquate. Les besoins des entreprises peuvent souvent être résolus grâce à un modèle existant, un SLM, voire en combinant plusieurs petits modèles. Et dans de nombreux cas, l'IA générative n'est pas nécessaire, ou l’est seulement pour une fraction réduite de la solution globale.

3. Du "plus c'est grand, mieux c'est" aux LLM contextuels

En 2023, nous avons assisté à la montée en puissance des LLM et à leur domination dans les débats relatifs à l'IA, grâce à leur capacité quasi magique à résoudre une multitude de problèmes. Et si les données sont l'oxygène de l'IA, il s’agit donc de lui fournir un contexte aussi pertinent et impartial que possible, afin d'atteindre des résultats optimaux. Imaginez cela comme la recherche d'une aiguille dans une botte de foin ; pour trouver l’aiguille plus rapidement, vous pouvez modifier la couleur ou la forme de l'aiguille (ou de la botte de foin), utiliser un aimant, ou encore coordonner plusieurs recherches parallèles.

Cette prise de conscience a catalysé le développement de LLM spécifiques à certaines industries, enrichis de contexte commercial et spécialisés dans la résolution de problèmes précis. Par exemple, dans le domaine des ressources humaines, Mercer utilise un LLM pour automatiser le processus de recrutement.

Dans le secteur juridique, Harvey AI et CaseHOLD ont révolutionné la gestion des tâches juridiques en effectuant des analyses de contrats et des résumés de conformité juridique. Dans la finance, BloombergGPT analyse les données financières, tandis que dans le domaine de la santé, Med-PaLM de Google DeepMind traite les notes cliniques, les résultats de laboratoire et les images médicales, entre autres. Je prévois l'émergence prochaine de places de marché dédiées aux LLM contextuels, où vous pourrez choisir le type de modèle dont vous avez besoin en fonction du contexte de l'entreprise et du problème à résoudre.

4. Les réseaux à l'épreuve de la GenAI

La GenAI n'évolue pas en vase clos. Elle requiert une base cloud et des données solides, mais aussi un réseau intelligent performant, capable de prendre en charge des architectures complexes de maillage de données, de l’edge au cloud, pour des demandes/réponses rapides, le réglage fin des modèles, l'inférence et l'entraînement. Omdia prévoit que d'ici 2030, près des deux tiers du trafic réseau seront liés à l'IA, alimentés par du contenu généré par l'IA tel que des vidéos et des images. Les réseaux mondiaux doivent donc être prêts à transporter des Zettaoctets (soit 1 000 Exaoctets, ou 1 000 000 Pétaoctets) et à soutenir les applications existantes évoluant vers l'IA, ainsi que les nouvelles applications IA.

À l'origine, les LLM étaient conçus pour fonctionner sur une infrastructure cloud centralisée puissante. L'année dernière, plusieurs variantes de LLM ont émergé, capables de fonctionner dans le Cloud, en périphérie de réseau, ainsi que sur des appareils individuels. Par exemple, Google Gemini a introduit trois variantes : Ultra, Pro et Nano - Gemini Nano pouvant fonctionner nativement sur les appareils Android. Nous nous attendons également à ce qu'Apple et de nombreuses autres entreprises d'électronique grand public produisent et intègrent des LLM dans leurs produits. L'exécution de ces très petits modèles d'IA sur les appareils crée de nouveaux cas d'utilisation, rendant la GenAI hautement personnalisée et réduisant les risques liés à la confidentialité des données, bien que cela ne soit pas aussi sophistiqué que dans le cloud. Ces architectures aussi diverses et complexes pour les déploiements de GenAI mettent en lumière les réseaux mobiles et fixes actuels, introduisant de nouveaux besoins qui exigent de repenser la conception des réseaux.

5. L'IA générative : création ou substitution d'emplois ?

L'une des prédictions les plus saisissantes pour l'IA générative d’ici 2030 concerne son potentiel à automatiser jusqu'à 30 % des heures de travail actuellement déployées dans l'économie américaine. Une étude menée par des chercheurs du MIT quant à l'impact de l'IA générative sur les travailleurs hautement qualifiés suggère qu'elle peut améliorer leurs performances de 40 % par rapport aux travailleurs qui ne l'utilisent pas. Les avantages de la GenAI sont également plus prononcés pour les travailleurs moins qualifiés que pour les groupes plus spécialisés, selon la même étude. Une étude de McKinsey constate que les développeurs de logiciels peuvent effectuer des tâches de codage jusqu'à deux fois plus rapidement avec la GenAI. Les travailleurs du savoir, tels que les juristes et les scientifiques, pourraient également accélérer considérablement leur processus de travail en utilisant l'IA pour analyser instantanément de larges volumes de données.

Bien que le verdict final sur cette question ne soit pas encore rendu, ma conviction personnelle est que la GenAI automatise des tâches plutôt que des emplois. En conséquence, les travailleurs équipés d'IA sont destinés à compléter, voire à remplacer, ceux qui n'en bénéficient pas. Cette conviction a été confirmée par les cycles de perturbation technologique des trois dernières décennies avec l'avènement des ordinateurs, de l'internet, des téléphones portables, etc., et la révolution industrielle qui les a précédés.

6. La confiance : un pilier incontournable pour une adoption à grande échelle

En raison des idées fausses qui circulent sur ses réalités pratiques, il n'est guère surprenant de constater que la GenAI se trouve actuellement au sommet de ce que Gartner appelle le « Hype cycle », ce qui correspond au maximum des attentes excessives. L'IA présente en effet son lot de défis : impact environnemental, influence sur la productivité, retour sur investissement, gestion des compétences, réglementation et éthique. J'affirme avec conviction que son adoption à grande échelle ne sera possible qu'avec un socle solide de confiance.

La confiance est d'autant plus cruciale que seul un tiers de la population française estime que l'IA présente plus d'avantages que d'inconvénients. Selon une enquête mondiale menée par le BCG auprès de 11 000 salariés, plus l'IA est utilisée, plus elle suscite la confiance, mais elle génère simultanément des craintes. Un pourcentage significatif d'employés voit l'IA comme une menace, les taux les plus élevés étant observés parmi ceux qui utilisent déjà la technologie. Au sein d’Orange, notre participation au programme d'accès anticipé (EAP) Microsoft Copilot for M365 a mis en évidence des défis tels que la conformité des données et une courbe d'apprentissage abrupte avant de réaliser des gains de productivité significatifs.

Les gouvernements se sont rapidement mobilisés pour réglementer l'utilisation de l'IA. En octobre, l'administration Biden a publié des règles pour la GenAI par le biais d'un décret énonçant huit objectifs, incluant des normes de sécurité et engageant à une utilisation responsable de l'IA. En décembre, la Commission européenne a publié la première version de la loi sur l'IA pour encadrer son utilisation dans l'Union européenne. Pour concrétiser cette loi, des chercheurs de l'université de Stanford ont évalué 10 grands modèles de langage (LLM) populaires, parmi lesquels seuls quatre ont obtenu des notes satisfaisantes, le modèle libre Bloom se distinguant avec une note de 36 sur 48. Le manque de transparence des fournisseurs, qui ne divulguent pas suffisamment d'informations sur leurs modèles et les risques associés à leur utilisation, est une préoccupation majeure.

La violation des droits d'auteur et de la propriété intellectuelle est également une préoccupation importante. Récemment, le New York Times a intenté une action en justice contre OpenAI et Microsoft pour "utilisation illégale" de son contenu afin d'entraîner les systèmes GenAI et LLM, alléguant que de grandes parties de son matériel ont été utilisées dans le développement de ChatGPT. La GenAI soulève d'importantes questions en matière de droits d'auteur, et il est certain que nous avons beaucoup à apprendre dans ce domaine, car il s'agit de technologies entièrement nouvelles qui nécessitent une adaptation de la loi et de notre compréhension de leur place dans la société.

En conclusion, quelles que soient les polémiques gravitant autour de la GenAI, elle représente un incroyable potentiel pour transformer nos modes de vie numériques. En tant que vétéran de la technologie ayant traversé de nombreux cycles d'engouement – l’internet, le mobile, le cloud, l’IoT, le jumeau numérique, la blockchain, etc… j'ai appris que l'engouement est un excellent "mécanisme commercial" qui nous permet de passer de l'art du possible à l'art de la pratique. L'adoption généralisée de la GenAI est prévue dans un délai de 2 à 5 ans, lorsque chaque produit et logiciel intégrera cette fonctionnalité. D’ici là, il est essentiel de débuter par des expériences modestes et d’envergure raisonnée, tout en évitant les pièges les plus courants.

Lire la version anglaise de cet article : Facing the reality of Generative AI with the lessons learned in 2023

Pour aller plus loin

Usman Javaid

Chief Products and Marketing Officer d’Orange Business, Usman Javaid, PhD apporte une vaste connaissance du marché des entreprises dans le domaine des télécommunications et du numérique. Auparavant, Directeur Service Delivery d’AWS, Usman a plus de 20 ans d’expérience dans la conception, l’accompagnement et l’accélération de la transformation numérique des plus grandes entreprises et start-ups au monde.