IA et environnement

Pourquoi une IA générative consomme-t-elle autant d’énergie ?

Une IA energivore

Mis à jour le lundi 25 août 2024

Les avancées impressionnantes de l’IA ne sont pas sans soulever de nombreuses questions, notamment quant aux coûts énergétiques et environnementaux des algorithmes et des modèles d’apprentissage automatique sur lesquels elle repose.
Avoir une base de connaissances qui fournit des clés de compréhension ainsi que des pistes de réflexion est essentiel pour utiliser de manière éclairée et raisonnée les IA génératives, notamment d’un point de vue environnemental.

Quelques chiffres clés à avoir en tête

Même s’il demeure difficile de quantifier précisément la puissance électrique consommée par une requête Google ou ChatGPT, en raison de la complexité de la chaîne énergétique mobilisée et de l’opacité entretenue par les principaux géants du web, la connaissance des ordres de grandeurs suivants est instructive.

Une requête d’environ 400 tokens sur ChatGPT / GPT-4o mini (modèle à 35 milliards de paramètres) consomme environ 2 Wh [1] d’électricité (ou 2 g de CO2 rejeté) [2], soit plus de 6 fois la consommation d’une recherche Google classique estimée à 0,3 Wh [3]. Pour un modèle moins frugal tel que Meta / Llama 3.1 405B (405 milliards de paramètres) une requête d’environ 400 tokens consomme 55 Wh (équivalent à 55 g de CO2 émis) !
La création d’une image en haute définition par une IA consomme autant d’énergie que la recharge complète d’un téléphone portable.
Les centres de données (data centers) liés à l’IA et aux crypto-monnaies ont consommé près de 460 TWh (460×1012 Wh) d’électricité en 2022, soit environ 2% de la production mondiale. De nombreux experts s’accordent à dire que ce pourcentage aura vraisemblablement doublé d’ici 2026 [4].

Tableau comparant l’impact énergétique de deux modèles d’IA (source www.comparia.beta.gouv.fr)

L’apprentissage profond et l’inférence sont énergivores

Les LLM (Large Language Model) des IA génératives s’appuient sur des réseaux profonds de neurones artificiels qui essaient d’imiter les processus en jeu dans le cerveau humain. L’entraînement [5] (Deep learning) et l’inférence [6] des réseaux profonds de neurones artificiels nécessitent une puissance de calcul considérable afin de traiter un nombre colossal de données (Big Data). Ces calculs sont assurés par des processeurs GPU (Graphics Processing Unit) [7] spécifiques dédiés aux IA génératives tel que le « Nvidia A100 tensor core GPU » dont la puissance électrique consommée est de 250 W et dont le prix dépasse les 10 000 euros. Ces GPU ultraperformants et très haut de gamme dérivent de ceux présents dans les cartes graphiques des « PC gamer » utilisés par les joueurs de jeux vidéo.

À titre d’exemple, il a fallu 2048 GPU A100 pour entraîner en février 2023 pendant 23 jours le modèle d’IA générative LLaMA 1 propulsé par le géant du web Meta.

Les modèles déployés à grande échelle, comme ceux utilisés dans des applications comme les assistants vocaux (Siri, Alexa) ou les services de recommandation, nécessitent des ressources de calcul permanentes qui consomment de l’énergie électrique en continu.

L’IA est très loin de l’optimisation énergétique réalisée par le cerveau humain

Le cerveau est composé d’environ 86 milliards de neurones. Chaque neurone est connecté en moyenne à environ 2 000 autres par des connexions appelées synapses. Le cerveau humain contient donc environ 172 000 milliards de synapses dont chacune d’entre elles peut effectuer « un calcul » élémentaire plusieurs centaines de fois par seconde [8]. D’une manière très simplifiée, on peut donc estimer que la puissance de calcul de l’ensemble du cerveau humain est donc d’environ 17,2×1015 OPS [9], c’est-à-dire dix-sept millions deux cent mille milliards d’opérations par seconde pour une puissance consommée de 20 W équivalente à celle d’une lampe à LED !

À titre de comparaison l’un des fleurons des processeurs GPU, le « NvidiaA100 Tensor Core GPU » utilisé par beaucoup de modèles d’IA génératives, a une puissance brute de calcul d’environ 19,5×1012 OPS ce qui, en terme d’ordre de grandeur, revient à un millième de celle du cerveau humain pour une puissance consommée de 250 W !

Le cerveau humain a une puissance brute de calcul 1000 fois plus grande que celle du meilleur processeur GPU actuel pour une puissance consommée 10 fois plus faible !

Pour reprendre l’exemple des 2048 Nvidia A100 Tensor Core GPU nécessaires, par exemple, pour l’entraînement du modèle LLaMA 1de Meta en 2023, l’écart avec les performances énergétiques d’un cerveau humain devient abyssal. Pour une puissance brute de calcul du même ordre de grandeur que celle du cerveau humain, la puissance consommée par l’IA de Meta est 25 600 fois plus importante ! N’oublions pas également qu’une IA est spécialisée dans un domaine bien précis (générer des textes, des images...) alors que le cerveau humain est par essence multitâche.
Nous sommes donc très loin du mythe du grand remplacement des humains par les IA, tant d’un point de vue des performances, que de la puissance consommée.

Pour exécuter une seule tâche spécialisée (générer un texte, une image...) et pour arriver à une puissance brute de calcul du même ordre de grandeur que celle d’un cerveau humain, la puissance consommée par une IA est environ 25 000 fois plus grande ! Contrairement à une IA générative, le cerveau humain est résolument multitâche et est une merveille d’optimisation énergétique.

Comparer le coût énergétique et environnemental des grands modèles de langage

Le simulateur en ligne EcoLogits s’appuie sur une bibliothèque Python qui permet de comparer la consommation d’énergie et l’empreinte environnementale liées à l’utilisation des grands modèles de langage d’IA génératives lors de la phase d’inférence par le biais d’API.

Cet outil est développé et maintenu par GenAI Impact, organisation à but non lucratif dédiée à l’évaluation et à la mise en évidence de l’empreinte environnementale des technologies d’IA générative.

[1] Un wattheure (symbole Wh) est une unité physique correspondant à l’énergie consommée ou délivrée par un système d’une puissance de 1 Watt fonctionnant pendant une heure.

[2] Cela correspond à 35 min de fonctionnement d’une ampoule LED ou 3 min de visionnage d’une vidéo en ligne. Notons que la conversion Wh équivalent CO2 dépend fortement du mix énergétique nécessaire à l’alimentation en électricité des fermes de serveurs dédiées à l’IA. Elle varie donc fortement d’un pays à un autre.

[3] Cette différence peut s’expliquer facilement par le fait que les IA génératives ne se contentent pas d’extraire des informations existantes, mais génèrent de nouvelles données via un processus beaucoup plus énergivore.

[4] Article à consulter.

[5] La phase d’entraînement d’une IA générative consiste à exécuter une multitude d’itérations de manière cyclique à partir d’un nombre considérable de données en entrée afin qu’en sortie la prédiction se rapproche le plus possible du résultat attendu. Le processus d’apprentissage d’un réseau profond de neurones artificiels repose sur le réglage automatisé de centaines de milliards de paramètres via, par exemple, un processus de rétropropagation par descente de gradient. Une fois entraîné, le réseau de neurones est prêt à être utilisé.

[6] Durant la phase d’inférence, le réseau de neurones artificiels est alimenté par des données réelles qui ne figurent généralement pas dans son jeu initial de données d’entraînement. Néanmoins, si la phase d’apprentissage s’est déroulée correctement, il devrait être en capacité de fournir une bonne réponse aussi souvent que possible.

[7] Les GPU (Graphics Processing Unit) sont préférés aux CPU (Central Processing Units) pour les applications d’intelligence artificielle en raison de leur capacité à effectuer des calculs parallèles d’une manière massive, ce qui est essentiel pour les algorithmes de « deep learning » qui reposent sur des opérations matricielles complexes d’algèbre linéaire. Contrairement aux CPU, conçus pour gérer des tâches diversifiées mais séquentielles, les GPU possèdent des milliers de cœurs (cores) optimisés pour exécuter simultanément de nombreuses tâches élémentaires. Ils offrent également une meilleure bande passante mémoire et sont largement pris en charge par les bibliothèques (frameworks) Python d’IA comme TensorFlow et PyTorch, ce qui permet d’entraîner des modèles beaucoup plus rapidement et de manière plus efficace.

[8] Article à consulter sur Wikipédia.

[9] OPS : Opérations Par Seconde.

Dans la même rubrique

De quels facteurs dépend la consommation énergétique des IAG ?

Quels sont les principaux facteurs influençant la consommation énergétique des IA génératives ?

IA et environnement

Vers des IA et des usages plus éco-responsables ?

L'IA, un nouveau défi environnemental

IA et environnement

Les acteurs

Une équipe à vos cotés

Les ressources à votre disposition

Un réseau fait pour vous

Des partenaires à vos côtés

Les enjeux

2 priorités

S’informer

Évènements

Évènements

Les brèves nationales

Les brèves nationales

Les news des éditeurs

Les news des éditeurs

Les pépites pédagogiques

Les pépites pédagogiques

Se former

L’offre de formation

En autoformation

Les mini séries de la Drane

Recherche

Enseigner

Au quotidien

Au quotidien

En projet

En projet

En expérimentation

IA et environnement

Pourquoi une IA générative consomme-t-elle autant d’énergie ?

Une IA energivore

Quelques chiffres clés à avoir en tête

L’apprentissage profond et l’inférence sont énergivores

L’IA est très loin de l’optimisation énergétique réalisée par le cerveau humain

Comparer le coût énergétique et environnemental des grands modèles de langage

Dans la même rubrique

De quels facteurs dépend la consommation énergétique des IAG ?

Vers des IA et des usages plus éco-responsables ?

AB

AB

Les enjeux

2 priorités

S’informer

Enseigner

En expérimentation

IA et environnement

Pourquoi une IA générative consomme-t-elle autant d’énergie ?

Une IA energivore

Quelques chiffres clés à avoir en tête

Tableau comparant l’impact énergétique de deux modèles d’IA (source www.comparia.beta.gouv.fr) - Transciption

L’apprentissage profond et l’inférence sont énergivores

L’IA est très loin de l’optimisation énergétique réalisée par le cerveau humain

Comparer le coût énergétique et environnemental des grands modèles de langage

Dans la même rubrique

AB

AB