¿Cuánta energía consume realmente cada consulta a ChatGPT y otras IA? Grok tuvo la mayor huella de carbono al entrenarse

La pantalla de un iPhone, fotografiada a corta distancia, muestra cuatro iconos de aplicaciones de asistentes de IA dispuestos en una cuadrícula de dos por dos en San Ferdinando di Puglia, Italia, el 17 de mayo de 2026. Las aplicaciones visibles incluyen Claude de Anthropic, ChatGPT de OpenAI, Gemini de Google y Grok de xAI. El reloj del teléfono marca las 15:10. La imagen ofrece una visión general de las principales aplicaciones de chatbots con IA generativa dirigidas al consumidor disponibles en plataformas móviles a fecha de mayo de 2026. — El entrenamiento de Grok 4 disparó una huella de carbono récord, mientras modelos como Mistral Medium 3 reducen emisiones en el uso diario. (MATTEO DELLA TORRE/NurPhoto via AFP)

‌

‌
‌

‌

La carrera por desarrollar modelos de inteligencia artificial más grandes también disparó el costo ambiental de la industria. El AI Index Report 2026 de Stanford documentó diferencias extremas entre sistemas que consumen decenas de miles de toneladas de carbono y otros que logran operar con niveles mucho más bajos de emisiones.

El contraste más evidente aparece en Grok 4. El modelo desarrollado por xAI registró la mayor huella de carbono reportada hasta ahora durante su entrenamiento: 72.816 toneladas de dióxido de carbono equivalente (CO₂eq). La cifra supera ampliamente a Grok 3, con 59.200 toneladas, y deja atrás a otros modelos de referencia como Llama 3.1 405B, con 8.930 toneladas, y GPT-4, con 5.184 toneladas.

El costo ambiental de entrenar IA

El reporte de Stanford muestra que el crecimiento de los modelos elevó de forma acelerada las emisiones asociadas al entrenamiento. Hace poco más de una década, sistemas como AlexNet generaban apenas 0,01 toneladas de CO₂eq. Hoy, los modelos más avanzados operan en otra escala.

La dimensión de Grok 4 explica parte de ese salto. El sistema cuenta con 3 billones de parámetros, lo que incrementa las necesidades de procesamiento y energía durante su desarrollo. Según el informe, su entrenamiento contaminó más de 120 veces que DeepSeek v3, pese a que ambos pertenecen a la misma categoría (modelos de gran tamaño).

DeepSeek v3 se convirtió en uno de los casos más llamativos del reporte. Aunque compite con sistemas de alto rendimiento, solo generó 597 toneladas de CO₂eq durante su entrenamiento. Stanford atribuye esas diferencias a tres factores: la eficiencia del hardware utilizado, la duración total del entrenamiento y la procedencia de la electricidad que alimenta los centros de datos.

La infraestructura energética también influye. El reporte señala que la capacidad eléctrica requerida por los centros de datos de inteligencia artificial alcanzó 29,6 gigavatios (GW) a finales de 2025, una demanda equivalente al pico máximo de consumo eléctrico del estado de Nueva York.

Cuando usar la IA contamina más que entrenarla

El estudio advierte que el impacto ambiental no termina cuando el modelo queda listo. La fase de inferencia —el momento en que la IA responde consultas de usuarios— puede acumular más consumo energético que el entrenamiento original en cuestión de meses.

En esta etapa, DeepSeek V3.2 Exp y DeepSeek V3.2 aparecen como los sistemas más contaminantes por consulta. Cada prompt mediano genera cerca de 14 gramos de CO₂eq.

En contraste, Mistral Medium 3 lidera como el modelo más eficiente en inferencia, con apenas 1,5 gramos de CO₂eq por consulta. Claude 4 Opus registra 1,6 gramos y GPT-5 mini (medium) ronda los 1,75 gramos.

La diferencia no es menor. Los modelos más eficientes consumen entre cinco y nueve veces menos energía que los sistemas más demandantes. Mientras DeepSeek V3.2 Exp puede requerir unos 23 vatios-hora (Wh) por interacción, Claude 4 Opus y GPT-5 mini consumen entre 5 y 6 Wh.

El reporte también identifica una paradoja en DeepSeek. Aunque DeepSeek v3 destacó por su bajo impacto ambiental durante el entrenamiento, sus versiones desplegadas para uso cotidiano terminaron entre las más contaminantes en inferencia.

IA, agua y centros de datos

El informe de Stanford también incorpora el consumo hídrico dentro de la discusión ambiental. El agua resulta esencial para enfriar los centros de datos que sostienen la infraestructura de inteligencia artificial.

En el caso de GPT-4o, el reporte estima que solo la inferencia consume entre 1,3 y 1,6 millones de unidades equivalentes de agua al año, un volumen que supera las necesidades anuales de agua potable de 12 millones de personas.

Parte importante de esa demanda proviene del enfriamiento. De los 29,6 GW requeridos por la infraestructura de IA, los chips representan 11,8 GW. El resto corresponde a sistemas de refrigeración, redes y otros componentes de los centros de datos.

La presión sobre recursos hídricos y energéticos se intensifica conforme aumenta el número de consultas. Una sesión diaria de ocho prompts medianos equivale aproximadamente a cargar dos teléfonos inteligentes completos.

Más consumo que una búsqueda en Google

Stanford también comparó el gasto energético de la IA frente a herramientas digitales tradicionales. Una búsqueda simple en Google consume cerca de 0,3 Wh. Una consulta corta en GPT-4o requiere alrededor de 0,42 Wh, un 40% más.

El informe concluye que el crecimiento de la inteligencia artificial ya no depende únicamente de la capacidad de los modelos, sino también de qué tan eficiente resulta la infraestructura que los sostiene. La diferencia entre sistemas muestra que aumentar potencia no necesariamente implica elevar emisiones, aunque la tendencia general de la industria sigue empujando el consumo energético hacia niveles inéditos.

¿Cuánta energía consume realmente cada consulta a ChatGPT y otras IA? Grok tuvo la mayor huella de carbono al entrenarse

El ‘AI Index Report 2026′ de Stanford revela brechas extremas en el impacto ambiental de la inteligencia artificial

‌

El costo ambiental de entrenar IA

Cuando usar la IA contamina más que entrenarla

IA, agua y centros de datos

Más consumo que una búsqueda en Google

Jailine González Gómez