Alquiler de GPU, el punto intermedio entre comprar infraestructura y pagar por tokens

La entrevista con Luis Martín López Baraldini, High Tech Director Latam en Oracle, expone un cambio silencioso pero decisivo en la economía de la inteligencia artificial: un modelo de acceso a cómputo que busca equilibrar control, escala y previsibilidad, sin caer ni en el Capex tradicional ni en el pago por tokens.

Luis Martin (chiky) Lopez Baraldini
Luis Martin Lopez Baraldini, High Tech Director Latam at Oracle

Durante los primeros años de adopción de inteligencia artificial, muchas empresas resolvieron el problema del cómputo de dos maneras opuestas. Algunas apostaron por comprar infraestructura propia, asumiendo fuertes inversiones iniciales y ciclos rápidos de obsolescencia. Otras se volcaron al consumo de modelos vía API, pagando por tokens procesados y delegando por completo el control del backend. Hoy, ambos esquemas empiezan a mostrar límites claros.

El alquiler de GPU se presenta como una tercera vía: acceder a capacidad de cómputo dedicada, de alto rendimiento, bajo esquemas flexibles y con visibilidad directa sobre costos y performance.

“No es comprar infraestructura, pero tampoco pagar por cada token. Es contratar capacidad real de cómputo, con control directo sobre cómo y cuándo se usa”, explicó Luis Martín López Baraldini, High Tech Director Latam en Oracle, a El País.

Del Capex al cómputo previsible

El problema del Capex (gasto de capital, por su sigla en inglés) no es solo financiero. Comprar GPU implica planificar a varios años en un contexto donde la tecnología cambia en meses. A eso se suma la dificultad de dimensionar correctamente la capacidad necesaria y de sostenerla cuando la demanda crece de forma irregular.

El modelo de pago por tokens, en cambio, simplifica la adopción inicial, pero traslada el problema al largo plazo. Cuando los modelos pasan a producción y la inferencia se vuelve constante, los costos crecen de forma poco transparente y difícil de anticipar.

El entrenamiento se hace una vez. La inferencia corre todos los días. Ahí es donde las empresas empiezan a sentir el impacto real en sus costos

El alquiler de GPU apunta a resolver ese desbalance: permite planificar capacidad, escalar cuando el negocio lo necesita y reducir incertidumbre financiera, sin inmovilizar capital en activos físicos.

¿Cómo se contrata hoy la infraestructura de IA?

Modelo
Qué se paga
Ventajas
Limitaciones
Capex (infraestructura propia)
Compra de hardware
Control total sobre datos y cómputo
Alta inversión inicial, obsolescencia
Pago por tokens / API
Uso lógico del modelo
Rápida adopción
Costos imprevisibles, dependencia
Alquiler de GPU
Capacidad de cómputo dedicada
Previsibilidad, control, escalabilidad
Requiere gestión técnica

Inferencia y fine-tuning: donde se concentra el gasto

Uno de los puntos centrales de la entrevista es el cambio en el tipo de cargas de trabajo que impulsan el negocio de la IA. Si bien el entrenamiento de grandes modelos sigue siendo relevante, el crecimiento más fuerte se da en la adaptación de modelos existentes y en su ejecución en tiempo real.

Muchas empresas no crean modelos desde cero. Los ajustan a mercados locales, a nichos específicos, y los ponen a funcionar en producción. Eso exige infraestructura disponible todo el tiempo

Ese uso continuo vuelve crítica la disponibilidad de GPU, la baja latencia y la posibilidad de escalar sin fricción, especialmente en soluciones que interactúan directamente con usuarios finales.

El acuerdo con NVIDIA y la disponibilidad de cómputo

El modelo de arrendamiento solo es viable si existe acceso sostenido a hardware de última generación. En un mercado marcado por la escasez global de GPU, el acuerdo estratégico entre Oracle y NVIDIA aparece como un habilitador clave.

La integración permite no solo incorporar nuevas GPU al ecosistema, sino también actualizar las ya desplegadas y distribuir capacidad en distintas regiones, algo fundamental para cumplir con regulaciones y requisitos de soberanía de datos.

“No siempre el cliente necesita el tope de línea. Muchas veces necesita la GPU correcta, en el lugar correcto y al costo correcto”, resumió López Baraldini.

Más allá del hardware: el nuevo rol del proveedor de IA

De cara a los próximos 12 a 24 meses, el ejecutivo anticipa que el acceso al cómputo tenderá a normalizarse. En ese escenario, el valor ya no estará solo en la potencia, sino en la capacidad de integrar infraestructura, seguridad, cumplimiento y modelos de consumo claros.

“Cuando el cómputo se vuelve commodity, el diferencial pasa por la confianza y la capacidad de acompañar a las empresas en todo el ciclo de adopción de IA”, sostiene.

El alquiler de GPU se consolida así como una respuesta estructural a una nueva etapa de la inteligencia artificial: menos experimental, más industrial y cada vez más condicionada por la economía del cómputo.

¿Encontraste un error?

Reportar

Te puede interesar