Durante los primeros años de adopción de inteligencia artificial, muchas empresas resolvieron el problema del cómputo de dos maneras opuestas. Algunas apostaron por comprar infraestructura propia, asumiendo fuertes inversiones iniciales y ciclos rápidos de obsolescencia. Otras se volcaron al consumo de modelos vía API, pagando por tokens procesados y delegando por completo el control del backend. Hoy, ambos esquemas empiezan a mostrar límites claros.
El alquiler de GPU se presenta como una tercera vía: acceder a capacidad de cómputo dedicada, de alto rendimiento, bajo esquemas flexibles y con visibilidad directa sobre costos y performance.
“No es comprar infraestructura, pero tampoco pagar por cada token. Es contratar capacidad real de cómputo, con control directo sobre cómo y cuándo se usa”, explicó Luis Martín López Baraldini, High Tech Director Latam en Oracle, a El País.
Del Capex al cómputo previsible
El problema del Capex (gasto de capital, por su sigla en inglés) no es solo financiero. Comprar GPU implica planificar a varios años en un contexto donde la tecnología cambia en meses. A eso se suma la dificultad de dimensionar correctamente la capacidad necesaria y de sostenerla cuando la demanda crece de forma irregular.
El modelo de pago por tokens, en cambio, simplifica la adopción inicial, pero traslada el problema al largo plazo. Cuando los modelos pasan a producción y la inferencia se vuelve constante, los costos crecen de forma poco transparente y difícil de anticipar.
El entrenamiento se hace una vez. La inferencia corre todos los días. Ahí es donde las empresas empiezan a sentir el impacto real en sus costos
El alquiler de GPU apunta a resolver ese desbalance: permite planificar capacidad, escalar cuando el negocio lo necesita y reducir incertidumbre financiera, sin inmovilizar capital en activos físicos.
¿Cómo se contrata hoy la infraestructura de IA?
| Modelo | Qué se paga | Ventajas | Limitaciones |
| Capex (infraestructura propia) | Compra de hardware | Control total sobre datos y cómputo | Alta inversión inicial, obsolescencia |
| Pago por tokens / API | Uso lógico del modelo | Rápida adopción | Costos imprevisibles, dependencia |
| Alquiler de GPU | Capacidad de cómputo dedicada | Previsibilidad, control, escalabilidad | Requiere gestión técnica |
Inferencia y fine-tuning: donde se concentra el gasto
Uno de los puntos centrales de la entrevista es el cambio en el tipo de cargas de trabajo que impulsan el negocio de la IA. Si bien el entrenamiento de grandes modelos sigue siendo relevante, el crecimiento más fuerte se da en la adaptación de modelos existentes y en su ejecución en tiempo real.
Muchas empresas no crean modelos desde cero. Los ajustan a mercados locales, a nichos específicos, y los ponen a funcionar en producción. Eso exige infraestructura disponible todo el tiempo
Ese uso continuo vuelve crítica la disponibilidad de GPU, la baja latencia y la posibilidad de escalar sin fricción, especialmente en soluciones que interactúan directamente con usuarios finales.
El acuerdo con NVIDIA y la disponibilidad de cómputo
El modelo de arrendamiento solo es viable si existe acceso sostenido a hardware de última generación. En un mercado marcado por la escasez global de GPU, el acuerdo estratégico entre Oracle y NVIDIA aparece como un habilitador clave.
La integración permite no solo incorporar nuevas GPU al ecosistema, sino también actualizar las ya desplegadas y distribuir capacidad en distintas regiones, algo fundamental para cumplir con regulaciones y requisitos de soberanía de datos.
“No siempre el cliente necesita el tope de línea. Muchas veces necesita la GPU correcta, en el lugar correcto y al costo correcto”, resumió López Baraldini.
Más allá del hardware: el nuevo rol del proveedor de IA
De cara a los próximos 12 a 24 meses, el ejecutivo anticipa que el acceso al cómputo tenderá a normalizarse. En ese escenario, el valor ya no estará solo en la potencia, sino en la capacidad de integrar infraestructura, seguridad, cumplimiento y modelos de consumo claros.
“Cuando el cómputo se vuelve commodity, el diferencial pasa por la confianza y la capacidad de acompañar a las empresas en todo el ciclo de adopción de IA”, sostiene.
El alquiler de GPU se consolida así como una respuesta estructural a una nueva etapa de la inteligencia artificial: menos experimental, más industrial y cada vez más condicionada por la economía del cómputo.