+ Ambas compañías anunciaron una solución conjunta que permite reducir hasta 61% el tiempo para generar el primer token y un 34% la latencia de solicitudes, en comparación con las soluciones tradicionales de balanceo de carga._
Ciudad de México
30/03/2026
F5, empresa de seguridad y servicios de aplicaciones multinube, anunció la expansión de su colaboración estratégica con NVIDIA con el objetivo de acelerar y optimizar la infraestructura de inferencia de inteligencia artificial (IA), en un momento clave para empresas en México que buscan monetizar sus inversiones en IA.
La integración de F5 BIG-IP Next para Kubernetes con las Unidades de Procesamiento de Datos (DPUs) NVIDIA BlueField-3 introduce una nueva capa de infraestructura inteligente basada en telemetría en tiempo real, que permite mejorar el rendimiento de tokens —las unidades fundamentales para generar contenido por IA—, así como optimizar el uso de Unidades de Procesamiento Gráfico (GPUs) y reducir la latencia en entornos de alta demanda.
En el contexto actual, donde organizaciones y proveedores de GPU como servicio (GPUaaS) compiten por escalar soluciones rentables, la llamada “economía de tokens” se ha convertido en un indicador muy importante. Métricas como el rendimiento sostenido, el Tiempo Hasta el Primer Token (Time To First Token o TTFT), el costo por token y los ingresos por GPU son ahora factores determinantes para el éxito.
Infraestructura inteligente para maximizar el valor de la IA
La nueva solución conjunta incorpora capacidades avanzadas de enrutamiento consciente de la inferencia, utilizando estadísticas de NVIDIA, señales de ejecución y telemetría de GPU para asignar cargas de trabajo en tiempo real al acelerador más adecuado. Esto permite maximizar la eficiencia operativa, reducir reprocesos y mejorar la utilización sostenida de la infraestructura.
De acuerdo con Kunal Anand, Director de Producto de F5, la infraestructura de IA ha evolucionado hacia un modelo donde el rendimiento económico por acelerador es clave, permitiendo a las organizaciones gestionar los tokens como una métrica de negocio.
Resultados comprobados que impactan costos y desempeño
Pruebas independientes realizadas por The Tolly Group, una empresa independiente de validación de pruebas, reportó mejoras en la infraestructura optimizada con la solución conjunta:
• Hasta 40% más en el rendimiento de tokens
• 61% menos tiempo para generar el primer token (TTFT)
• 34% de reducción en la latencia total
Estos avances se logran al trasladar funciones como redes, cifrado y balanceo de carga hacia las DPUs NVIDIA BlueField-3, liberando recursos de CPU y permitiendo que las GPU se concentren en tareas de inferencia de alto rendimiento, sin necesidad de modificar los modelos existentes.
Preparada para la nueva generación de IA basada en agentes
La solución también responde a la evolución hacia cargas de trabajo impulsadas por agentes de IA, que demandan mayor contexto, persistencia y control dinámico del tráfico. Entre sus capacidades destacan el enrutamiento inteligente, la integración con NVIDIA DOCA Platform Framework, el soporte para entornos multi-tenant y funciones integradas de seguridad, gobernanza y observabilidad.
Estas características permiten a empresas mexicanas y proveedores de servicios compartir infraestructura de GPU de manera segura, manteniendo niveles de servicio consistentes y facilitando la expansión de servicios de IA.
Hacia fábricas de IA más rentables y escalables
Con esta evolución, F5 y NVIDIA posicionan a BIG-IP Next para Kubernetes como un recurso de control estratégico para la economía de fábricas de IA, que permite a las organizaciones optimizar recursos existentes, incrementar el retorno de inversión y escalar operaciones sin sobreaprovisionar infraestructura.
Ambas compañías coinciden en que estos avances permitirán transformar las fábricas de IA en plataformas altamente eficientes y monetizables, preparadas para sostener el crecimiento en la nueva era de la inteligencia artificial basada en agentes.

