La infraestructura en la nube de 1.000 millones de euros de Voltage Park apunta a la escasez de computación de aprendizaje automático

por Infoblock

En un ambicioso esfuerzo por cerrar la brecha informática de ML (aprendizaje automático), Voltage Park presentó una formidable infraestructura en la nube para el desarrollo de IA el 29 de octubre de 2023. El escenario actual del mercado se ve afectado por una grave escasez de recursos informáticos avanzados de ML, con empresas emergentes, investigadores y grandes laboratorios de inteligencia artificial que compiten por adquirir o arrendar los últimos chips para el entrenamiento de aprendizaje automático. Esta escasez, que sólo favorece a quienes cuentan con buenos recursos, sofoca significativamente la innovación en todos los ámbitos.

Eric Park, director ejecutivo de Voltage Park, subrayó los impactos adversos de esta escasez de computación en los innovadores de IA y afirmó: «Los equipos de aprendizaje automático y los fundadores de IA tienen que esperar meses o pagar sumas exorbitantes para acceder al último hardware para entrenar sus modelos. Esperamos corregir este desequilibrio y acelerar el trabajo de vanguardia en IA».

Navegando por el atolladero de la computación ML

El mercado de la computación ML se enfrenta a numerosos desafíos:

Contratos a largo plazo: la mayoría de los proveedores imponen contratos rígidos, lo que obliga a las empresas a arrendar grandes clústeres de computación durante varios años, un escenario que está lejos de ser ideal para entidades más pequeñas que desean más flexibilidad.

Disponibilidad: Los plazos de entrega extendidos para quienes pueden comprar los mantienen esperando mientras los competidores avanzan.

Costo: Las altas tarifas de alquiler de GPU de los principales proveedores de nube a menudo se vuelven prohibitivas para las empresas emergentes y los laboratorios de investigación, más aún para los equipos absortos en modelos más grandes donde la eficiencia de costos es crucial.

Revelando la extensión de nubes de Voltage Park

Considerada entre las nubes de computación de aprendizaje automático más grandes del mundo, la infraestructura de Voltaje Park, valorada en la friolera de mil millones de euros, abarca aproximadamente 24.000 GPU NVIDIA H100. Los clústeres, equipados con GPU H100 SXM5 de 80 GB, están completamente interconectados con InfiniBand 3.2T, ofreciendo inicialmente acceso básico para usuarios a gran escala que necesitan el máximo rendimiento. La hoja de ruta incluye ampliar el soporte para arrendamientos a corto plazo y facturación por horas, además de incorporar herramientas como Slurm, Kubernetes y Mosaic para una integración perfecta en los marcos de capacitación existentes.

Voltage Park, una subsidiaria del Navigation Fund fundada por el cofundador de Ripple, Jed McCaleb, ya ha iniciado servicios para destacadas empresas de IA como Imbue y está en las etapas de finalización para otros líderes de IA como Character.ai y Atomic AI. Está previsto que toda la capacidad informática esté operativa a principios del próximo año.

Kanjun Qiu, director ejecutivo de Imbue, elogió a Voltage Park por facilitar un acceso más rápido a recursos informáticos cruciales, reforzando así sustancialmente el rendimiento del entrenamiento de su modelo.

A medida que la infraestructura continúa desarrollándose, Voltage Park solicita comentarios de clientes potenciales para adaptar los clústeres a una gran variedad de casos de uso, que van desde la experimentación, la capacitación, el ajuste hasta la inferencia.

Fuente de la imagen: Shutterstock

TAMBIÉN PUEDE INTERESARTE