Emocionante eficiencia de la IA: la combinación de modelos más pequeños supera a las grandes contrapartes

por Infoblock

En los últimos años, el campo de la IA conversacional se ha visto significativamente influenciado por modelos como ChatGPT, caracterizados por sus amplios tamaños de parámetros. Sin embargo, este enfoque conlleva demandas sustanciales de recursos computacionales y memoria. Un estudio introduce ahora un concepto novedoso: combinar múltiples modelos de IA más pequeños para lograr o superar el rendimiento de modelos más grandes. Este enfoque, denominado “Blending”, integra múltiples IA de chat, ofreciendo una solución eficaz a los desafíos computacionales de los modelos grandes.

TOFU: Cómo la IA puede olvidar sus datos de privacidadTOFU: Cómo la IA puede olvidar sus datos de privacidad

La investigación, realizada durante treinta días con una gran base de usuarios en la plataforma de investigación Chai, muestra que la combinación de modelos más pequeños específicos puede potencialmente superar o igualar las capacidades de modelos mucho más grandes, como ChatGPT. Por ejemplo, integrar solo tres modelos con parámetros 6B/13B puede rivalizar o incluso superar las métricas de rendimiento de modelos sustancialmente más grandes como ChatGPT con parámetros 175B+.

La creciente dependencia de modelos de lenguaje grande (LLM) previamente entrenados para diversas aplicaciones, particularmente en IA de chat, ha llevado a un aumento en el desarrollo de modelos con una gran cantidad de parámetros. Sin embargo, estos grandes modelos requieren una infraestructura especializada y tienen importantes gastos de inferencia, lo que limita su accesibilidad. El enfoque Blended, por otro lado, ofrece una alternativa más eficiente sin comprometer la calidad de la conversación.

El BIS avanza en tecnología en finanzas: iniciativas cuánticas, de inteligencia artificial y ecológicas para 2024El BIS avanza en tecnología en finanzas: iniciativas cuánticas, de inteligencia artificial y ecológicas para 2024

La eficacia de la IA combinada es evidente en sus tasas de participación y retención de usuarios. Durante las pruebas A/B a gran escala en la plataforma CHAI, los conjuntos combinados, compuestos por tres LLM de 6-13 mil millones de parámetros, superaron al ChatGPT de más de 175 mil millones de parámetros de OpenAI, logrando una retención y participación de usuarios significativamente mayores. Esto indica que los usuarios encontraron que las IA de chat combinado eran más atractivas, entretenidas y útiles, y al mismo tiempo requerían solo una fracción del costo de inferencia y la sobrecarga de memoria de los modelos más grandes.

La metodología del estudio implica un ensamblaje basado en principios estadísticos bayesianos, donde la probabilidad de una respuesta particular se conceptualiza como una expectativa marginal tomada sobre todos los parámetros plausibles de IA de chat. Blended selecciona aleatoriamente la IA del chat que genera la respuesta actual, lo que permite que diferentes IA del chat influyan implícitamente en el resultado. Esto da como resultado una combinación de las fortalezas de la IA del chat individual, lo que genera respuestas más cautivadoras y diversas.

Canadá endurece las regulaciones de criptoactivos para fondos de inversión públicaCanadá endurece las regulaciones de criptoactivos para fondos de inversión pública

Los avances en las tendencias de IA y aprendizaje automático para 2024 enfatizan el avance hacia modelos de IA más prácticos, eficientes y personalizables. A medida que la IA se integra más en las operaciones comerciales, existe una creciente demanda de modelos que satisfagan necesidades específicas y ofrezcan mayor privacidad y seguridad. Este cambio se alinea con los principios básicos del enfoque combinado, que enfatiza la eficiencia, la rentabilidad y la adaptabilidad.

En conclusión, el método Blended representa un avance significativo en el desarrollo de la IA. Al combinar varios modelos más pequeños, ofrece una solución eficiente y rentable que retiene y, en algunos casos, mejora la participación y retención de los usuarios en comparación con modelos más grandes y que consumen más recursos. Este enfoque no sólo aborda las limitaciones prácticas de la IA a gran escala, sino que también abre nuevas posibilidades para las aplicaciones de la IA en diversos sectores.

La financiación de 100 millones de euros de 1X, respaldada por OpenAI, allana el camino para la revolución de los robots domésticosLa financiación de 100 millones de euros de 1X, respaldada por OpenAI, allana el camino para la revolución de los robots domésticos

Fuente de la imagen: Shutterstock

Content Protection by DMCA.com

TAMBIÉN PUEDE INTERESARTE