Europa Tiene Mucho que Decir en el Desarrollo de la IA: Moshi es uno de sus Mejores Argumentos

Kyutai, una startup francesa respaldada por grandes nombres del mundo tecnológico y financiero, ha lanzado Moshi, un asistente de IA que puede hablar y escuchar en tiempo real, algo similar a lo que prometió OpenAI con GPT-4 pero que ha tenido que retrasar.

Por Qué es Importante

Moshi representa un salto en la IA conversacional al ofrecer capacidades que OpenAI todavía no ha podido implementar. Junto a Mistral, representa el creciente papel europeo en la carrera de la IA.

El Contexto

Kyutai fue fundada en noviembre de 2023 con una inversión de 300 millones de euros para entrar en la carrera de la IA con un enfoque claro: código abierto y transparencia. La empresa cuenta con el apoyo de varios destacados líderes:

  • Xavier Niel: Multimillonario francés y fundador de Iliad, una teleco.
  • Rodolphe Saadé: Multimillonario franco-libanés y CEO de CMA CGM, gigante del transporte marítimo.
  • Eric Schmidt: Expresidente ejecutivo de Google e inversor tecnológico.
  • Patrick Pérez: CEO de Kyutai, exdirector de Valeo, proveedor de fabricantes de coches con más de un siglo de antigüedad.
  • Hervé Jégou: Director científico de Kyutai, antiguo miembro de Google DeepMind y Meta.

Las Claves de Moshi

  • Emociones y Estilos: Capaz de expresar 70 emociones y estilos diferentes.
  • Procesamiento Simultáneo: Genera audio y texto de forma simultánea, permitiendo “pensar mientras habla”.
  • Baja Latencia: Funciona en tiempo casi real con una latencia de 200 milisegundos.
  • Modelo Helium: Usa un modelo de lenguaje de 7.000 millones de parámetros.
  • Accesibilidad: Puede ejecutarse en un ordenador para el público general.

Tras la Tecnología

Helium y Moshi han sido entrenados con 100,000 conversaciones sintéticas “de estilo oral” y 20 horas de audio de una actriz de voz llamada “Alice”. Las creaciones de Moshi incorporan una marca de agua que indica que es contenido generado por una IA, abordando preocupaciones éticas y de seguridad.

Los Próximos Pasos

Kyutai busca equilibrar la innovación con la seguridad, un desafío constante para los proyectos de IA. Su enfoque de código abierto puede acelerar su adopción y fomentar la innovación.

  • Código Abierto: Kyutai planea liberar el código fuente, el modelo de 7.000 millones de parámetros, el códec de audio y el stack completo.
  • Actualizaciones: Las versiones futuras (1.1, 1.2 y 2.0) refinarán el modelo basado en el feedback de los usuarios.
  • Licencia Permisiva: La empresa busca una licencia lo más permisiva posible para fomentar la adopción y la innovación generalizada.

En Perspectiva

Moshi representa un gran avance en IA conversacional y en el equilibrio de poder en el mundo de la tecnología. Con el respaldo de figuras influyentes y un enfoque en transparencia y código abierto, Kyutai está bien posicionada para desafiar el dominio de Silicon Valley y colocar a Europa como un jugador importante en el futuro de la IA.

admin

Un partido revolucionario, si en verdad está empeñado en hacer y dirigir la revolución no puede renunciar al legítimo derecho de ser o formar parte de la vanguardia histórica que en efecto haga y dirija la revolución socialista en nuestro país, es de hipócritas decir que se lucha sin aspirar a tomar el poder y mucho más aún si se pretende desarrollar lucha diciendo que no busca ser vanguardia cuando en los hechos se actúa en esa dirección.

Ver más
Relacionados
La misión Psyche: NASA explora un asteroide rico en metales preciosos

La NASA ha alcanzado un nuevo hito en la exploración espacial con el lanzamiento de la misión Psyche, cuyo objetivo …

La carrera por el 6G: el futuro de la conectividad global

Mientras el mundo apenas comienza a adoptar las capacidades del 5G, los líderes tecnológicos y gobiernos ya están mirando hacia …

El auge de las motocicletas de mediana cilindrada: una tendencia que acelera

En los últimos años, las motocicletas de mediana cilindrada han experimentado un notable auge en el mercado, impulsado por una …