KYUTAI INAUGURA IL PRIMO LABORATORIO DI RICERCA SULL’Intelligenza Artificiale IN EUROPA
Kyutai è il primo laboratorio di ricerca indipendente sull’intelligenza artificiale in Europa, inaugurato a Parigi il 17 novembre 2023. Progetto senza scopo di lucro e con un’anima aperta, Kyutai ha come obiettivo primario quello di democratizzare l’IA attraverso tool che siano pubblicamente disponibili e accessibili.
Secondo i fondatori, l’Europa ha tutte le carte in regola per far sentire la sua voce nella corsa all’intelligenza artificiale, grazie alla potenza di calcolo disponibile e al dinamico ecosistema IA. Dal canto suo, Kyutai mira a fornire modelli di IA affidabili e ad alte prestazioni per l’intero ecosistema europeo.
MOSHI È L’INTELLIGENZA ARTIFICIALE CHE SEMBRA MOSTRARE EMOZIONI E UN COMPORTAMENTO PIÙ UMANO
Proprio in queste ore, Kyutai ha presentato Moshi, un rivoluzionario modello multimodale che lavora e fornisce risposte in tempo reale. Sebbene sia ancora suscettibile di notevoli migliorie, il modello appena svelato supera per certi versi anche GPT-4o di OpenAI, presentato a maggio 2024.
Moshi è un chatbot vocale progettato per comprendere ed esprimere emozioni, in grado di parlare in diverse lingue. Il sistema speech-to-text mantenuto costantemente in esecuzione, ascolta le richieste dell’utente e genera audio mantenendo un flusso conversazionale continuo. Una delle caratteristiche più sorprendenti di Moshi è la sua capacità di gestire contemporaneamente due flussi audio, consentendo all’IA di ascoltare e parlare simultaneamente.
COME PROVARE SUBITO UN BOTTA E RISPOSTA VOCALE CON IL CHATBOT MOSHI
Vi suggeriamo, innanzi tutto, di guardarvi la dimostrazione del funzionamento di Moshi pubblicata in questo Video su Youtube. Come si vede il “botta e risposta” tra i responsabili di Kyutai e Moshi è istantaneo. Addirittura, molto spesso le voci si accavallano – come succede spesso in una normale conversazione tra umani -. Eppure, Moshi mantiene sempre dritte “le antenne”: è in grado di fermarsi e integrare quanto affermato con le osservazioni o le richieste aggiuntive pervenute a valle del riconoscimento vocale.
Potete anche voi provare Moshi puntando il Browser su questa pagina. Per iniziare, basta digitare un indirizzo email nell’apposito campo quindi cliccare il pulsante Join queue. Utilizzando l’inglese, potete rendervi conto delle abilità del sistema.
Sicurezza ED ETICA
Kyutai è consapevole dei rischi associati con l’uso improprio delle tecnologie di intelligenza artificiale vocale, come la possibilità di creare contenuti audio fraudolenti o manipolatori.
Il futuro di Moshi
Kyutai ha piani ambiziosi per Moshi. In primis, il team di sviluppo prevede di pubblicare un report tecnico e versioni del modello aperte, inclusi il codice di inferenza, il modello 7B, il codec audio e l’intero stack ottimizzato. Le future iterazioni di Moshi affineranno il modello sulla base dei feedback ricevuti dagli utenti. La licenza mira a essere il più permissiva possibile, favorendo l’adozione diffusa e l’innovazione. Il modello multimodale appena svelato apre nuove vie per l’assistenza alla ricerca, il brainstorming, l’apprendimento linguistico e altro ancora, dimostrando il potere trasformativo dell’IA.