ALTERNATIVE A ChatGPT OPEN SOURCE: COSA SONO E COME FUNZIONANO
La disponibilità di risorse Hardware specializzate, utili per portare a termine la fase di addestramento dei modelli generativi, ha permesso a vari soggetti di “confezionare” i loro LLM (Large Language Model). Oltre a OpenAI, lo hanno fatto le aziende di più grandi dimensioni, realtà commerciali come Google, Meta, Microsoft (che ha uno stretto legame con OpenAI), Amazon, Samsung e via dicendo ma hanno iniziato a guardare nella stessa direzione anche realtà meno conosciute. Tanto da far dire a qualche esperto che i modelli generativi open source supereranno quelli di OpenAI e Google.
I francesi di Mistral AI, ad esempio, hanno addestrato il loro modello generativo open source Mistral 7b avvalendosi delle risorse del supercomputer Leonardo, in forze presso il consorzio CINECA (Tecnopolo di Bologna). Il risultato è un modello generativo “aperto” che può essere utilizzato anche per finalità commerciali.
In ogni caso, come abbiamo spiegato, una cosa è il chatbot, un’altra il modello sottostante. Il chatbot è l’implementazione specifica e ad alto livello di un modello generativo che abilita l’interazione con gli utenti. Mentre il modello generativo può generare testo in modo autonomo, il chatbot utilizza questo modello per rispondere alle domande degli utenti, fornire informazioni ed eseguire compiti.
I MOTIVI PER GUARDARE A SOLUZIONI CHATGPT ALTERNATIVE
Oltre ai modelli generativi che rivaleggiano con OpenAI GPT, esistono anche veri e propri chatbot alternativi a ChatGPT. In altre parole, vari soggetti hanno via via realizzato prodotti open source progettati per dialogare con i modelli più noti, performanti ed efficaci. Anch’essi altrettanto aperti.
Rispetto alle soluzioni commerciali che tutti conosciamo (come ChatGPT, Bing Chat e “soci”), i chatbot open source possono assicurare una maggiore trasparenza sulle modalità con cui sono gestiti i dati degli utenti. Sono inoltre personalizzabili in modo approfondito e svincolati dalle politiche di una singola azienda.
OpenChat
Tra i chatbot open source “pronti per l’uso” non è possibile non iniziare con OpenChat. È un progetto di ricerca che ha come obiettivo quello di sviluppare un’Intelligenza Artificiale conversazionale, adatta per essere utilizzata da parte di chiunque. Il progetto è basato sull’utilizzo di modelli di apprendimento automatico e di intelligenza artificiale per creare un’IA che possa interagire con gli utenti in modo naturale e flessibile, utilizzando un linguaggio comprensibile e argomentazioni pertinenti.
OpenChat sfrutta un modello generativo presentato per la prima volta a novembre 2023. Utilizza “soltanto” 7 miliardi di parametri (7B) ma riesce a superare le performance di ChatGPT in tanti benchmark.
Se OpenChat può essere utilizzato, da Browser, sotto forma di applicazione messa pubblicamente a disposizione dagli sviluppatori, la disponibilità del codice sorgente e la licenza d’uso consentono di eseguire il chatbot in locale, con la possibilità di integrarlo eventualmente nei propri progetti.
Nella pagina GitHub di OpenChat si trova l’elenco dei modelli generativi open source supportati dal Software e le istruzioni per procedere alla sua installazione. Il modo più semplice per adottare OpenChat sui propri sistemi, comunque, consiste nell’affidarsi a Ollama.
IL FRAMEWORK OLLAMA
Ollama è un framework leggero ed espandibile che fornisce un’API semplice per la creazione, l’esecuzione e la gestione di modelli linguistici, insieme a una libreria di modelli pre-costruiti che possono essere facilmente utilizzati in un’ampia varietà di contesti.
È progettato per eseguire i più noti ed apprezzati LLM in locale, consentendo agli utenti di personalizzare e utilizzare facilmente tali modelli. Ollama supporta un’ampia varietà di modelli (compreso il già citato OpenChat oltre a Mistral, LLaMa 2, Code LLaMa, Orca Mini e Vicuna) e fornisce un’interfaccia intuitiva (di base è a riga di comando) per l’interazione con essi.
Abbiamo visto in un altro approfondimento come usare Ollama per portare l’intelligenza artificiale e i modelli generativi, in modo semplice e veloce, sui propri sistemi.
GPT4ALL
GPT4All è in grado di eseguire diverse attività. Può ad esempio rispondere a domande più o meno specifiche, scrivere email, documenti, Storie, poesie, canzoni e opere teatrali. Può “comprendere” il contenuto dei documenti e crearne dei riassunti, fornire assistenza nella scrittura del codice di Programmazione in vari linguaggi.
L’installazione e l’utilizzo di GPT4All sono semplici tanto quanto il download e l’installazione di un’applicazione dedicata, sui sistemi Windows, Ubuntu Linux e macOS. Il sorgente di GPT4All è disponibile su GitHub.