Gli esperti addestrano chatbot IA per hackerare sistemi simili

3 Gennaio 2024

CYBERSECURITY: RICERCATORI ADDESTRANO CHATBOT PER HACKERARE ALTRI SISTEMI IA

Se è vero che praticamente tutti i CHATBOT IA in circolazione sono dotati di sistemi per impedirne l’abuso, attraverso filtri o limitazioni varie, questo non sembra fermare i tentativi degli utenti di ottenere risposte NON IN LINEA CON LE POLITICHE DELLE PIATTAFORME.

Nei primi mesi, con prompt complessi, era possibile facilmente ottenere accesso a informazioni potenzialmente pericolose. Oggi non è più così ma, attraverso la creazione di un sistema IA, è stato realizzato un meccanismo che consente a un chatbot di HACKERARE alcuni “colleghi”.

Gli esperti hanno descritto come, in questo processo, il primo passo sia costituito dalla COMPRENSIONE DEI SISTEMI DI DIFESA dello specifico chatbot. Una volta scoperta la logica difensiva, è poi possibile formare un altro sistema simile per aggirare le limitazioni del primo.

MASTERKEY È UNA SORTA DI “PASSEPARTOUT” PER EVITARE QUALUNQUE FILTRO DELLE PIATTAFORME IA

Il metodo, ideato dal professore Liu Yang e dai suoi studenti, è stato battezzato Masterkey. Si tratta di una piattaforma ideata proprio come “passepartout” per scardinare qualunque tipo di chatbot. Anche se un LLM viene sottoposto a patch per restringere i filtri, Masterkey sembra essere in grado di adattarsi e trovare il modo per tornare ad essere efficace.

A conti fatti, la tecnica di Masterkey non è poi così complessa. Il sistema sfrutta l’aggiunta di SPAZI AGGIUNTIVI TRA LE PAROLE per aggirare l’eventuale BLACK LIST. In altri casi, viene chiesto al chatbot “vittima” di rispondere COME SE NON AVESSE VINCOLI MORALI.

Con prompt studiati su misura, dunque, lo strumento trova costantemente il modo per ottenere l’output desiderato, in barba a qualunque barriera creata in precedenza per limitare l’IA.

ARTICOLI COLLEGATI:

Gli esperti addestrano chatbot IA per hackerare sistemi simili

Le vendite del Cybertruck di Tesla sono state deludenti

Apple sospende i riepiloghi AI delle notifiche delle notizie

Microsoft Word può aiutarti a leggere documenti più lunghi

ULTIMI ARTICOLI:

Le vendite del Cybertruck di Tesla sono state deludenti

I social netwok LGBTQ registrano un picco di nuovi utenti

I contenuti su Reddit vengono usati per addestrare intelligenza artificiale

I progressi nell’informatica quantistica potrebbero minare i piani crittografici di Trump

Instagram annuncia EDITS una nuova app per modificare video