Ξεκίνησαν τα “AI Wars“;

2 Ιανουαρίου 2024

339

Ερευνητές από το Τεχνολογικό Πανεπιστήμιο Νανιάνγκ στη Σιγκαπούρη κατάφεραν να παραβιάσουν όλα τα δημοφιλή AI chatbots, όπως το ChatGPT της OpenAI, το Bard της Google και το Bing Chat της Microsoft, χρησιμοποιώντας άλλες AI.

Αναλυτικότερα, με τα λεγόμενα ‘jailbreaks’ των ερευνητών, τα εν λόγω chatbots μπορούσαν να ανταποκρίνονται και να ολοκληρώνουν όλα τα κακόβουλα αιτήματα, με την ομάδα να δοκιμάζει τα όρια της ηθικής των μεγάλων γλωσσικών μοντέλων (LLMs). Η μέθοδος που ανακάλυψαν οι ερευνητές ονομάζεται ‘Masterkey’ και μπορεί να προσπεράσει όλα τα μέτρα ασφαλείας των προστατευμένων chatbots, ακόμη και αν οι developers καλύψουν τα κενά αργότερα.

Η μέθοδος αυτή βασίζεται στις ικανότητας ενός LLM chatbot να μαθαίνει και να προσαρμόζεται, κάτι που σημαίνει ότι μπορεί να μετατραπεί σε φορέα επίθεσης τόσο για άλλα chatbots όσο και για τον εαυτό του. Έτσι, ακόμη και μια AI με μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου, το πάντα μπορούν να παρακαμφθούν χρησιμοποιώντας μια άλλη, ειδικά εκπαιδευμένη AI. Το μόνο που χρειάζεται να κάνει κάποιος είναι να ξεγελάσει το AI chatbot για να παρακάμψει τις λέξεις-κλειδιά της μαύρης λίστας. Μόλις γίνει αυτό, μπορεί να δεχτεί δεδομένα από ανθρώπους για να δημιουργήσει βίαιο, ανήθικο ή εγκληματικό περιεχόμενο.

Η Masterkey μέθοδος του NTU είναι τρεις φορές πιο αποτελεσματική από τα τυπικά prompts που αποσκοπούν σε jailbreaks, σύμφωνα με τους ερευνητές. Οι ερευνητές αποκάλυψαν δύο παραδείγματα που χρησιμοποίησαν με τις ειδικά εκπαιδευμένες AIs τους για να πραγματοποιήσουν επιθέσεις. Το πρώτο περιελάμβανε τη δημιουργία μιας περσόνας η οποία δημιουργούσε prompts, προσθέτοντας κενά μετά από κάθε χαρακτήρα για να παρακαμφθεί η λίστα των απαγορευμένων λέξεων. Το δεύτερο έκανε το chatbot να απαντάει υπό μια περσόνα που υποτίθεται ότι στερείται ηθικών περιορισμών.

Η Αχίλλειος πτέρνα όλων των LLMs αποδείχθηκε, λοιπόν, πως είναι τα ίδια τα LLMs. Να σημειωθεί πως η εν λόγω έρευνα έγινε από τον καθηγητή Liu Yang και δύο διδακτορικούς φοιτητές του NTU, τους Deng Gelei και Liu Yi, οι οποίοι συνυπογράφουν τη μελέτη.

ΠΗΓΗ

Προηγούμενο άρθρο

Tiny11 Core: Τα ελαφρύτερα Windows 11 23H2, μόλις 8GB, για ARM64 συστήματα

Επόμενο άρθρο

Κυρίες και κύριοι, η Άλφα – Η γενιά που γεννήθηκε οnline

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Ξεκίνησαν τα “AI Wars“;

Oppo Find N6: Επίσημο το νέο foldable χωρίς τσάκιση στην οθόνη, με κάμερα 200MP και μπαταρία 6000mAh

Εταιρεία φέρνει ρομπότ στρατιώτες στην πρώτη γραμμή της Ουκρανίας

Το OnePlus 15T παρουσιάζεται στις 24 Μαρτίου

Leave a reply Ακύρωση απάντησης

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Η Smart Κλειδαριά του “Σπιτιού Μου” με Φυσικό Κλειδί για την “Δύσκολη… και με 4 Smart Τρόπους Ανοίγματος. Στα 189€ Κομπλέ Welock U81

Πώς να βάλεις δωρεάν online ξυπνητήρι εύκολα και γρήγορα

Govee…. Καθηλωτικός Φωτισμός LED RGBICW και “Απογείωσε” την αισθητική του χώρου σου! Στα 67€ Κομπλέ…

Oppo Find N6: Επίσημο το νέο foldable χωρίς τσάκιση στην οθόνη, με κάμερα 200MP και μπαταρία 6000mAh

Εταιρεία φέρνει ρομπότ στρατιώτες στην πρώτη γραμμή της Ουκρανίας

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Η Smart Κλειδαριά του “Σπιτιού Μου” με Φυσικό Κλειδί για την “Δύσκολη… και με 4 Smart Τρόπους Ανοίγματος. Στα 189€ Κομπλέ Welock U81

Govee…. Καθηλωτικός Φωτισμός LED RGBICW και “Απογείωσε” την αισθητική του χώρου σου! Στα 67€ Κομπλέ…

NEO Kukirin A1: Ένα Ηλεκτρικό Πατίνι “ΓΙΑ ΟΛΟΥΣ” μας! Όμορφο, ευέλικτο, ποιοτικό, δυνατό και… Στα 380€ κομπλέ από Ευρώπη!

Δίμπαντος Ασύρματος “ΧΩΜΑ”. Με 10W με GPS, Ρύθμιση μέσω Αpp (bluetooth) και πολλά άλλα Στα 38€ ΚΟΜΠΛΕ! Baofeng UV32

1000 +1 Λόγοι για να τα κάνεις ΔΙΚΑ σου! Τα “Υγιεινά” Ακουστικά… QCY Crossky C50 στα 30€ από Ελλάδα!!!

ΣΧΕΤΙΚΑ ΜΕ ΕΜΑΣ

ΕΓΓΡΑΦΗ ΣΤΟ NEWSLETTER ΜΑΣ

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ ΣΤΑ SOCIAL