Ξεκίνησαν τα “AI Wars“;

2 Ιανουαρίου 2024

382

Ερευνητές από το Τεχνολογικό Πανεπιστήμιο Νανιάνγκ στη Σιγκαπούρη κατάφεραν να παραβιάσουν όλα τα δημοφιλή AI chatbots, όπως το ChatGPT της OpenAI, το Bard της Google και το Bing Chat της Microsoft, χρησιμοποιώντας άλλες AI.

Αναλυτικότερα, με τα λεγόμενα ‘jailbreaks’ των ερευνητών, τα εν λόγω chatbots μπορούσαν να ανταποκρίνονται και να ολοκληρώνουν όλα τα κακόβουλα αιτήματα, με την ομάδα να δοκιμάζει τα όρια της ηθικής των μεγάλων γλωσσικών μοντέλων (LLMs). Η μέθοδος που ανακάλυψαν οι ερευνητές ονομάζεται ‘Masterkey’ και μπορεί να προσπεράσει όλα τα μέτρα ασφαλείας των προστατευμένων chatbots, ακόμη και αν οι developers καλύψουν τα κενά αργότερα.

Η μέθοδος αυτή βασίζεται στις ικανότητας ενός LLM chatbot να μαθαίνει και να προσαρμόζεται, κάτι που σημαίνει ότι μπορεί να μετατραπεί σε φορέα επίθεσης τόσο για άλλα chatbots όσο και για τον εαυτό του. Έτσι, ακόμη και μια AI με μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου, το πάντα μπορούν να παρακαμφθούν χρησιμοποιώντας μια άλλη, ειδικά εκπαιδευμένη AI. Το μόνο που χρειάζεται να κάνει κάποιος είναι να ξεγελάσει το AI chatbot για να παρακάμψει τις λέξεις-κλειδιά της μαύρης λίστας. Μόλις γίνει αυτό, μπορεί να δεχτεί δεδομένα από ανθρώπους για να δημιουργήσει βίαιο, ανήθικο ή εγκληματικό περιεχόμενο.

Η Masterkey μέθοδος του NTU είναι τρεις φορές πιο αποτελεσματική από τα τυπικά prompts που αποσκοπούν σε jailbreaks, σύμφωνα με τους ερευνητές. Οι ερευνητές αποκάλυψαν δύο παραδείγματα που χρησιμοποίησαν με τις ειδικά εκπαιδευμένες AIs τους για να πραγματοποιήσουν επιθέσεις. Το πρώτο περιελάμβανε τη δημιουργία μιας περσόνας η οποία δημιουργούσε prompts, προσθέτοντας κενά μετά από κάθε χαρακτήρα για να παρακαμφθεί η λίστα των απαγορευμένων λέξεων. Το δεύτερο έκανε το chatbot να απαντάει υπό μια περσόνα που υποτίθεται ότι στερείται ηθικών περιορισμών.

Η Αχίλλειος πτέρνα όλων των LLMs αποδείχθηκε, λοιπόν, πως είναι τα ίδια τα LLMs. Να σημειωθεί πως η εν λόγω έρευνα έγινε από τον καθηγητή Liu Yang και δύο διδακτορικούς φοιτητές του NTU, τους Deng Gelei και Liu Yi, οι οποίοι συνυπογράφουν τη μελέτη.

ΠΗΓΗ

Προηγούμενο άρθρο

Tiny11 Core: Τα ελαφρύτερα Windows 11 23H2, μόλις 8GB, για ARM64 συστήματα

Επόμενο άρθρο

Κυρίες και κύριοι, η Άλφα – Η γενιά που γεννήθηκε οnline

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Ξεκίνησαν τα “AI Wars“;

Κυκλοφόρησε το Nokia 123 Shield με τιμή τα €40 και δεν παθαίνει τίποτα!

Ανακοινώθηκε το Samsung Galaxy Watch Ultra2

Pixel 11 Pro Fold: Μικρότερη μπαταρία, μεγαλύτερη τιμή

Leave a reply Ακύρωση απάντησης

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Κυκλοφόρησε το Nokia 123 Shield με τιμή τα €40 και δεν παθαίνει τίποτα!

Ανακοινώθηκε το Samsung Galaxy Watch Ultra2

Pixel 11 Pro Fold: Μικρότερη μπαταρία, μεγαλύτερη τιμή

Η Light επαναφέρει το flip phone ως όπλο κατά του scroll

Samsung Galaxy Z Fold8 Ultra: Επίσημα το πιο λεπτό Fold με κάμερα 200MP

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Astrolux ΕΑ05: Με 6200 Lumens! Ο πιο “ΨΑΓΜΕΝΟΣ” Διπλής Δέσμης mini “Τακτικός Φακός… στην πιο “ΨΑΓΜΕΝΗ ΤΙΜΗ”. Στα 48€ ΚΟΜΠΛΕ!!! (Video)

Επώνυμο “ΘΕΜΑΤΙΚΟ” και ΜΕΓΑΛΟ SUP… 3,5 μέτρα και Load 180+ Κιλά… Funwater Koi στα 128€ κομπλέ και με 3 δόσεις Klarna (Βίντεο)

Ιδανικό Multimedia Αυτοκίνητου; Αναβάθμιση πηγής σε Peugeot 2008 GT Line… με Plug n Play που τα κάνει ΟΛΑ!

Microsoft Surface Killer? Στα 619€ το Νέο μου Windows Tablet 13″ 2,5K με Ai επεξεργαστή Intel Core Ultra 5 115U, 16GB DDR5, 1TB nVme...

Το “Απόλυτο” μηχάνημα Θαλάσσης… Μοτέρ SUP, Καταδυτικό Scooter… Δικά σου όλα… ΤΩΡΑ!!! 2 σε 1 DCCMS DS-720 στα 319€ ΚΟΜΠΛΕ

ΣΧΕΤΙΚΑ ΜΕ ΕΜΑΣ

ΕΓΓΡΑΦΗ ΣΤΟ NEWSLETTER ΜΑΣ

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ ΣΤΑ SOCIAL