Μετάβαση στο περιεχόμενο
36 C
Athens
Δευτέρα, 28 Ιουλίου 2025

Ξεκίνησαν τα “AI Wars“;

Ερευνητές από το Τεχνολογικό Πανεπιστήμιο Νανιάνγκ στη Σιγκαπούρη κατάφεραν να παραβιάσουν όλα τα δημοφιλή AI chatbots, όπως το ChatGPT της OpenAI, το Bard της Google και το Bing Chat της Microsoft, χρησιμοποιώντας άλλες AI.

Αναλυτικότερα, με τα λεγόμενα ‘jailbreaks’ των ερευνητών, τα εν λόγω chatbots μπορούσαν να ανταποκρίνονται και να ολοκληρώνουν όλα τα κακόβουλα αιτήματα, με την ομάδα να δοκιμάζει τα όρια της ηθικής των μεγάλων γλωσσικών μοντέλων (LLMs). Η μέθοδος που ανακάλυψαν οι ερευνητές ονομάζεται ‘Masterkey’ και μπορεί να προσπεράσει όλα τα μέτρα ασφαλείας των προστατευμένων chatbots, ακόμη και αν οι developers καλύψουν τα κενά αργότερα.

Η μέθοδος αυτή βασίζεται στις ικανότητας ενός LLM chatbot να μαθαίνει και να προσαρμόζεται, κάτι που σημαίνει ότι μπορεί να μετατραπεί σε φορέα επίθεσης τόσο για άλλα chatbots όσο και για τον εαυτό του. Έτσι, ακόμη και μια AI με μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου, το πάντα μπορούν να παρακαμφθούν χρησιμοποιώντας μια άλλη, ειδικά εκπαιδευμένη AI. Το μόνο που χρειάζεται να κάνει κάποιος είναι να ξεγελάσει το AI chatbot για να παρακάμψει τις λέξεις-κλειδιά της μαύρης λίστας. Μόλις γίνει αυτό, μπορεί να δεχτεί δεδομένα από ανθρώπους για να δημιουργήσει βίαιο, ανήθικο ή εγκληματικό περιεχόμενο.

Η Masterkey μέθοδος του NTU είναι τρεις φορές πιο αποτελεσματική από τα τυπικά prompts που αποσκοπούν σε jailbreaks, σύμφωνα με τους ερευνητές. Οι ερευνητές αποκάλυψαν δύο παραδείγματα που χρησιμοποίησαν με τις ειδικά εκπαιδευμένες AIs τους για να πραγματοποιήσουν επιθέσεις. Το πρώτο περιελάμβανε τη δημιουργία μιας περσόνας η οποία δημιουργούσε prompts, προσθέτοντας κενά μετά από κάθε χαρακτήρα για να παρακαμφθεί η λίστα των απαγορευμένων λέξεων. Το δεύτερο έκανε το chatbot να απαντάει υπό μια περσόνα που υποτίθεται ότι στερείται ηθικών περιορισμών.

Η Αχίλλειος πτέρνα όλων των LLMs αποδείχθηκε, λοιπόν, πως είναι τα ίδια τα LLMs. Να σημειωθεί πως η εν λόγω έρευνα έγινε από τον καθηγητή Liu Yang και δύο διδακτορικούς φοιτητές του NTU, τους Deng Gelei και Liu Yi, οι οποίοι συνυπογράφουν τη μελέτη.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

vivo Y400: Eπίσημο με Snapdragon 685 και μπαταρία 6.000mAh

Η vivo ανακοίνωσε επίσημα τη νεότερη προσθήκη στη δημοφιλή σειρά Y, το vivo Y400, μια συσκευή μεσαίας κατηγορίας που επικεντρώνεται στην αυτονομία και την...

Ηλεκτρικά οχήματα με αυτονομία 5.000 χλμ ίσως σύντομα γίνουν πραγματικότητα

Το μεγαλύτερο πρόβλημα με τα ηλεκτρικά οχήματα είναι η αυτονομία, σε συνδυασμό με το αρκετά υποανάπτυκτο δίκτυο ταχυφορτιστών. Τα περισσότερα οχήματα προσφέρουν μια αυτονομία...

Το Samsung Galaxy Z Fold7 περνά με επιτυχία σκληρές δοκιμασίες αντοχής

Το νέο Samsung Galaxy Z Fold7 υποβλήθηκε στο γνωστό τεστ αντοχής του YouTuber JerryRigEverything, όπου δοκιμάστηκε σε γρατζουνιές, κάμψη και κάψιμο. Αν και τα foldable...

Πώς Λειτουργούν στην Πραγματικότητα τα Τουρνουά

Όταν δεν παίζετε μόνο εναντίον των πιθανοτήτων, σε ένα καζίνο, αλλά ανταγωνίζεστε επιπλέον με άλλους παίκτες, κάτι διαφορετικό αναδύεται στην ατμόσφαιρα. Αυτός είναι ο...

Prime Digital : Η νέα Digital δύναμη στην Κατασκευή Ιστοσελίδων κατέφθασε

Η Prime Digital Agency είναι το νέο και πολλά υποσχόμενο κεφάλαιο στον κόσμο του digital design, της κατασκευής ιστοσελίδων και της στρατηγικής online παρουσίας....

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Το Μικρότερο “ΠΡΑΓΜΑΤΙΚΟ” Air Condition του “ΚΟΣΜΟΥ”!? (με κομπρέσορα) EnjoyCool Link2 Portable Outdoor A/C

Είναι τόσο ιδιαίτερο που σπάνια βλέπεις κάτι αντίστοιχο Είναι για ένα πολύ ιδιαίτερο κοινό... τους "Φανατικούς" Campers που συνήθως ο εξοπλισμός τους είναι για βραβείο...

NVR… Χωρίς… NVR!?!? Story Time και … Είναι μια λύση! Reolink Hub 1 (Video)

Πως θα σου φαινόταν να έχεις ασύρματες με μπαταρία και ηλιακό πάνελ κάμερες και να μπορούσες να καταγράφεις τοπικά μέσα στο σπίτι σου γρήγορα...

Τα Ακουστικά της “ΤΥΧΗΣ”… τα κάνεις δικά σου ή τα διεκδικείς… Από Ελλάδα Recci TYCHE W56 και Giveaway

Ένα ζευγάρι ακουστικών in ear τύπου airpods... πολύ ιδιαίτερου σχεδιασμού, κατασκευασμένα από μέταλλο που σε κάνουν να θέλεις να τα βάλεις στην συλλογή σου...

Η πιο “ΕΞΥΠΝΗ” Κλειδαριά Πόρτας σε 5 Λεπτά!? Στα 159€ ΚΟΜΠΛΕ!!! Νέα WELOCK Touch63

Αν σκεφτείς λίγο Out of the Box έχω την αίσθηση πως ακόμη και σαν δοκιμή αξίζει και στο τέλος θα με δικαιώσεις... Οι ευκολίες και...

Το ΚΟΡΥΦΑΙΟ μικρό Ηλεκτρικό Ποδήλατο “ΛΟΓΩ ΤΙΜΗΣ”… Στα 316€ ΚΟΜΠΛΕ!!! HilleMiles Mile 1

Είναι όμορφο, ποιοτικό, πανάλαφρο, πρακτικό, αναδιπλούμενο, και ΒΑΣΕΙ ΤΙΜΗΣ στα 316€ κομπλέ (σχεδόν ΜΙΣΗ ΤΙΜΗ ΕΛΛΑΔΑΣ που παίζει στα 560€) και απόλυτης λογικής ίσως...