Ξεκίνησαν τα “AI Wars“;

Ερευνητές από το Τεχνολογικό Πανεπιστήμιο Νανιάνγκ στη Σιγκαπούρη κατάφεραν να παραβιάσουν όλα τα δημοφιλή AI chatbots, όπως το ChatGPT της OpenAI, το Bard της Google και το Bing Chat της Microsoft, χρησιμοποιώντας άλλες AI.

Αναλυτικότερα, με τα λεγόμενα ‘jailbreaks’ των ερευνητών, τα εν λόγω chatbots μπορούσαν να ανταποκρίνονται και να ολοκληρώνουν όλα τα κακόβουλα αιτήματα, με την ομάδα να δοκιμάζει τα όρια της ηθικής των μεγάλων γλωσσικών μοντέλων (LLMs). Η μέθοδος που ανακάλυψαν οι ερευνητές ονομάζεται ‘Masterkey’ και μπορεί να προσπεράσει όλα τα μέτρα ασφαλείας των προστατευμένων chatbots, ακόμη και αν οι developers καλύψουν τα κενά αργότερα.

Η μέθοδος αυτή βασίζεται στις ικανότητας ενός LLM chatbot να μαθαίνει και να προσαρμόζεται, κάτι που σημαίνει ότι μπορεί να μετατραπεί σε φορέα επίθεσης τόσο για άλλα chatbots όσο και για τον εαυτό του. Έτσι, ακόμη και μια AI με μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου, το πάντα μπορούν να παρακαμφθούν χρησιμοποιώντας μια άλλη, ειδικά εκπαιδευμένη AI. Το μόνο που χρειάζεται να κάνει κάποιος είναι να ξεγελάσει το AI chatbot για να παρακάμψει τις λέξεις-κλειδιά της μαύρης λίστας. Μόλις γίνει αυτό, μπορεί να δεχτεί δεδομένα από ανθρώπους για να δημιουργήσει βίαιο, ανήθικο ή εγκληματικό περιεχόμενο.

Η Masterkey μέθοδος του NTU είναι τρεις φορές πιο αποτελεσματική από τα τυπικά prompts που αποσκοπούν σε jailbreaks, σύμφωνα με τους ερευνητές. Οι ερευνητές αποκάλυψαν δύο παραδείγματα που χρησιμοποίησαν με τις ειδικά εκπαιδευμένες AIs τους για να πραγματοποιήσουν επιθέσεις. Το πρώτο περιελάμβανε τη δημιουργία μιας περσόνας η οποία δημιουργούσε prompts, προσθέτοντας κενά μετά από κάθε χαρακτήρα για να παρακαμφθεί η λίστα των απαγορευμένων λέξεων. Το δεύτερο έκανε το chatbot να απαντάει υπό μια περσόνα που υποτίθεται ότι στερείται ηθικών περιορισμών.

Η Αχίλλειος πτέρνα όλων των LLMs αποδείχθηκε, λοιπόν, πως είναι τα ίδια τα LLMs. Να σημειωθεί πως η εν λόγω έρευνα έγινε από τον καθηγητή Liu Yang και δύο διδακτορικούς φοιτητές του NTU, τους Deng Gelei και Liu Yi, οι οποίοι συνυπογράφουν τη μελέτη.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

To “Elgato του Φτωχού”?! Με 78€ Γίνε ο Βασιλιάς του Multitasking και απογειώσε την αποδοτικότητα σου… (βίντεο)

Ο τίτλος πραγματικά τα λέει όλα και σε μια τιμή που είναι 3 φορές πιο κάτω από κάτι αντίστοιχο... Με τρελή παραμετροποίηση και δυνατότητες πραγματικά...

Mission 1: Αυτές είναι οι νέες κάμερες της GoPro!

Η GoPro ανακοίνωσε μια νέα σειρά από κάμερες, οι οποίες αναμένονται μέσα στη χρονιά με τις ονομασίες Mission 1, Mission 1 Pro, και Mission 1 Pro ILS....

Νέα desktop εφαρμογή Google για Windows με AI Mode, Lens και αναζήτηση σε αρχεία

Η Google κυκλοφόρησε παγκοσμίως, στα αγγλικά, την αναβαθμισμένη εφαρμογή Google για desktop σε Windows, δίνοντας στους χρήστες άμεση πρόσβαση στην Αναζήτηση Google από τον...

AirPods Pro 3: Η αναβάθμιση που βοηθά να μην τα χάσεις για πάντα

Κοινό μυστικό είναι πλέον το γεγονός ότι τα AirPods Pro χάνονται εύκολα. Η νέα γενιά έρχεται με σημαντική αναβάθμιση στη θήκη φόρτισης, η οποία...

Sony Xperia 1 VIII στην FCC: Wi-Fi 7, 3.5mm jack και κυκλοφορία νωρίτερα

Ένα νέο Sony smartphone με κωδικό μοντέλου PY7-30515Z εμφανίστηκε στη βάση δεδομένων της αμερικανικής FCC, σύμφωνα με αναφορές του The Walkman Blog στις 13...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

To “Elgato του Φτωχού”?! Με 78€ Γίνε ο Βασιλιάς του Multitasking και απογειώσε την αποδοτικότητα σου… (βίντεο)

Ο τίτλος πραγματικά τα λέει όλα και σε μια τιμή που είναι 3 φορές πιο κάτω από κάτι αντίστοιχο... Με τρελή παραμετροποίηση και δυνατότητες πραγματικά...

“Θα βάλλεις Γυαλιά”!!! Τραβάνε Βίντεο, Φωτογραφίες… σου Απαντάνε Στα Ελληνικά με Chat GPT. Στα 53€ ΚΟΜΠΛΕ… Zeblaze Eyewear AI

Για την "Ιστορία" ΑΚΡΙΒΩΣ τα ΙΔΙΑ στην Ελλάδα θα τα βρεις 100€!!! Έχοντας κάτι τέτοιο στα χέρια σου είναι απίθανο να πιστέψεις πόσο οικονομικά μπορείς...

Πληκτρολόγια Razer! Το Παλιό μου είναι Best Seller… και τo Νέο Θα μου φτιάξει το Setup μου…. Razer Joro και Ornata V3 X (Βίντεο)

Αν δεν το έχεις ήδη καταλάβει το 90% των πραγμάτων που βλέπεις στο κανάλι είναι προσωπικές επιλογές και σχεδόν ποτέ... κάτι δεν αξίζει και...

H “Dyson του Φτωχού”!!! Click Bait ή ΑΛΗΘΕΙΑ;;; Ίσως η πιο Δυνατή ασύρματη σκούπα που μπορείς να πάρεις με 88€ ΚΟΜΠΛΕ! (Βίντεο)

Με 55KPA δύναμης αναρρόφησης έχει την δύναμη να σηκώσει βάρος 1,6 κιλών και λίγες (ειδικά σε αυτήν την κατηγορία τιμής) μπορούν να το κάνουν! Με...

Φορητό Ψυγείο τέρας… 55Lt που πιάνει -30° C για… “ΠΛΑΚΑ” Δικό σου ΧΘΕΣ… Στα 171€ ΚΟΜΠΛΕ!!! Foursun 55lt Refrigerator με BT και…. (βίντεο)

Ενημέρωση 04/04/2026 και ώρα 22:45 τα πρώτα κουπόνια (έκπτωσης 20€) τα εξαφανίσατε. Βάλτε κουπόνι CDOF05 στα 13€ έκπτωση!!! Και 35Lt στα 149€ και 45Lt στα...