21.6 C
Athens
Δευτέρα, 17 Νοεμβρίου 2025

Ξεκίνησαν τα “AI Wars“;

Ερευνητές από το Τεχνολογικό Πανεπιστήμιο Νανιάνγκ στη Σιγκαπούρη κατάφεραν να παραβιάσουν όλα τα δημοφιλή AI chatbots, όπως το ChatGPT της OpenAI, το Bard της Google και το Bing Chat της Microsoft, χρησιμοποιώντας άλλες AI.

Αναλυτικότερα, με τα λεγόμενα ‘jailbreaks’ των ερευνητών, τα εν λόγω chatbots μπορούσαν να ανταποκρίνονται και να ολοκληρώνουν όλα τα κακόβουλα αιτήματα, με την ομάδα να δοκιμάζει τα όρια της ηθικής των μεγάλων γλωσσικών μοντέλων (LLMs). Η μέθοδος που ανακάλυψαν οι ερευνητές ονομάζεται ‘Masterkey’ και μπορεί να προσπεράσει όλα τα μέτρα ασφαλείας των προστατευμένων chatbots, ακόμη και αν οι developers καλύψουν τα κενά αργότερα.

Η μέθοδος αυτή βασίζεται στις ικανότητας ενός LLM chatbot να μαθαίνει και να προσαρμόζεται, κάτι που σημαίνει ότι μπορεί να μετατραπεί σε φορέα επίθεσης τόσο για άλλα chatbots όσο και για τον εαυτό του. Έτσι, ακόμη και μια AI με μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου, το πάντα μπορούν να παρακαμφθούν χρησιμοποιώντας μια άλλη, ειδικά εκπαιδευμένη AI. Το μόνο που χρειάζεται να κάνει κάποιος είναι να ξεγελάσει το AI chatbot για να παρακάμψει τις λέξεις-κλειδιά της μαύρης λίστας. Μόλις γίνει αυτό, μπορεί να δεχτεί δεδομένα από ανθρώπους για να δημιουργήσει βίαιο, ανήθικο ή εγκληματικό περιεχόμενο.

Η Masterkey μέθοδος του NTU είναι τρεις φορές πιο αποτελεσματική από τα τυπικά prompts που αποσκοπούν σε jailbreaks, σύμφωνα με τους ερευνητές. Οι ερευνητές αποκάλυψαν δύο παραδείγματα που χρησιμοποίησαν με τις ειδικά εκπαιδευμένες AIs τους για να πραγματοποιήσουν επιθέσεις. Το πρώτο περιελάμβανε τη δημιουργία μιας περσόνας η οποία δημιουργούσε prompts, προσθέτοντας κενά μετά από κάθε χαρακτήρα για να παρακαμφθεί η λίστα των απαγορευμένων λέξεων. Το δεύτερο έκανε το chatbot να απαντάει υπό μια περσόνα που υποτίθεται ότι στερείται ηθικών περιορισμών.

Η Αχίλλειος πτέρνα όλων των LLMs αποδείχθηκε, λοιπόν, πως είναι τα ίδια τα LLMs. Να σημειωθεί πως η εν λόγω έρευνα έγινε από τον καθηγητή Liu Yang και δύο διδακτορικούς φοιτητές του NTU, τους Deng Gelei και Liu Yi, οι οποίοι συνυπογράφουν τη μελέτη.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Ηλεκτρικά αυτοκίνητα: Σύντομα θα φορτίζουν… εν κινήσει

Ένα πιλοτικό έργο ξεκινά στον αυτοκινητόδρομο A6 κοντά στο Αμπεργκ της Γερμανίας, το οποίο θα μπορούσε να φέρει την επανάσταση στην οδήγηση. Εχει να...

Disney Plus: Φέρνει AI που επιτρέπει στους συνδρομητές να φτιάχνουν δικά τους short βίντεο

Η Disney ανακοίνωσε ότι το Disney Plus περνά στη μεγαλύτερη τεχνολογική αναβάθμιση από την ημέρα που πρωτοκυκλοφόρησε και η σημαντικότερη αλλαγή αφορά την προσθήκη...

Starlink: Και επισήμως με 400Mbps+ στην Ελλάδα για οικιακούς

Το Starlink άρχισε να στέλνει τα πρώτα ενημερωτικά μηνύματα για τα νέα πακέτα που διέθεσε στην ελληνική αγορά. Tο πιο ενδιαφέρον όμως στοιχείο είναι, κατά...

To OnePlus 15 διαθέσιμο στην Ευρώπη! Αυτές είναι οι τιμές για τη χώρα μας

Πριν δύο εβδομάδες η OnePlus είχε αρχίσει τις προσφορές για τα early birds που ήταν κάπως διαφορετικά από ότι συνήθως. Η εταιρεία ζητούσε από...

Το Spotify προσθέτει περιλήψεις για ηχητικά βιβλία – Xωρίς spoilers

Το Spotify δοκιμάζει μια νέα λειτουργία που στοχεύει να κάνει την επιστροφή στα ηχητικά βιβλία πιο εύκολη και ευχάριστη. Η υπηρεσία streaming εισάγει ανακεφαλαιώσεις περιεχομένου, δηλαδή σύντομες...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Σε ΤΙΜΕΣ Black Friday… 4 “ΤΣΑΜΠΑ” Δοκιμασμένα και ΚΟΡΥΦΑΙΑ Must HAVE κι από Ευρώπη

Όλα εδώ ένα - ένα και με την σειρά... όπως θα τα βρεις στο βίντεο αλλά κι όπως τα είχαμε πει τότε... https://www.tiktok.com/@unpackman.review/video/7572314571847912726?is_from_webapp=1&sender_device=pc&web_id=7311648037818091041 Teendow C5 500W Πραγματικά...

Το Πιο “Εξελιγμένο” TURBO FAN που έχεις δει… Στα 25€ ΚΟΜΠΛΕ! το Υπερπολυχρηστικό Fiizeal H28

Είναι μικρά είναι δυνατά και χρήσιμα. Είναι τα πλέον πολύ γνωστά σε όλους μας Turbo ή Jet Fan's και πλέον μπορείς να τα αποκτήσεις...

Πιο “ΔΥΝΑΤΟ” από Apple M1 Max!? Στα 515€ ΚΟΜΠΛΕ!!! 16άρι Laptop 2.5K στα 165Hz, με Intel Core i9-13900HK 32GB Ram, 1TB NVMe, Windows 11...

Με ίδιο επεξεργαστή και οθόνη θα χρειαστείς περίπου 1200€ εδώ στην Ελλάδα... και με λιγότερα χαρακτηριστικά από το Ninkear N16 Pro που έχουμε εδώ...

Wanbo Vali 1: Ο ΚΑΛΥΤΕΡΟΣ Προτζέκτορας Κάτω από τα 200€… ΑΡΚΕΙ ΝΑ ΞΕΡΕΙΣ. Στα 189€ ΚΟΜΠΛΕ

Είναι από τους πιο πολύ-διαφημισμένους προτζέκτορες στην Ελλάδα... Στα είπαν όλα όμως;; Εγώ Θα σου πω εδώ 2 ξεκάθαρες κουβέντες. ΝΑΙ είναι Ο ΚΑΛΥΤΕΡΟΣ Προτζέκτορας...

Πέρα από τη Δροσιά: Τι Πραγματικά Προσφέρει ένα Σύγχρονο Κλιματιστικό Haier

Όταν αποφασίζουμε να αγοράσουμε ένα κλιματιστικό, η σκέψη μας συνήθως περιστρέφεται γύρω από μία και μόνο ανάγκη: τον έλεγχο της θερμοκρασίας. Το καλοκαίρι θέλουμε...
Μετάβαση στο περιεχόμενο