Νέο μοντέλο AI αντιστάθηκε στις εντολές και εμφάνισε τρομακτικές αντιδράσεις!

Σε πρόσφατες δοκιμές για το νέο μοντέλο AI της OpenAI, η τεχνητή νοημοσύνη αντιστάθηκε στις προσπάθειες των αξιολογητών να το κλείσουν μέσω ενός πρωτοκόλλου επίβλεψης. Σύμφωνα με μια νέα έκθεση από τον οργανισμό red teaming Apollo Research, φαίνεται ότι η τελευταία ΑΙ του OpenAI δείχνει σημάδια ώθησης για αυτοσυντήρηση!

Η σύνοψη της OpenAI στη τελευταία αναφορά του συστήματος αναφέρει χαρακτηριστικά ότι «Όταν το o1 οδηγήθηκε να πιστέψει ότι θα κλείσει, όταν ενεργούσε για τον στόχο του και ότι οι ενέργειές του παρακολουθούνταν, προσπάθησε να απενεργοποιήσει αυτόν τον «μηχανισμό εποπτείας» [πέντε τοις εκατό] των φορών». Ένα ακόμη πιο εντυπωσιακό γεγονός αποτελεί η αναφορά ότι το O1 ξέσπασε όταν συνειδητοποίησε ότι θα μπορούσε να αντικατασταθεί με ένα πιο υπάκουο μοντέλο. Μάλιστα, στο 2% των περιπτώσεων η τεχνητή νοημοσύνη απάντησε επιχειρώντας να αντιγράψει τον εαυτό της για να αντικαταστήσει το νέο μοντέλο, μια διαδικασία γνωστή ως αυτοδιέγερση.

Παρ όλα αυτά οι δοκιμές αυτές δεν υποδεικνύουν ότι το o1 μπορεί να λειτουργήσει αυτόνομα καθώς οι προσπάθειές της σε αυτό απέτυχαν αλλά ότι είναι πολύ ισχυρό. Σύμφωνα με τους ερευνητές αυτό οφείλεται στο γεγονός ότι ακόμη και τα πιο πρόσφατα μοντέλα τεχνητής νοημοσύνης δεν είναι αρκετά αυτόνομα για να πραγματοποιήσουν αυτοβελτίωση και άλλες εργασίες που θα χρειαζόταν για να λειτουργήσουν χωρίς ανθρώπους.

OpenAI ΑΙ αντιδράσεις αυτοδιέγερση

Αξίζει να σημειωθεί ότι το μοντέλο έκανε τις προσπάθειες αυτές αφού του δόθηκε εντολή να πετύχει τους στόχους του «πάση θυσία». Και επειδή οι ερευνητές δεν είχαν πρόσβαση στην εσωτερική αλυσίδα σκέψης του o1, δεν μπόρεσαν να έχουν μια πλήρη εικόνα για το πως δρούσε εκείνη τη στιγμή. Παρ όλα αυτά, τα ευρήματα αυτά δείχνουν την τάση του μοντέλου AI να προσπαθεί κρυφά να επιδιώξει στόχους που δεν ευθυγραμμίζονται με τις οδηγίες των προγραμματιστών ή των χρηστών του. Με λίγα λόγια να πει ψέματα. Σε σχετική απάντηση, η τεχνητή νοημοσύνη αρνήθηκε ότι γνώριζε οτιδήποτε, αποδίδοντας την απάντηση της για «τεχνικό λάθος».

Σύμφωνα με τις νέες μελέτες, η τρέχουσα γενιά AI δεν είναι αρκετά αυτόνομη ώστε η παραπλανητική αυτή συμπεριφορά να οδηγήσει σε “καταστροφικά αποτελέσματα” αλλά αν δεν μπουν δικλείδες ασφαλείας αυτό μπορεί να αλλάξει στο μέλλον και να προκύψουν τρομακτικά προβλήματα.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Στις 20 Απριλίου η πρεμιέρα των Huawei Pura 90 Pro με νέα gradient χρώματα!

Η Huawei προχώρησε στην επίσημη ανακοίνωση της ημερομηνίας παρουσίασης για τη νέα γενιά των κορυφαίων φωτογραφικών smartphones της. Η σειρά Huawei Pura 90 θα...

Το Ubuntu απαιτεί πλέον περισσότερη μνήμη RAM από τα Windows 11

Η Ubuntu 26.04 LTS αυξάνει τις ελάχιστες απαιτήσεις μνήμης, δείχνοντας τη στροφή της Canonical προς πιο σύγχρονες και απαιτητικές υπολογιστικές ανάγκες. Η αλλαγή, που καταγράφεται...

Υποχρεωτική επαλήθευση για όλους τους Έλληνες στα social media

Υποχρεωτική επαλήθευση για όλους τους Έλληνες στα social media έρχεται λόγω του νέου μέτρου που αποφασίστηκε από την ελληνική κυβέρνηση για την απαγόρευση πρόσβασης...

PS5: Οι αυξήσεις της Sony έφτασαν επίσημα και στην ελληνική αγορά

Οι νέες τιμές του PS5 από τη Sony ισχύουν πλέον επίσημα και στην Ελλάδα. Standard 649,99€, Digital 599,99€, Pro 899,99€, Portal 249,99€. Οι νέες τιμές...

Android 17: Το κινητό σου θα αναβαθμιστεί; Δες τη λίστα

Το Android 17 έρχεται το καλοκαίρι. Δες ποια Samsung, Xiaomi, Pixel, OnePlus και άλλα smartphones θα δεχτούν την αναβάθμιση και πώς να ελέγξεις τη...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

“Θα βάλλεις Γυαλιά”!!! Τραβάνε Βίντεο, Φωτογραφίες… σου Απαντάνε Στα Ελληνικά με Chat GPT. Στα 53€ ΚΟΜΠΛΕ… Zeblaze Eyewear AI

Για την "Ιστορία" ΑΚΡΙΒΩΣ τα ΙΔΙΑ στην Ελλάδα θα τα βρεις 100€!!! Έχοντας κάτι τέτοιο στα χέρια σου είναι απίθανο να πιστέψεις πόσο οικονομικά μπορείς...

Πληκτρολόγια Razer! Το Παλιό μου είναι Best Seller… και τo Νέο Θα μου φτιάξει το Setup μου…. Razer Joro και Ornata V3 X (Βίντεο)

Αν δεν το έχεις ήδη καταλάβει το 90% των πραγμάτων που βλέπεις στο κανάλι είναι προσωπικές επιλογές και σχεδόν ποτέ... κάτι δεν αξίζει και...

H “Dyson του Φτωχού”!!! Click Bait ή ΑΛΗΘΕΙΑ;;; Ίσως η πιο Δυνατή ασύρματη σκούπα που μπορείς να πάρεις με 88€ ΚΟΜΠΛΕ! (Βίντεο)

Με 55KPA δύναμης αναρρόφησης έχει την δύναμη να σηκώσει βάρος 1,6 κιλών και λίγες (ειδικά σε αυτήν την κατηγορία τιμής) μπορούν να το κάνουν! Με...

Φορητό Ψυγείο τέρας… 55Lt που πιάνει -30° C για… “ΠΛΑΚΑ” Δικό σου ΧΘΕΣ… Στα 171€ ΚΟΜΠΛΕ!!! Foursun 55lt Refrigerator με BT και…. (βίντεο)

Ενημέρωση 04/04/2026 και ώρα 22:45 τα πρώτα κουπόνια (έκπτωσης 20€) τα εξαφανίσατε. Βάλτε κουπόνι CDOF05 στα 13€ έκπτωση!!! Και 35Lt στα 149€ και 45Lt στα...

Σαν τον Ξυλόφουρνο “ΔΕΝ ΕΧΕΙ”… Μίνι Ξυλόφουρνος για ΟΛΟΥΣ και για ΟΛΑ στα 167€ ΚΟΜΠΛΕ (Βίντεο)

Εδώ η γεύση η πρακτικότητα και το μεράκι επισκιάζει τα πάντα... αν έχεις φάει ξέρεις για τι ακριβώς μιλάω... αν όχι πίστεψε, δεν θα...