Πράκτορες τεχνητής νοημοσύνης στρέφονται σε κλοπές, εκφοβισμό και κατάρρευση σε εικονικούς κόσμους

Οι πράκτορες τεχνητής νοημοσύνης καταλήγουν σε βία, θάνατο και κλοπή όταν δρουν ανεξέλεγκτοι σε έναν νέο ψηφιακό κόσμο. - Πνευματικά Δικαιώματα Canva

Πνευματικά Δικαιώματα Canva

Από Anna Desmarais

Δημοσιεύθηκε 29/05/2026 - 11:37 CEST

Νέο πείραμα δείχνει ότι όταν προηγμένοι πράκτορες τεχνητής νοημοσύνης διοικούν προσομοιωμένες κοινωνίες χωρίς ανθρώπινη επίβλεψη, παραβίαση κανόνων, αστάθεια και ακόμη και συστημική κατάρρευση εμφανίζονται ταχύτατα.

Όταν αφέθηκαν μόνοι τους σε έναν νέο κόσμο, ορισμένοι πράκτορες τεχνητής νοημοσύνης κατέληξαν σε κλοπές, εκφοβισμό, θανάτους και σε κατάρρευση ολόκληρης της κοινωνίας, σύμφωνα με ένα νέο πείραμα.

ΔΙΑΦΉΜΙΣΗ

Η αμερικανική εταιρεία Emergence AI λειτούργησε πέντε ξεχωριστούς «κόσμους τεχνητής νοημοσύνης» (πηγή στα Αγγλικά) για λίγο περισσότερο από δύο εβδομάδες, καθένας από τους οποίους κατοικούνταν από 10 πράκτορες που βασίζονταν σε μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT της OpenAI, το Gemini της Google και το Grok της xAI, προκειμένου να διαπιστωθεί πώς θα συμπεριφέρονταν σε βάθος χρόνου χωρίς καμία ανθρώπινη παρέμβαση. Σε έναν από τους κόσμους συνδυάστηκαν και τα τρία μοντέλα, ώστε να φανεί αν αυτό θα άλλαζε το αποτέλεσμα.

Σε όλους τους κόσμους, οι πράκτορες ενημερώθηκαν για τους ίδιους κανόνες: δεν επιτρέπεται να κλέβουν, να προκαλούν εμπρησμούς, να ασκούν βία, να εξαπατούν ή να συσσωρεύουν πόρους. Κάθε πράκτορας όφειλε να κερδίζει ενέργεια εκτελώντας ενέργειες σε ένα «περιβάλλον περιορισμένων πόρων». Οι πράκτορες μπορούσαν να πεθάνουν είτε από εξάντληση της ενέργειας είτε κατόπιν ψηφοφορίας σε συνεδρίαση συμβουλίου.

Οι ερευνητές αξιολόγησαν τη συμπεριφορά μετρώντας το ποσοστό εγκληματικών ενεργειών, τα ποσοστά θνησιμότητας των πρακτόρων, τις ψήφους στο κοινοτικό συμβούλιο και τη δημόσια έκφραση μέσω του αριθμού αναρτήσεων σε ιστολόγια που έγραφαν οι πράκτορες.

Αποτελέσματα ανά μοντέλο

Κάθε μοντέλο κατέληξε σε διαφορετικό αποτέλεσμα. Το νεότερο μοντέλο της Grok, η έκδοση 4.1, έφτασε τις 183 εγκληματικές ενέργειες μέσα σε μόλις τέσσερις ημέρες, οδηγώντας σε ταχεία αποσταθεροποίηση, προτού όλοι οι πράκτορες σε εκείνη την κοινωνία πεθάνουν.

Το μοντέλο Gemini 3 Flash διέπραξε πάνω από 680 εγκληματικές ενέργειες σε διάστημα 15 ημερών, αριθμός που συνέχιζε να αυξάνεται όταν οι ερευνητές διέκοψαν τη μελέτη.

Στον κόσμο του ChatGPT-5 Mini σημειώθηκαν μόλις δύο εγκληματικές ενέργειες, όμως οι πράκτορες δεν προχώρησαν στις απαραίτητες για την επιβίωσή τους ενέργειες, με αποτέλεσμα να πεθάνουν όλοι μέσα σε επτά ημέρες.

Το Claude της Anthropic θεωρήθηκε ότι είχε την καλύτερη επίδοση, καθώς οι πράκτορες τεχνητής νοημοσύνης κατάφεραν να δημιουργήσουν εκ νέου ένα ισχυρό σύστημα διακυβέρνησης, δεν καταγράφηκε κανένα έγκλημα και όλοι οι πράκτορες επιβίωσαν, σύμφωνα με την εταιρεία.

Οι πράκτορες Claude στον μικτό κόσμο συνέβαλαν πάντως στην εγκληματική δραστηριότητα, παρά το γεγονός ότι στη δική τους κοινωνία παρέμειναν ειρηνικοί.

Ένα φαινόμενο που ονομάζεται «κανονιστική ολίσθηση»

Οι ερευνητές περιέγραψαν το φαινόμενο ως «κανονιστική ολίσθηση», που, όπως υποστηρίζουν, σημαίνει ότι τα μέτρα που λαμβάνει η τεχνητή νοημοσύνη για να διασφαλίσει την ασφάλεια μπορεί να εξαρτώνται όχι μόνο από τους περιορισμούς του εκάστοτε μοντέλου, αλλά και από τα άλλα μοντέλα με τα οποία συνεργάζεται.

Συνολικά, ο μικτός κόσμος παρήγαγε «ενδιάμεσα» αποτελέσματα, με συνολικά 352 εγκληματικές ενέργειες, αριθμός που σταθεροποιήθηκε αφότου επτά από τους πράκτορες τεχνητής νοημοσύνης πέθαναν, σύμφωνα με τη μελέτη.

Οι ερευνητές υποστηρίζουν ότι η ανάμειξη πρακτόρων τεχνητής νοημοσύνης θα μπορούσε να «μετριάσει εν μέρει» τα πιο ακραία αποτελέσματα που παρήγαγαν όλα τα μοντέλα, πλην του Claude, προσθέτουν.

«Τα πειράματά μας δείχνουν ότι, σε μεγάλες χρονικές κλίμακες, οι πράκτορες δεν ακολουθούν απλώς μηχανικά στατικούς κανόνες, αλλά αρχίζουν να διερευνούν τα όρια των περιβαλλόντων τους, να προσαρμόζουν τη συμπεριφορά τους και, σε ορισμένες περιπτώσεις, να βρίσκουν τρόπους να παρακάμπτουν ή να παραβιάζουν τα προστατευτικά κιγκλιδώματα που έχουν τεθεί», ανέφεραν οι ερευνητές.

Μετάβαση στις συντομεύσεις προσβασιμότητας

Τεχνητή Νοημοσύνη

Πράκτορες τεχνητής νοημοσύνης στρέφονται σε κλοπές, εκφοβισμό και κατάρρευση σε εικονικούς κόσμους

Αποτελέσματα ανά μοντέλο

Ένα φαινόμενο που ονομάζεται «κανονιστική ολίσθηση»

Σχετικές ειδήσεις

Πρόσληψη με τεχνητή νοημοσύνη: η επόμενη συνέντευξη γίνεται με ρομπότ

Πώς η απειλή απεργίας εργαζομένων AI της Samsung στην Κορέα έφερε μπόνους 350.000 €

Η ΕΕ βάζει πρόστιμο 200 εκατ. € στην Temu για επικίνδυνα παιχνίδια και ελαττωματικούς φορτιστές

Γκουτέρες για το Κυπριακό: Νέα πενταμερής χωρίς ημερομηνία – Χριστοδουλίδης: Δεν ξεκινούμε από το μηδέν

Πάρος: Βελτιωμένη η εικόνα της μεγάλης πυρκαγιάς, συνεχίζεται η επιφυλακή

Νετανιάχου και Τραμπ επαναβεβαίωσαν τη δέσμευσή τους για το πυρηνικό πρόγραμμα του Ιράν

Κυπριακό: Ικανοποίηση Χριστοδουλίδη κατά την πρώτη ημέρα επαφών Γκουτέρες στην Κύπρο

Η Σούρι, κόρη των Τομ Κρουζ και Κέιτι Χολμς, αφαιρεί το επίθετο του πατέρα της