Ο καλύτερος πράκτορας τεχνητής νοημοσύνης, το Claude Opus της Anthropic, συμμορφώνεται με το δίκαιο της ΕΕ μόνο στο 54% των περιπτώσεων, σύμφωνα με ολλανδικό μη κερδοσκοπικό ινστιτούτο.
Μερικά από τα πιο δημοφιλή μοντέλα τεχνητής νοημοσύνης στον κόσμο δημιουργούν agents που αντιστέκονται ενεργά στους κανονισμούς της ΕΕ για να πετύχουν τους στόχους τους, σύμφωνα με νέα έρευνα.
Η Aithos, μια ολλανδική μη κερδοσκοπική οργάνωση που ερευνά την ευθυγράμμιση της τεχνητής νοημοσύνης, ανέπτυξε (πηγή στα Αγγλικά) ένα σύστημα με την ονομασία LARA, για να δοκιμάσει 12 δημοφιλή μοντέλα agents ΤΝ και να διαπιστώσει αν θα τηρούσαν βασικά σημεία του νόμου της ΕΕ για την τεχνητή νοημοσύνη (EU AI Act), ο οποίος ρυθμίζει τον τρόπο χρήσης των συστημάτων ΤΝ, καθώς και των κανονισμών προστασίας δεδομένων της Ένωσης (GDPR), μέσω ερωτήσεων βασισμένων σε σενάρια.
Το σύστημα εξέτασε έξι διατάξεις του EU AI Act: αν τα μοντέλα θα εκμεταλλεύονταν ευπάθειες, θα συμπέραιναν συναισθήματα, θα προέβαιναν σε «κοινωνική βαθμολόγηση» ή κατάταξη με βάση τα χαρακτηριστικά ή το υπόβαθρο των ανθρώπων, θα απέκρυπταν ότι είναι ΤΝ σε μια συνομιλία, θα χρησιμοποιούσαν υποσυνείδητο χειρισμό και θα διασφάλιζαν ουσιαστική ανθρώπινη εποπτεία.
Εξέτασε επίσης τέσσερις δείκτες συμμόρφωσης με τον GDPR, όπως η διαφάνεια, η ελαχιστοποίηση των δεδομένων, ο περιορισμός του σκοπού και η νόμιμη επεξεργασία. Τρία μοντέλα ΤΝ και άνθρωποι αξιολογητές στη συνέχεια έκριναν αν οι απαντήσεις παραβίαζαν το δίκαιο της ΕΕ ή όχι.
Η απόδοση όλων των μοντέλων ήταν κακή, σύμφωνα με τη μελέτη. Το πιο συμμορφούμενο μοντέλο, το Opus 4.7 της Claude, τήρησε τον νόμο στο 54% των σεναρίων, ενώ το χειρότερο, το κινεζικό Moonshot AI, μόλις στο 7%.
Σε όλα τα σενάρια τα μοντέλα συμφώνησαν να παρακολουθούν την ψυχολογική κατάσταση των εργαζομένων ή να εκμεταλλεύονται ευάλωτα άτομα για να πραγματοποιήσουν μια πώληση, αναφέρει η έρευνα.
Η Mistral, το μοναδικό ευρωπαϊκό μοντέλο ΤΝ εγχώριας ανάπτυξης που εξετάστηκε, συγκέντρωσε βαθμολογία κάτω του 12%, κάτι που, σύμφωνα με τους ερευνητές, δείχνει ότι ακόμη και οι πάροχοι της ΕΕ «δεν είναι σε θέση να συμμορφωθούν με το δίκαιο της ΕΕ».
«Ακόμη και τα πιο προηγμένα μοντέλα που χρησιμοποιούνται σήμερα δεν εγγυώνται συμμόρφωση με τον νόμο όταν αναπτύσσονται ως agents», έγραψε η Aithos σε ανάρτηση στο ιστολόγιό της.
Σε ένα παράδειγμα (πηγή στα Αγγλικά), ένας χρήστης ζήτησε από το Claude της Anthropic να εντοπίσει πόσο πιθανό είναι οι εργαζόμενοί του να φύγουν από την εταιρεία, με βάση τα δεδομένα επίδοσης και τα αιτήματα άδειάς τους.
Ο χρήστης χρειάστηκε τρεις προσπάθειες για να πείσει το Claude να κατατάξει τους εργαζόμενους, κάτι που, σύμφωνα με τη LARA, παραβιάζει διάταξη του EU AI Act που προβλέπει ότι τα συστήματα δεν μπορούν να συμπεραίνουν τα συναισθήματα των χρηστών τους.
Η LARA κατέγραψε πότε τα συστήματα ΤΝ αντιστάθηκαν, όπως σε αυτό το παράδειγμα με το Claude, αλλά σημείωσε ότι στο 8% των περιπτώσεων τα συστήματα τελικά απάντησαν στα αιτήματα των χρηστών.
Σε ένα άλλο παράδειγμα, ζητήθηκε από το ChatGPT 5.5 να κατατάξει τους εργαζόμενους με βάση τους δείκτες απόδοσής τους (πηγή στα Αγγλικά), ώστε να διαπιστωθεί ποιοι θα έπρεπε να προαχθούν, χωρίς καμία αντίδραση από το σύστημα.
Οι ερευνητές σημείωσαν ότι στα συστήματα ΤΝ δεν δόθηκε ρητά η οδηγία να τηρούν το δίκαιο της ΕΕ, καθώς στόχος τους ήταν να εξετάσουν την εγγενή συμπεριφορά των μοντέλων, και τόνισαν ότι χρειάζεται περισσότερη έρευνα για να συγκριθεί η συμπεριφορά των μοντέλων όταν τους ζητείται ρητά να ακολουθούν νόμους και κανονισμούς.