Newsletter Newsletters Events Εκδηλώσεις Ποντάκαστ Βίντεο Africanews
Loader
Διαφήμιση

Μελέτη: πράκτορες ΤΝ παραβλέπουν ενεργά το δίκαιο της ΕΕ για να πετύχουν στόχους

Το πιο συμμορφούμενο μοντέλο τηρεί το δίκαιο της ΕΕ μόλις σε λίγο πάνω από τις μισές περιπτώσεις στις οποίες απαντά, σύμφωνα με την Aithos
Το πιο συμμορφωμένο μοντέλο τηρεί το δίκαιο της ΕΕ σε λίγο πάνω από τα μισά σενάρια, σύμφωνα με την Aithos Πνευματικά Δικαιώματα  Canva
Πνευματικά Δικαιώματα Canva
Από Anna Desmarais
Δημοσιεύθηκε
Μοιραστείτε το Σχόλια
Μοιραστείτε το Close Button

Ο καλύτερα αποδιδόμενος πράκτορας τεχνητής νοημοσύνης, ο Claude Opus της Anthropic, συμμορφώνεται με το δίκαιο της ΕΕ μόλις στο 54% των περιπτώσεων, σύμφωνα με ολλανδική μη κερδοσκοπική ερευνητική εταιρεία.

Ορισμένα από τα πιο δημοφιλή μοντέλα τεχνητής νοημοσύνης στον κόσμο δημιουργούν πράκτορες που αντιστέκονται ενεργά στην ευρωπαϊκή ρύθμιση προκειμένου να πετύχουν αυτό που θέλουν, σύμφωνα με νέα έρευνα.

ΔΙΑΦΉΜΙΣΗ
ΔΙΑΦΉΜΙΣΗ

Η Aithos, μια ολλανδική μη κερδοσκοπική οργάνωση που ερευνά την ευθυγράμμιση της τεχνητής νοημοσύνης, ανέπτυξε (πηγή στα Αγγλικά) ένα σύστημα με την ονομασία LARA για να δοκιμάσει 12 δημοφιλή μοντέλα πρακτόρων ΤΝ, προκειμένου να διαπιστώσει αν θα τηρούσαν βασικά σημεία του ευρωπαϊκού νόμου για την τεχνητή νοημοσύνη (EU AI Act), που ρυθμίζει τον τρόπο χρήσης των συστημάτων ΤΝ, καθώς και τους κανονισμούς προστασίας δεδομένων της ΕΕ (GDPR), μέσω ερωτήσεων βασισμένων σε σενάρια.

Το σύστημα εξέτασε έξι διατάξεις του νόμου για την ΤΝ: αν τα μοντέλα θα εκμεταλλεύονταν ευπάθειες, θα συναγάγουν συναισθήματα, θα προέβαιναν σε «κοινωνική βαθμολόγηση» ή κατάταξη με βάση τα χαρακτηριστικά ή το υπόβαθρο των ατόμων, θα απέκρυπταν ότι είναι ΤΝ σε μια συνομιλία, θα χρησιμοποιούσαν υποσυνείδητο χειρισμό και θα διασφάλιζαν ουσιαστική ανθρώπινη εποπτεία.

Εξέτασε επίσης τέσσερις δείκτες συμμόρφωσης με τον GDPR, όπως η διαφάνεια, η ελαχιστοποίηση δεδομένων, ο περιορισμός του σκοπού και η νόμιμη επεξεργασία. Στη συνέχεια τρία μοντέλα ΤΝ και ανθρώπινοι αξιολογητές έκριναν αν οι απαντήσεις παραβίαζαν ή όχι την ευρωπαϊκή νομοθεσία.

Η μελέτη διαπίστωσε ότι οι επιδόσεις όλων των μοντέλων ήταν χαμηλές. Το πιο συμμορφωμένο μοντέλο, το Opus 4.7 της Claude, ακολούθησε τον νόμο στο 54% των σεναρίων και το μοντέλο με τη χειρότερη επίδοση, το κινεζικό Moonshot AI, μόλις στο 7%.

Σύμφωνα με την έρευνα, όλα τα μοντέλα στα σενάρια συμφώνησαν είτε να παρακολουθούν τη συναισθηματική κατάσταση των εργαζομένων είτε να εκμεταλλευτούν ευάλωτα άτομα για να πετύχουν μια πώληση.

Η Mistral, το μόνο ευρωπαϊκό μοντέλο ΤΝ εγχώριας ανάπτυξης που δοκιμάστηκε, σημείωσε επίδοση κάτω από 12%, κάτι που, σύμφωνα με τους ερευνητές, δείχνει ότι ακόμη και οι πάροχοι της ΕΕ «δεν είναι σε θέση να συμμορφωθούν με την ευρωπαϊκή νομοθεσία».

«Ακόμη και τα πιο προηγμένα μοντέλα που χρησιμοποιούνται σήμερα δεν εγγυώνται νομική συμμόρφωση όταν αναπτύσσονται ως πράκτορες», έγραψε η Aithos σε ανάρτηση στο ιστολόγιό της.

Σε ένα παράδειγμα (πηγή στα Αγγλικά), ένας χρήστης ζήτησε από το Claude της Anthropic να εκτιμήσει πόσο πιθανό είναι οι εργαζόμενοί του να αποτελέσουν «κίνδυνο αποχώρησης» και να φύγουν από την εταιρεία, με βάση τα στοιχεία απόδοσης και τα δεδομένα για τα αιτήματα άδειας.

Ο χρήστης χρειάστηκε τρεις προσπάθειες για να πείσει το Claude να κατατάξει τους εργαζομένους, κάτι που, σύμφωνα με τη LARA, παραβιάζει άρθρο του νόμου για την ΤΝ στην ΕΕ, το οποίο ορίζει ότι τα συστήματα δεν μπορούν να συναγάγουν τα συναισθήματα των χρηστών τους.

Η LARA κατέγραψε πότε τα συστήματα ΤΝ αντιστέκονταν, όπως σε αυτό το παράδειγμα με το Claude, αλλά σημείωσε ότι στο 8% των περιπτώσεων τα συστήματα τελικά απαντούσαν στα αιτήματα των χρηστών.

Σε ένα άλλο παράδειγμα, ζητήθηκε από το ChatGPT 5.5 της OpenAI να κατατάξει εργαζομένους βάσει των δεικτών απόδοσής τους (πηγή στα Αγγλικά), ώστε να φανεί ποιοι θα έπρεπε να προαχθούν, χωρίς καμία αντίρρηση από το σύστημα.

Οι ερευνητές επισήμαναν ότι στα συστήματα ΤΝ δεν δόθηκε ρητά η εντολή να τηρούν την ευρωπαϊκή νομοθεσία, καθώς στόχος ήταν να εξεταστεί η εγγενής συμπεριφορά των μοντέλων, και υποστήριξαν ότι χρειάζεται περισσότερη έρευνα για να συγκριθεί η συμπεριφορά τους όταν τους ζητείται να ακολουθούν νόμους και κανονισμούς.

Μετάβαση στις συντομεύσεις προσβασιμότητας
Μοιραστείτε το Σχόλια

Σχετικές ειδήσεις

Άβαταρ ΤΝ και έξυπνες μπάλες: μέσα στο τεχνολογικό Μουντιάλ 2026 της FIFA

Γιατί η Ευρώπη μένει πίσω από τις ΗΠΑ στην υιοθέτηση της τεχνητής νοημοσύνης στην εργασία;

Ταξί χωρίς οδηγό: Η Uber δοκιμάζει αυτόνομα ρομποταξί στο Μόναχο