ΟΤζακ Κλαρκ λέει ότι οι πράκτορες τεχνητής νοημοσύνης ίσως σύντομα χτίζουν και εκπαιδεύουν μόνοι τους μοντέλα, αφαιρώντας τον ανθρώπινο έλεγχο
Ο συνιδρυτής της Anthropic, Τζακ Κλαρκ, θέλει η βιομηχανία της τεχνητής νοημοσύνης να πατήσει φρένο προτού η τεχνολογία αρχίσει να εξελίσσεται περαιτέρω μόνη της, χωρίς ανθρώπινη παρέμβαση.
Μιλώντας στο BBC, ο Κλαρκ είπε ότι το 80% της δουλειάς προγραμματισμού στην Anthropic γίνεται ήδη από το σύστημα τεχνητής νοημοσύνης Claude και ότι μέσα σε λίγα χρόνια το ποσοστό αυτό θα μπορούσε να φτάσει το 100%. Ωστόσο, τόνισε ότι «είναι επιλογή» των εταιρειών τεχνητής νοημοσύνης αν θα το αφήσουν να φτάσει τόσο μακριά χωρίς να το σταματήσουν.
«Πιστεύουμε ότι αυτό είναι ένα ζήτημα για το οποίο ο κόσμος θα έπρεπε να μιλά περισσότερο», είπε ο Κλαρκ. «Η βιομηχανία της τεχνητής νοημοσύνης αυτή τη στιγμή έχει γκάζι, αλλά δεν έχει πεντάλ φρένου στο αυτοκίνητο, και εμείς θέλουμε να κάνουμε μέρος της δουλειάς για να φτιάξουμε αυτό το πεντάλ».
Η διαδικασία αυτή ονομάζεται «αναδρομική αυτοβελτίωση» (recursive self-improvement), όπου ένα σύστημα τεχνητής νοημοσύνης μπορεί να βελτιώνει τον εαυτό του χωρίς ανθρώπινη παρέμβαση, σύμφωνα με την Anthropic σε σχετική ανάρτηση στο μπλογκ της (πηγή στα Αγγλικά) το βράδυ της Πέμπτης.
Σε ένα αναδρομικό μοντέλο, οι πράκτορες τεχνητής νοημοσύνης, οι αυτόνομοι «εργαζόμενοι» που δημιουργεί ένα chatbot, θα μπορούσαν «να γίνουν αρκετά ικανοί ώστε να δημιουργούν και να εκπαιδεύουν οι ίδιοι μοντέλα», ώστε ο Claude «να μπορεί να βελτιώνεται συνεχώς από τον ίδιο τον Claude», αναφέρει η Anthropic.
Παρότι η αναδρομική τεχνητή νοημοσύνη θα μπορούσε να φέρει οφέλη στην επιστήμη και την υγεία, η Anthropic προειδοποιεί ότι ενδέχεται να αυξήσει «τους κινδύνους οι άνθρωποι να χάσουν τον έλεγχο των συστημάτων τεχνητής νοημοσύνης».
«Αν τα συστήματα είναι σε θέση να κατασκευάζουν πλήρως τους διαδόχους τους, τότε ο τρόπος με τον οποίο τα ασφαλίζουμε, τα παρακολουθούμε και διαμορφώνουμε τη συμπεριφορά τους γίνεται πολύ πιο σημαντικός», αναφέρει η ανάρτηση στο μπλογκ.
Η ίδια η Anthropic διαπιστώνει στο μοντέλο της ενδείξεις ότι η αναδρομικότητα έρχεται μάλλον νωρίτερα παρά αργότερα. Επικαλείται το γεγονός ότι τα ποσοστά διόρθωσης κώδικα από το προσωπικό έχουν μειωθεί σταθερά την τελευταία χρονιά, κάτι που σημαίνει ότι υπάρχουν λιγότερα λάθη στον κώδικα που παράγει ο Claude.
Ο Claude είναι επίσης σε θέση να διεξάγει μόνος του ερευνητικά πειράματα όταν του τίθεται ένα ανοιχτό ερώτημα, όπως «Μπορεί ένα πιο αδύναμο μοντέλο να επιβλέπει ένα πιο ισχυρό;», και να καταλήγει σε δικές του λύσεις χωρίς ανθρώπινη παρέμβαση.
«Οι ενδείξεις δείχνουν ότι ο ανθρώπινος ρόλος περιορίζεται σε κάθε βήμα της διαδικασίας ανάπτυξης της τεχνητής νοημοσύνης», σημειώνεται στην ανάρτηση.
Η Anthropic ανέφερε ότι το ινστιτούτο της θα πραγματοποιήσει έρευνα για να αναπτύξει ένα σύστημα που θα ελέγχει αν οι προγραμματιστές έχουν πράγματι σταματήσει ή επιβραδύνει την πορεία προς την αναδρομική τεχνητή νοημοσύνη.
Ωστόσο, μια πραγματική επιβράδυνση θα απαιτούσε «πολλά, καλά χρηματοδοτούμενα εργαστήρια στην αιχμή της έρευνας, σε πολλές χώρες, να συμφωνήσουν να σταματήσουν υπό τις ίδιες προϋποθέσεις».