Υπό την πίεση ανταγωνιστών όπως το DeepSeek και το Llama 3 της Meta, η OpenAI δήλωσε ότι εργάζεται για την κυκλοφορία ενός νέου μοντέλου μεγάλης γλώσσας ανοικτού βάρους τους επόμενους μήνες
Το OpenAI ετοιμάζεται να κυκλοφορήσει το πρώτο γλωσσικό μοντέλο ανοικτού βάρους μετά το GPT-2 "τους επόμενους μήνες".
Αυτό προκύπτει από μια φόρμα ανατροφοδότησης στον ιστότοπο της εταιρείας, η οποία ζητά από προγραμματιστές, ερευνητές και την ευρύτερη κοινότητα να δώσουν πληροφορίες σχετικά με το πώς θα "κάνουμε αυτό το μοντέλο όσο το δυνατόν πιο χρήσιμο".
Ο διευθύνων σύμβουλος Σαμ Άλτμαν ανέπτυξε την απόφαση στην πλατφόρμα κοινωνικής δικτύωσης X, λέγοντας ότι το λανσάρισμα "αισθάνεται σημαντικό να γίνει".
Πριν από την κυκλοφορία του, η εταιρεία θα αξιολογήσει το μοντέλο με το "πλαίσιο ετοιμότητας" της, όπως κάνει και με άλλα, πρόσθεσε ο Άλτμαν.
Η εταιρεία θα φιλοξενήσει επίσης συνεδρίες προγραμματιστών στις ΗΠΑ, την Ευρώπη και την Ασία-Ειρηνικό για να "συγκεντρώσει σχόλια" και να παίξει με τα πρώτα πρωτότυπα.
Ένα μοντέλο ανοικτού βάρους σημαίνει ότι οι αριθμητικές παράμετροι που επηρεάζουν την απόδοση της τεχνητής νοημοσύνης είναι δημόσιες, αλλά τα δεδομένα εκπαίδευσης μπορεί να μην είναι.
Η κίνηση αυτή έρχεται δύο μήνες αφότου ο Altman παραδέχτηκε στο Reddit ότι η OpenAI ήταν "στη λάθος πλευρά της ιστορίας" όσον αφορά τα πιο ανοιχτά μοντέλα και ότι η εταιρεία "πρέπει να βρει μια διαφορετική στρατηγική ανοιχτού κώδικα".
Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek, που θεωρείται ευρέως ως ένας από τους ανταγωνιστές της OpenAI, έχει μια ανοιχτή προσέγγιση στα μοντέλα της.
Το μεγάλο γλωσσικό μοντέλο της, το R1, είναι εξαιρετικά γρήγορο και είχε χαμηλό κόστος παραγωγής, το οποίο εξέπληξε τον κόσμο της τεχνολογίας όταν κυκλοφόρησε τον Ιανουάριο.
Η OpenAI δήλωσε στο Ιανουάριος ότι είχε αποδείξεις ότι κινεζικές εταιρείες προσπαθούσαν να χρησιμοποιήσουν την τεχνολογία της εταιρείας για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης.