Η ανακοίνωση έρχεται καθώς η Κίνα πιέζει τις τεχνολογικές της εταιρείες να σπάσουν την εξάρτησή τους από ξένους κατασκευαστές τσιπ, ώστε να μπορέσει να ανταγωνιστεί στην κούρσα της τεχνητής νοημοσύνης.
Η κινεζική εταιρεία τεχνητής νοημοσύνης (AI) DeepSeek κυκλοφόρησε το πιο πρόσφατο πειραματικό μοντέλο της, το οποίο ισχυρίζεται ότι διαχειρίζεται μεγάλο όγκο δεδομένων και κοστίζει λιγότερο από τα προηγούμενα μοντέλα της.
Η εταιρεία προκάλεσε φρενίτιδα τον Ιανουάριο όταν εισήλθε στην αγορά με το R1, ένα μοντέλο AI και chatbot που η εταιρεία ισχυρίστηκε ότι ήταν φθηνότερο και εξίσου αποτελεσματικό με το ανταγωνιστικό μοντέλο ChatGPT της OpenAI.
Ωστόσο, ορισμένες χώρες απαγόρευσαν στις κυβερνητικές υπηρεσίες να χρησιμοποιούν το DeepSeek, συμπεριλαμβανομένων της Ιταλίας, των Ηνωμένων Πολιτειών και της Νότιας Κορέας, επικαλούμενες ανησυχίες για την εθνική ασφάλεια.
Τη Δευτέρα, η εταιρεία παρουσίασε το DeepSeek-V3.2-Exp, το οποίο είναι πειραματική έκδοση του τρέχοντος μοντέλου της, DeepSeek-V3.1-Terminus. Στόχος του είναι να κάνει τα συστήματα AI πιο “αποδοτικά,” σύμφωνα με ανάρτηση της εταιρείας στο φόρουμ AI Hugging Face.
Έχει διατεθεί ως ανοιχτή πηγή στις πλατφόρμες προγραμματιστών Hugging Face.
Η DeepSeek ανέφερε ότι το κόστος λειτουργίας της AI μειώνεται στο μισό σε σύγκριση με την προηγούμενη έκδοση.
“Η μεγάλη βελτίωση είναι μια νέα λειτουργία που ονομάζεται DSA (DeepSeek Sparse Attention), η οποία κάνει την AI καλύτερη στη διαχείριση μεγάλων εγγράφων και συνομιλιών,” δήλωσε η Adina Yakefu, επικεφαλής της κινεζικής κοινότητας στο Hugging Face, στο CNBC.
Η Sparse Attention είναι η τεχνολογία που βελτιώνει την αποδοτικότητα του μοντέλου μειώνοντας το υπολογιστικό κόστος που απαιτείται για την εξέταση ενός κειμένου.
“Αυτή η πειραματική έκδοση αντιπροσωπεύει τη συνεχιζόμενη έρευνά μας σε πιο αποδοτικές αρχιτεκτονικές μετασχηματιστών,” αναφέρει η ανάρτηση στο Hugging Face.
Το V3.1-Terminus της DeepSeek δεν κατατάσσεται τόσο υψηλά σε δείκτες όπως η νοημοσύνη όσο το ChatGPT-5 ή άλλα κορυφαία μοντέλα AI όπως το Grok και το Claude της Anthropic – αλλά ισοδυναμεί με το ανοιχτού κώδικα μοντέλο gpt-oss-120b της OpenAI, σύμφωνα με την εταιρεία αξιολόγησης AI Artificial Analysis.
Ωστόσο, η βιομηχανία τεχνολογίας παρακολουθεί τη DeepSeek αφού η εταιρεία δήλωσε ότι θα προσαρμόσει τα μοντέλα της για μικροτσίπ AI που αναπτύσσονται στην Κίνα.
Η Κίνα πιέζει τις τεχνολογικές της εταιρείες να απαλλαγούν από την εξάρτησή τους από ξένους κατασκευαστές μικροτσίπ, ώστε να μπορέσει να ανταγωνιστεί στη μάχη της AI.
Η αμερικανική εταιρεία Nvidia έχει να διαχειριστεί αυξημένους περιορισμούς στις εξαγωγές των μικροτσίπ της προς την Κίνα τόσο υπό τον πρώην πρόεδρο των ΗΠΑ Τζο Μπάιντεν όσο και υπό τον τρέχοντα πρόεδρο Ντόναλντ Τραμπ.
Οι ΗΠΑ απαγόρευσαν στην Nvidia να πουλά τα πιο ισχυρά της μικροτσίπ, το Blackwell, στην Κίνα τον Απρίλιο, υποστηρίζοντας ότι ήταν απαραίτητο για την προστασία της εθνικής και οικονομικής ασφάλειας των ΗΠΑ καθώς ο παγκόσμιος αγώνας AI εξελίσσεται. Ωστόσο, επετράπη να πουλήσει λιγότερο προηγμένα μικροτσίπ.
Οι Financial Times ανέφεραν νωρίτερα τον Σεπτέμβριο ότι η κινεζική ρυθμιστική αρχή του διαδικτύου είχε απαγορεύσει στις τοπικές εταιρείες να αγοράζουν τα μικροτσίπ RTX Pro 6000 της Nvidia, καθώς το Πεκίνο προσπαθεί να μειώσει την εξάρτησή του από ξένα ημιαγωγά.