Η DeepSeek παρουσίασε δοκιμαστικές εκδόσεις ενός νέου κορυφαίου μοντέλου τεχνητής νοημοσύνης, έναν χρόνο μετά την αναστάτωση που προκάλεσε στη Silicon Valley, χαρακτηρίζοντάς το ως την ισχυρότερη open-source πλατφόρμα απέναντι σε ανταγωνιστές όπως η OpenAI και η Anthropic.
Η κινεζική startup αποκάλυψε τις σειρές V4 Flash και V4 Pro, υποστηρίζοντας ότι προσφέρουν κορυφαίες επιδόσεις σε benchmarks προγραμματισμού, αλλά και σημαντικές βελτιώσεις στις δυνατότητες συλλογισμού και στις agentic λειτουργίες. Όπως ανέφερε η εταιρεία μέσω της πλατφόρμας Hugging Face, τα νέα μοντέλα συνοδεύονται από αναβαθμίσεις στην αρχιτεκτονική και βελτιώσεις βελτιστοποίησης.
Η DeepSeek ξεχώρισε ιδιαίτερα μια τεχνική που ονομάζει «Hybrid Attention Architecture», η οποία —όπως υποστηρίζει— βελτιώνει την ικανότητα ενός AI συστήματος να θυμάται ερωτήματα κατά τη διάρκεια μεγάλων συνομιλιών. Παράλληλα, αύξησε το context window στο 1 εκατ. tokens, εξέλιξη που επιτρέπει την αποστολή ολόκληρων codebases ή πολύ μεγάλων εγγράφων σε ένα μόνο prompt.
Όπως μεταδίδει το Bloomberg, η παρουσίαση του V4 έρχεται περισσότερο από έναν χρόνο μετά την κυκλοφορία του μοντέλου R1 από τη startup με έδρα το Χανγκζού, το οποίο είχε προκαλέσει sell-off ύψους τρισεκατομμυρίων δολαρίων στις αγορές τεχνολογίας. Το R1 ήταν ένα open-source μοντέλο που μιμείται τη διαδικασία ανθρώπινου συλλογισμού και είχε επιδόσεις αντίστοιχες προηγμένων συστημάτων AI εταιρειών όπως η OpenAI, παρότι —σύμφωνα με την DeepSeek— αναπτύχθηκε με ένα κλάσμα του κόστους.
🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world’s top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.… pic.twitter.com/n1AgwMIymu— DeepSeek (@deepseek_ai) April 24, 2026
Οι μετοχές κινεζικών εταιρειών ημιαγωγών κατέγραψαν άνοδο την Παρασκευή, καθώς οι επενδυτές εκτίμησαν ότι το νέο μοντέλο θα ενισχύσει τη ζήτηση για εγχώρια chips. Σε ανάρτησή της στο WeChat, η DeepSeek ανέφερε ότι η διαθέσιμη υπολογιστική ισχύς για τη σειρά V4 Pro είναι εξαιρετικά περιορισμένη λόγω έλλειψης computing resources.
Ωστόσο, η startup εκτιμά ότι το κόστος χρήσης του μοντέλου θα μειωθεί σημαντικά όταν τεθούν σε λειτουργία, στο δεύτερο εξάμηνο του έτους, clusters που θα βασίζονται στα chips Ascend 950 της Huawei Technologies. Παράλληλα, η DeepSeek βρίσκεται σε συνομιλίες με τις Tencent και Alibaba για τον πρώτο γύρο χρηματοδότησής της.
Οι μετοχές της Semiconductor Manufacturing International Corporation, βασικού κατασκευαστή chips της Huawei, ενισχύθηκαν έως και 9,4% στο Χονγκ Κονγκ, ενώ η Hua Hong Semiconductor σημείωσε άνοδο άνω του 13%. Αντίθετα, ανταγωνιστές όπως η Zhipu υποχώρησαν κατά 8%.
Η νέα σειρά μοντέλων θεωρείται σημαντικό βήμα προόδου ως προς την κλίμακα και την αποδοτικότητα που χαρακτηρίζουν την άνοδο της DeepSeek και έχουν αυξήσει σημαντικά τις πιέσεις προς τους ανταγωνιστές της. Μετά το R1, εταιρείες τεχνολογίας και επενδυτές άρχισαν να επανεξετάζουν κατά πόσο είναι λογικό να επενδύονται δισεκατομμύρια δολάρια στην ανάπτυξη AI. Παρ’ όλα αυτά, οι δαπάνες εκτοξεύθηκαν ξανά, με τους αμερικανικούς τεχνολογικούς κολοσσούς να αναμένεται να επενδύσουν περίπου 650 δισ. δολάρια το 2026 σε υποδομές AI και data centers.
Το σύστημα τρισεκατομμυρίων παραμέτρων της DeepSeek χρησιμοποιεί την τεχνική Mixture-of-Experts, ενεργοποιώντας επιλεκτικά μόνο ένα μικρό μέρος των «ειδικών» και έως 37 δισ. παραμέτρους ανά εργασία, ώστε να διατηρεί σημαντικά χαμηλότερο το κόστος inference σε σχέση με αντίστοιχα προηγμένα μοντέλα.
Η αρχιτεκτονική και οι τεχνικές αυτές τοποθετούν τη DeepSeek απέναντι στα πιο εξελιγμένα μοντέλα εταιρειών της Silicon Valley όπως η OpenAI, η Google και η Anthropic. Την Παρασκευή, η startup υποστήριξε ότι το V4 ξεπερνά σε επιδόσεις ακόμη και το GPT-5.2 της OpenAI σε ορισμένα benchmarks, αν και παραδέχθηκε ότι εξακολουθεί να υστερεί κατά περίπου τρεις έως έξι μήνες σε σχέση με τα πλέον προηγμένα μοντέλα της αγοράς.
Παράλληλα, η DeepSeek τόνισε ότι δεν επιδιώκει μόνο υψηλότερες επιδόσεις, αλλά και δραστική μείωση του κόστους. Το V4 έχει σχεδιαστεί ώστε να λειτουργεί πάνω σε φθηνότερες υποδομές.
«Η Minimax και η Zhipu, ως ανεξάρτητοι πάροχοι μοντέλων, θα παραμένουν ευάλωτοι στον ανταγωνισμό, ειδικά από διαδικτυακές πλατφόρμες ή παρόχους cloud υπηρεσιών που διαθέτουν μεγαλύτερη εμβέλεια και δίκτυο διανομής», δήλωσε ο Vey-Sern Ling. «Τελικά, η διαφορά στις επιδόσεις των μοντέλων θα είναι σχεδόν ανεπαίσθητη για τους περισσότερους χρήστες.»
Η DeepSeek προκάλεσε επίσης φρενίτιδα στην Κίνα, με τεχνολογικούς ομίλους από την Alibaba έως την Baidu να κατακλύζουν την αγορά με χαμηλού κόστους υπηρεσίες AI. Ανταγωνιστές όπως η ByteDance, η Zhipu και η Minimax επιτάχυναν τις αναβαθμίσεις των μοντέλων τους τις εβδομάδες πριν από τον Απρίλιο, προσπαθώντας να προλάβουν τη δυναμική της DeepSeek.
Η εκρηκτική άνοδος της εταιρείας συνοδεύτηκε και από αυξημένο έλεγχο. Αμερικανοί τεχνολογικοί ηγέτες και κυβερνητικοί αξιωματούχοι κατηγόρησαν τη DeepSeek ότι χρησιμοποίησε παράνομες τεχνικές και απαγορευμένο hardware για την ανάπτυξη των μοντέλων της.
Ένα από τα βασικά ζητήματα αφορά τη λεγόμενη «distillation», διαδικασία κατά την οποία ένα μοντέλο AI χρησιμοποιεί τα αποτελέσματα ενός άλλου μοντέλου για εκπαίδευση, με στόχο να αποκτήσει παρόμοιες δυνατότητες. Τόσο η OpenAI όσο και η Anthropic υποστήριξαν ότι εντόπισαν τέτοιες επιθέσεις από τη DeepSeek, ανησυχία που η OpenAI είχε αρχίσει να εκφράζει ιδιωτικά λίγο μετά την κυκλοφορία του R1.
Η δεύτερη μεγάλη ανησυχία αφορά το ενδεχόμενο η DeepSeek να έχει αποκτήσει πρόσβαση σε απαγορευμένα AI chips της Nvidia, κάτι που οι αμερικανικές αρχές άρχισαν να διερευνούν ήδη από πέρυσι.
Σύμφωνα με πηγές που γνωρίζουν το θέμα, η αμερικανική κυβέρνηση πιστεύει ότι η κινεζική startup χρησιμοποίησε επεξεργαστές Blackwell της Nvidia —οι οποίοι ουσιαστικά απαγορεύεται να πωλούνται στην Κίνα— σε data center στη Μογγολία.
Διαβάστε ακόμη
FT: Η Monte dei Paschi σχεδιάζει πώληση συμμετοχής στη Generali ύψους €7,4 δισ.
Στενά του Ορμούζ: Ιρανικό υπερδεξαμενόπλοιο επιχειρεί να σπάσει τον αμερικανικό αποκλεισμό
Holcim: Αύξηση 8,3% στα κέρδη το α’ τρίμηνο με ώθηση από τα βιώσιμα υλικά
Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα
