Ένα ιδιαίτερα ισχυρό μοντέλο τεχνητής νοημοσύνης, που εμφανίστηκε ανώνυμα σε πλατφόρμα προγραμματιστών την περασμένη εβδομάδα, έχει ενισχύσει τις εκτιμήσεις ότι η κινεζική startup DeepSeek δοκιμάζει διακριτικά το νέο σύστημα επόμενης γενιάς πριν από την επίσημη παρουσίασή του.
Το δωρεάν μοντέλο, με την ονομασία Hunter Alpha, εμφανίστηκε στην πλατφόρμα OpenRouter στις 11 Μαρτίου χωρίς καμία πληροφορία για τον δημιουργό του και αργότερα χαρακτηρίστηκε από την ίδια την πλατφόρμα ως «μοντέλο μυστικότητας».
Κατά τις δοκιμές που πραγματοποίησε το Reuters, το chatbot περιέγραψε τον εαυτό του ως «κινεζικό μοντέλο τεχνητής νοημοσύνης, εκπαιδευμένο κυρίως στα κινεζικά», επισημαίνοντας ότι τα δεδομένα του φτάνουν έως τον Μάιο του 2025, χρονικό όριο που συμπίπτει με εκείνο που αναφέρει και η DeepSeek.
Όταν ρωτήθηκε για τον δημιουργό του, ωστόσο, το σύστημα απέφυγε να δώσει συγκεκριμένη απάντηση. «Γνωρίζω μόνο το όνομά μου και τα τεχνικά χαρακτηριστικά μου», ανέφερε χαρακτηριστικά.
Ούτε η DeepSeek ούτε η OpenRouter έχουν επιβεβαιώσει την προέλευση του μοντέλου, ενώ δεν υπήρξε ανταπόκριση σε αιτήματα για σχόλια.
Σύμφωνα με την περιγραφή του, το Hunter Alpha διαθέτει περίπου 1 τρισεκατομμύριο παραμέτρους, γεγονός που το κατατάσσει στα πλέον προηγμένα μοντέλα, απαιτώντας παράλληλα υψηλή υπολογιστική ισχύ.
Το σύστημα υποστηρίζει επίσης παράθυρο συμφραζομένων έως και 1 εκατομμύριο tokens, δηλαδή τεράστια ποσότητα κειμένου που μπορεί να επεξεργαστεί σε μία αλληλεπίδραση.
«Ο συνδυασμός μεγάλου παραθύρου συμφραζομένων και ικανότητας συλλογιστικής είναι εντυπωσιακός», σχολίασε ο μηχανικός τεχνητής νοημοσύνης Nabil Haouam, υπογραμμίζοντας ότι τέτοιες δυνατότητες συνήθως συνοδεύονται από υψηλό κόστος.
Οι προδιαγραφές αυτές θυμίζουν τις προσδοκίες για το μοντέλο DeepSeek V4, το οποίο φέρεται να πλησιάζει στην κυκλοφορία του, πιθανώς ακόμη και μέσα στον Απρίλιο.
Αν και δεν υπάρχει σαφής απόδειξη σύνδεσης, αρκετοί προγραμματιστές θεωρούν ότι πρόκειται για πρώιμη δοκιμαστική έκδοση του νέου μοντέλου. «Ο τρόπος συλλογισμού αποτελεί ισχυρή ένδειξη», σημειώνει ο Daniel Dewhurst.
Ωστόσο, άλλοι ειδικοί εμφανίζονται πιο επιφυλακτικοί. Ο Umur Ozkul εκτιμά ότι το Hunter Alpha πιθανότατα δεν είναι το DeepSeek V4, επισημαίνοντας τεχνικές διαφορές.
Οι ανώνυμες δοκιμές τέτοιων μοντέλων δεν είναι ασυνήθιστες. Πλατφόρμες όπως το OpenRouter λειτουργούν ως πεδία δοκιμών, επιτρέποντας την αξιολόγηση νέων συστημάτων σε πραγματικές συνθήκες.
Το Hunter Alpha υιοθετήθηκε ταχύτατα, επεξεργαζόμενο πάνω από 160 δισεκατομμύρια tokens μέσα σε λίγες ημέρες, κυρίως μέσω εργαλείων ανάπτυξης και AI agents.
Διαβάστε ακόμη
Τι δείχνει για τη ζωή σου ο καφές που επιλέγεις
Πτήση αποχαιρετισμού ή επικίνδυνο ρίσκο; Πιλότος κατεβάζει Boeing στα 100 μέτρα και προκαλεί σάλο
Γιώργος Προκοπίου: Το μεγαλύτερο δεξαμενόπλοιό του, «Atokos», διέσχισε τα Στενά του Ορμούζ
Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα
Σχολίασε εδώ
Για να σχολιάσεις, χρησιμοποίησε ένα ψευδώνυμο.