Δείτε περισσότερα άρθρα μας στα αποτελέσματα αναζήτησης

Add Newmoney.gr on Google

Η μάχη για την επόμενη γενιά τεχνητής νοημοσύνης περνά πλέον από την ικανότητα των συστημάτων να κατανοούν ταυτόχρονα πολλαπλές μορφές πληροφορίας — από εικόνα και φωνή μέχρι βίντεο και πολύπλοκα έγγραφα. Σε αυτό το πεδίο, η Nvidia επιχειρεί να αλλάξει τα δεδομένα με την παρουσίαση του νέου μοντέλου τεχνητής νοημοσύνης Nemotron 3 Nano Omni.

Η νέα πλατφόρμα ανήκει στην κατηγορία των πολυτροπικών μοντέλων AI και σχεδιάστηκε ώστε να ενοποιεί σε ένα ενιαίο σύστημα δυνατότητες επεξεργασίας εικόνας, ήχου και φυσικής γλώσσας. Σύμφωνα με την Nvidia, ο στόχος είναι να εξαλειφθεί η ανάγκη χρήσης διαφορετικών μοντέλων και ξεχωριστών pipelines που σήμερα χαρακτηρίζουν πολλά εταιρικά συστήματα AI agents και επιβαρύνουν τη λειτουργία τους με καθυστερήσεις και απώλειες πληροφορίας.

Το Nemotron 3 Nano Omni μπορεί να διαχειρίζεται ταυτόχρονα διαφορετικά είδη δεδομένων, όπως κείμενα, φωτογραφίες, βίντεο, ηχητικά αρχεία, έγγραφα, γραφήματα αλλά και γραφικά περιβάλλοντα διεπαφής χρηστών. Η έξοδος του συστήματος παράγεται σε μορφή κειμένου, επιτρέποντας στο μοντέλο να λειτουργεί ως κεντρικός μηχανισμός συλλογισμού για σύνθετες εφαρμογές τεχνητής νοημοσύνης.

Η αρχιτεκτονική πίσω από το νέο μοντέλο

Το νέο σύστημα βασίζεται σε υβριδική αρχιτεκτονική mixture-of-experts με συνολικά 30 δισεκατομμύρια παραμέτρους. Ωστόσο, κατά τη διαδικασία inference ενεργοποιούνται περίπου 3 δισεκατομμύρια παράμετροι, γεγονός που — σύμφωνα με την Nvidia — επιτρέπει στο μοντέλο να προσφέρει δυνατότητες αντίστοιχες πολύ μεγαλύτερων συστημάτων με αισθητά χαμηλότερες απαιτήσεις σε υπολογιστική ισχύ.

Η εταιρεία υποστηρίζει ότι η νέα προσέγγιση περιορίζει σημαντικά τις αδυναμίες των παραδοσιακών AI agents, τα οποία συνήθως βασίζονται σε ξεχωριστά μοντέλα για αναγνώριση φωνής, οπτική κατανόηση και γλωσσική ανάλυση. Η συνεχής μεταφορά δεδομένων ανάμεσα σε αυτά τα μοντέλα δημιουργεί καθυστερήσεις, αυξάνει την κατανάλωση πόρων και συχνά οδηγεί σε απώλεια πλαισίου κατά την επεξεργασία πληροφοριών.

Για να αντιμετωπίσει αυτό το πρόβλημα, το Nemotron 3 Nano Omni ενσωματώνει σε έναν ενιαίο βρόχο συλλογιστικής τον κωδικοποιητή ομιλίας Parakeet, τον κωδικοποιητή όρασης C-RADIOv4-H και ένα οπτικό σύστημα που έχει εκπαιδευτεί ειδικά σε γραφικά περιβάλλοντα χρήστη.

Επιδόσεις και στόχος η κυριαρχία στα multimodal AI systems

Η Nvidia υποστηρίζει ότι το νέο μοντέλο επιτυγχάνει έως και εννέα φορές υψηλότερη απόδοση σε σύγκριση με ανταγωνιστικά ανοιχτά omni μοντέλα παρόμοιας κατηγορίας.

Παράλληλα, στις εργασίες συλλογιστικής βίντεο το Nemotron 3 Nano Omni εμφανίζει περίπου τριπλάσια απόδοση, χρησιμοποιώντας 2,75 φορές μικρότερη υπολογιστική ισχύ.

Το μοντέλο διαθέτει παράθυρο περιβάλλοντος 256K tokens, επιτρέποντας την επεξεργασία εξαιρετικά μεγάλου όγκου δεδομένων και σύνθετων ακολουθιών πληροφοριών. Η Nvidia σημειώνει επίσης ότι το σύστημα καταλαμβάνει κορυφαίες θέσεις σε έξι διεθνή leaderboards που σχετίζονται με σύνθετη κατανόηση εγγράφων, βίντεο και ηχητικών δεδομένων.

Μεγάλες επιχειρήσεις δοκιμάζουν ήδη το μοντέλο

Το νέο μοντέλο έχει ήδη προσελκύσει το ενδιαφέρον σημαντικών επιχειρηματικών ομίλων και τεχνολογικών εταιρειών.

Η Foxconn, η Palantir και η H Company έχουν ήδη ενσωματώσει το Nemotron 3 Nano Omni στις υποδομές τους, ενώ εταιρείες όπως η Dell, η Oracle και η Infosys προχωρούν σε αξιολόγηση των δυνατοτήτων του.

Ο διευθύνων σύμβουλος της H Company, Γκοτιέ Κλουά, δήλωσε ότι το νέο μοντέλο επιτρέπει στους AI agents της εταιρείας να αναλύουν γρήγορα εγγραφές οθόνης πλήρους ανάλυσης HD — δυνατότητα που προηγουμένως θεωρούνταν πρακτικά αδύνατη.

Η Nvidia διαθέτει ήδη το Nemotron 3 Nano Omni μέσω πλατφορμών όπως Hugging Face, OpenRouter, Amazon SageMaker JumpStart και Vultr, καθώς και μέσω περισσότερων από 25 συνεργαζόμενων υποδομών.

Παράλληλα, το μοντέλο είναι προσβάσιμο μέσω του NIM microservice της εταιρείας και συνοδεύεται από ανοιχτά βάρη, datasets και συνταγές εκπαίδευσης, επιτρέποντας σε επιχειρήσεις και προγραμματιστές να προσαρμόζουν το σύστημα τόσο σε τοπικές όσο και σε cloud υποδομές.

Το Nemotron 3 Nano Omni αποτελεί μέρος της ευρύτερης οικογένειας μοντέλων Nemotron 3, η οποία περιλαμβάνει επίσης τις εκδόσεις Super και Ultra για πιο απαιτητικές εφαρμογές συλλογισμού και επεξεργασίας δεδομένων.

Η Nvidia αναφέρει ότι η οικογένεια Nemotron 3 έχει ξεπεράσει τα 50 εκατομμύρια downloads μέσα στον τελευταίο χρόνο, επιβεβαιώνοντας την αυξανόμενη επιρροή της εταιρείας στην παγκόσμια αγορά τεχνητής νοημοσύνης.

Διαβάστε ακόμη 

Προς οριστικό κλείσιμο η βάση της Ryanair στη Θεσσαλονίκη

«Σπάνε» ταμεία τα συστήματα πληρωμών IRIS

Το εξοχικό ενός εκατομμυριούχου μετατρέπεται σε πεντάστερο θέρετρο

Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα