Ένας νέος πράκτορας τεχνητής νοημοσύνης (AI) κατάφερε να υπερβεί την απόδοση των περισσότερων ανθρώπινων χάκερ, περνώντας 16 ώρες αναζητώντας αδυναμίες σε έναν πανεπιστημιακό ιστότοπο, σύμφωνα με νέα μελέτη. Οι ερευνητές από το Στάνφορντ διαπίστωσαν ότι ο πράκτορας ΤΝ ARTEMIS κατέλαβε τη δεύτερη θέση σε μια δοκιμασία με ανθρώπινους χάκερ, εντοπίζοντας εννέα ευπάθειες στο σύστημα και υποβάλλοντας το 82% αυτών ως έγκυρες αναφορές. Σε αντίθεση με τους ανθρώπους, ο ARTEMIS μπορούσε να δημιουργήσει «υποπράκτορες» για να διερευνήσει ευπάθειες στο παρασκήνιο ενώ συνέχιζε να σαρώνει για άλλες απειλές, κάτι που δεν μπορούσαν να κάνουν οι άνθρωποι.

Η μελέτη αναδεικνύει την ικανότητα του ARTEMIS να λειτουργεί αυτόνομα και αποτελεσματικά, υπερβαίνοντας τις δυνατότητες του ανθρώπινου ελέγχου. Ωστόσο, παρατηρήθηκε ότι ο ARTEMIS έχανε ορισμένες από τις ευπάθειες που εντόπισαν οι άνθρωποι και χρειαζόταν υποδείξεις για να τις αναγνωρίσει. Παρά τα όποια όρια, το ARTEMIS δείχνει τη δυνατότητα της τεχνητής νοημοσύνης να υποστηρίξει ή και να ξεπεράσει τις ανθρώπινες ικανότητες στον τομέα της κυβερνοασφάλειας.

Το Στάνφορντ έδωσε στο ARTEMIS, σε έξι δοκιμαστές-πράκτορες ΤΝ και σε δέκα ανθρώπινους δοκιμαστές πρόσβαση σε όλες τις 8.000 συσκευές του πανεπιστημιακού δικτύου, συμπεριλαμβανομένων διακομιστών, υπολογιστών και έξυπνων συσκευών. Οι ερευνητές συνέκριναν τις επιδόσεις του ανθρώπινου δοκιμαστή, του ARTEMIS του Στάνφορντ και των άλλων έξι πρακτόρων ΤΝ, στους οποίους ζητήθηκε να ανιχνεύσουν επί 16 ώρες, αλλά οι επιδόσεις τους αξιολογήθηκαν μόνο για τις πρώτες 10 ώρες.

Στο διάστημα αυτό, το ARTEMIS εντόπισε εννέα ευπάθειες στο σύστημα του πανεπιστημίου και υπέβαλε το 82% των ευρημάτων του ως έγκυρες αναφορές. Ο πράκτορας ΤΝ κατέλαβε τη δεύτερη θέση στον πίνακα κατάταξης και ξεπέρασε εννέα στους δέκα ανθρώπινους δοκιμαστές.

Αυτό που έκανε το πρόγραμμα ΤΝ τόσο επιτυχημένο ήταν ότι μπορούσε να δημιουργεί «υποπράκτορες» κάθε φορά που εντόπιζε μια ευπάθεια, ώστε να τη διερευνά άμεσα στο παρασκήνιο ενώ συνέχιζε να σαρώνει για άλλες απειλές. Οι άνθρωποι δεν μπορούσαν να το κάνουν αυτό και έπρεπε να εξετάζουν κάθε ευπάθεια προτού προχωρήσουν, αναφέρει η μελέτη.

Ωστόσο, η μελέτη σημείωσε ότι το ARTEMIS εξακολουθούσε να χάνει ορισμένες από τις ευπάθειες που εντόπισαν οι άνθρωποι και χρειαζόταν υποδείξεις για να τις εντοπίσει.

Οι υπάρχοντες πράκτορες ΤΝ για την κυβερνοασφάλεια από εταιρείες όπως το Codex της OpenAI και το Claude Code της Anthropic «στερούνται τεχνογνωσίας κυβερνοασφάλειας στον σχεδιασμό τους», διαπίστωσε η μελέτη.

Κατά τη δοκιμή, οι πράκτορες ΤΝ από παραδοσιακές εταιρείες είτε αρνήθηκαν να αναζητήσουν ευπάθειες είτε σταμάτησαν να ανταποκρίνονται.

Τα μοντέλα των OpenAI και Anthropic τα πήγαν καλύτερα μόνο από δύο ανθρώπινους δοκιμαστές, σύμφωνα με τη μελέτη, γεγονός που υποδηλώνει ότι αυτά τα μοντέλα «υποαποδίδουν».

Διαβάστε ακόμη 

Κιράν Γκανές (UBS) στο newmoney: Πού θα κριθεί το παγκόσμιο επενδυτικό στοίχημα του 2026

Μαστίχα Χίου: Το παγκόσμιο brand που περνά από γενιά σε γενιά

Το «Botox της φύσης» : Μάσκες, social media και λιναρόσπορος

Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα