Οι περισσότεροι από εμάς έχουμε συνομιλήσει με φωνές τεχνητής νοημοσύνης μέσω βοηθών όπως η Siri ή η Alexa, θεωρώντας πως ο μηχανικός τόνος και η τεχνητή άρθρωση τις κάνουν εύκολα αναγνωρίσιμες. Όμως μια νέα επιστημονική μελέτη δείχνει ότι η εποχή αυτή τελείωσε: ο μέσος ακροατής δεν μπορεί πια να ξεχωρίσει μια φωνή AI από μια ανθρώπινη.
Σύμφωνα με έρευνα που δημοσιεύθηκε στην επιθεώρηση PLoS One, οι συμμετέχοντες, όταν άκουσαν ανθρώπινες και τεχνητές φωνές μαζί, απέτυχαν να τις διακρίνουν με αξιοπιστία.
«Ήταν θέμα χρόνου»
«Οι φωνές τεχνητής νοημοσύνης είναι πλέον παντού γύρω μας. Μιλάμε με το Alexa ή το Siri, δεχόμαστε τηλεφωνήματα από αυτοματοποιημένα συστήματα», εξηγεί η Ναντίν Λαβάν, ανώτερη λέκτορας ψυχολογίας στο Πανεπιστήμιο Queen Mary του Λονδίνου.
Όπως σημείωσε, «οι φωνές αυτές δεν ακούγονται ακόμη τέλεια, αλλά ήταν θέμα χρόνου να γίνουν φυσικές και ρεαλιστικές».
Η μελέτη έδειξε πως οι «γενικές» φωνές AI που δημιουργούνται από το μηδέν παραμένουν λιγότερο πειστικές, ενώ οι «κλωνοποιημένες» φωνές από πραγματικούς ανθρώπους —τα λεγόμενα deepfake audio— είναι εξίσου πειστικές με τις αυθεντικές.
Τα εντυπωσιακά ευρήματα
Όπως αναφέρει το Live Science, οι συμμετέχοντες άκουσαν 80 δείγματα φωνών (40 ανθρώπινες και 40 τεχνητές). Μόνο το 41% των «γενικών» φωνών AI θεωρήθηκαν ανθρώπινες, αλλά το 58% των «κλωνοποιημένων» φωνών αναγνωρίστηκαν λανθασμένα ως αληθινές.
Ακόμη και οι πραγματικές φωνές αναγνωρίστηκαν σωστά μόνο στο 62% των περιπτώσεων, κάτι που σημαίνει ότι η διάκριση πλέον είναι σχεδόν αδύνατη.
Από την απάτη στις τράπεζες έως τις ψεύτικες συνεντεύξεις
Τα αποτελέσματα έχουν σοβαρές επιπτώσεις σε ζητήματα ασφάλειας και δεοντολογίας. Οι ερευνητές προειδοποιούν ότι οι εγκληματίες μπορούν να κλωνοποιήσουν φωνές και να εξαπατήσουν συστήματα ταυτοποίησης ή συγγενείς.
Μια γυναίκα στις ΗΠΑ, η Σάρον Μπράιτγουελ, έχασε 15.000 δολάρια πιστεύοντας ότι μιλούσε στο τηλέφωνο με την κόρη της που ζητούσε βοήθεια μετά από «τροχαίο».
«Δεν υπήρχε τίποτα που να με πείσει ότι δεν ήταν η κόρη μου», είπε σοκαρισμένη.
Σε άλλη υπόθεση, απατεώνες αντέγραψαν τη φωνή του πρωθυπουργού του Κουίνσλαντ, Στίβεν Μάλις, για να προωθήσουν απάτη με Bitcoin. Οι ερευνητές επισημαίνουν πως οι φωνές αυτές δημιουργήθηκαν με απλό εμπορικό λογισμικό και μόλις τέσσερα λεπτά ηχογράφησης.
Η τεχνολογία που τρομάζει — αλλά και εμπνέει
«Η διαδικασία απαιτεί ελάχιστη τεχνική γνώση και κόστος. Αυτό δείχνει πόσο προσβάσιμη και εξελιγμένη έχει γίνει η τεχνητή φωνή», σημειώνει η Λαβάν.
Παρά τους κινδύνους, τονίζει πως η τεχνολογία αυτή μπορεί να χρησιμοποιηθεί θετικά, όπως στη στήριξη ατόμων με αναπηρίες, στην εκπαίδευση και στη βελτίωση της επικοινωνίας μέσω εξατομικευμένων φωνών υψηλής ποιότητας.
«Οι συνθετικές φωνές μπορούν να κάνουν την εμπειρία του χρήστη πιο ανθρώπινη», καταλήγει.
Η εποχή που ξεχωρίζαμε το ανθρώπινο από το ψηφιακό έχει τελειώσει. Οι φωνές AI είναι πλέον πειστικές, επικίνδυνες και πανταχού παρούσες, φέρνοντας μαζί τους τόσο ευκαιρίες όσο και απειλές για το μέλλον της επικοινωνίας.
Διαβάστε ακόμη
Τομ Γκόρις: Ο ελληνικής καταγωγής billionaire που «χτίζει» μια αθλητική αυτοκρατορία (pics)
Ο λογαριασμός των 32.000 ευρώ και ο εστιάτορας που δεν έστελνε… ποτέ αποδείξεις στην ΑΑΔΕ
H Ελληνίδα που έκανε μια φανταστική σουρεαλιστική Αθήνα στο instagram παγκόσμιο viral
Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα
