Η τεχνητή νοημοσύνη εξελίσσεται με ταχύτατους ρυθμούς και πολλοί χρήστες στρέφονται πλέον σε chatbots αναζητώντας άμεσες απαντήσεις ακόμη και για ζητήματα υγείας. Ωστόσο, νέα επιστημονική έρευνα που δημοσιεύθηκε στο Nature Medicine δείχνει ότι η ευκολία πρόσβασης δεν ταυτίζεται με την ασφάλεια και ότι η χρήση των γλωσσικών μοντέλων ως «ψηφιακού γιατρού» μπορεί να οδηγήσει σε λανθασμένες αποφάσεις.
Τα σύγχρονα μεγάλα γλωσσικά μοντέλα, όπως το GPT-4o, το Llama 3 και το Command R+, έχουν αποδείξει ότι διαθέτουν εκτεταμένη ιατρική γνώση. Επιτυγχάνουν υψηλές βαθμολογίες σε επιστημονικές εξετάσεις, απαντούν με ευχέρεια σε σύνθετες ιατρικές ερωτήσεις και συχνά δίνουν την εντύπωση ότι μπορούν να αξιολογήσουν μια κατάσταση όπως ένας επαγγελματίας υγείας. Η ικανότητα αυτή, όμως, δεν σημαίνει ότι μπορούν να καθοδηγήσουν με ασφάλεια έναν άνθρωπο που προσπαθεί να καταλάβει ποια είναι η αιτία των συμπτωμάτων του και αν χρειάζεται άμεση ιατρική βοήθεια.
Η δοκιμή σε πραγματικές συνθήκες
Αυτό ακριβώς θέλησαν να εξετάσουν οι ερευνητές. Δεν αξιολόγησαν απλώς τις γνώσεις της τεχνητής νοημοσύνης σε θεωρητικό επίπεδο, αλλά την αποτελεσματικότητά της σε ένα καθημερινό σενάριο: ένας πολίτης εμφανίζει συμπτώματα, ανοίγει ένα chatbot και ζητά συμβουλή.
Στη μελέτη συμμετείχαν 1.298 άτομα από το Ηνωμένο Βασίλειο, τα οποία κλήθηκαν να διαχειριστούν δέκα διαφορετικά ιατρικά περιστατικά σχεδιασμένα από γιατρούς. Οι συμμετέχοντες έπρεπε να αναγνωρίσουν ποιες παθήσεις θα μπορούσαν να εξηγούν τα συμπτώματα και, κυρίως, να αποφασίσουν ποια θα ήταν η σωστή αντίδραση: παραμονή στο σπίτι, επικοινωνία με γιατρό, επίσκεψη στα επείγοντα ή κλήση ασθενοφόρου.
Μία ομάδα χρησιμοποίησε τα τρία γλωσσικά μοντέλα που εξετάστηκαν, ενώ η ομάδα ελέγχου βασίστηκε στις συνήθεις πηγές πληροφόρησης, όπως αναζητήσεις στο διαδίκτυο και επίσημες ιστοσελίδες υπηρεσιών υγείας.
Καλή γνώση, όχι ασφαλής καθοδήγηση
Τα αποτελέσματα ανέδειξαν μια σημαντική διάκριση. Όταν τα μοντέλα είχαν στη διάθεσή τους όλα τα δεδομένα ενός περιστατικού – συμπτώματα, ιατρικό ιστορικό και λοιπές πληροφορίες – κατάφερναν να εντοπίσουν πιθανές διαγνώσεις στο 94,9% των περιπτώσεων.
Η εικόνα άλλαζε αισθητά όταν έπρεπε να προτείνουν την κατάλληλη ενέργεια. Η ακρίβεια περιοριζόταν στο 56,3%, γεγονός που δείχνει ότι η μετάβαση από τη θεωρητική γνώση στην ασφαλή ιατρική καθοδήγηση παραμένει εξαιρετικά δύσκολη.
Ακόμη πιο ανησυχητικό ήταν ότι οι συμμετέχοντες που χρησιμοποίησαν την τεχνητή νοημοσύνη δεν πέτυχαν καλύτερες επιδόσεις από όσους αναζήτησαν πληροφορίες με συμβατικά μέσα. Σε ορισμένες περιπτώσεις, μάλιστα, αναγνώρισαν λιγότερο σωστά τις πιθανές παθήσεις, ενώ ως προς την επιλογή της σωστής επόμενης ενέργειας δεν διαπιστώθηκε καμία ουσιαστική βελτίωση.
Το πρόβλημα βρίσκεται και στον τρόπο χρήσης
Οι ερευνητές επισημαίνουν ότι η δυσκολία δεν οφείλεται αποκλειστικά στην τεχνητή νοημοσύνη, αλλά και στον τρόπο με τον οποίο αλληλεπιδρούν μαζί της οι χρήστες.
Ένας άνθρωπος χωρίς ιατρικές γνώσεις συχνά δεν γνωρίζει ποια συμπτώματα έχουν μεγαλύτερη σημασία, παραλείπει κρίσιμες πληροφορίες ή διατυπώνει ερωτήσεις που οδηγούν τη συζήτηση προς συγκεκριμένη κατεύθυνση, όπως «μήπως είναι απλώς άγχος;». Έτσι, ακόμη κι αν το μοντέλο διαθέτει τη σωστή πληροφορία, μπορεί να μην καταφέρει να οδηγήσει τον χρήστη στη σωστή εκτίμηση.
Η ανάλυση των συνομιλιών αποκάλυψε πολλά τέτοια παραδείγματα. Σε αρκετές περιπτώσεις οι περιγραφές ήταν ελλιπείς, ενώ αλλού οι χρήστες δεν κατάφεραν να ξεχωρίσουν ποια στοιχεία της απάντησης είχαν πραγματική διαγνωστική σημασία.
Όταν η AI δίνει αντικρουόμενες απαντήσεις
Η μελέτη κατέγραψε και περιπτώσεις όπου τα ίδια τα μοντέλα παρουσίασαν σημαντικές ασυνέπειες.
Ορισμένες φορές επικεντρώνονταν σε δευτερεύουσες πληροφορίες, άλλες παρείχαν ασαφείς ή άσχετες οδηγίες, ακόμη και παραπομπές σε αριθμούς έκτακτης ανάγκης άλλων χωρών.
Σε χαρακτηριστικό παράδειγμα, δύο χρήστες περιέγραψαν σχεδόν πανομοιότυπα συμπτώματα — έντονο πονοκέφαλο, δυσκαμψία στον αυχένα και φωτοευαισθησία. Το ίδιο γλωσσικό μοντέλο συνέστησε στον έναν απλή αυτοφροντίδα, ενώ στον άλλον πρότεινε, σωστά, άμεση μετάβαση σε υπηρεσία επειγόντων περιστατικών.
Η συγκεκριμένη ασυνέπεια θεωρείται ιδιαίτερα κρίσιμη, καθώς στην ιατρική δεν αρκεί μια απάντηση να φαίνεται λογική. Πρέπει να είναι σταθερή, αξιόπιστη και ασφαλής.
Η ψευδαίσθηση της βεβαιότητας
Ένα ακόμη εύρημα αφορά στον τρόπο με τον οποίο παρουσιάζονται οι απαντήσεις.
Τα γλωσσικά μοντέλα διατυπώνουν τις εκτιμήσεις τους με αυτοπεποίθηση, σαφήνεια και ήρεμο τόνο, δημιουργώντας εύκολα την εντύπωση ότι γνωρίζουν με βεβαιότητα την κατάσταση. Αρκετοί συμμετέχοντες δήλωσαν ότι εμπιστεύθηκαν περισσότερο τις απαντήσεις επειδή «έδειχναν σίγουρες».
Οι επιστήμονες, όμως, υπογραμμίζουν ότι η βεβαιότητα στον τρόπο διατύπωσης δεν αποτελεί απόδειξη ιατρικής αξιοπιστίας.
Άλλο γνώση, άλλο ιατρική απόφαση
Η έρευνα αναδεικνύει και έναν ακόμη σημαντικό περιορισμό: οι υψηλές επιδόσεις των μοντέλων σε εξετάσεις γνώσεων δεν σημαίνουν ότι μπορούν να καθοδηγήσουν αποτελεσματικά πραγματικούς ασθενείς.
Ακόμη και στις προσομοιώσεις όπου οι άνθρωποι αντικαταστάθηκαν από τεχνητούς «ασθενείς», τα αποτελέσματα ήταν αισθητά καλύτερα από ό,τι στις πραγματικές συνομιλίες. Οι εικονικοί χρήστες περιέγραφαν τα συμπτώματα με πληρότητα και συνέπεια, κάτι που απέχει σημαντικά από τον τρόπο με τον οποίο ένας πραγματικός άνθρωπος αναζητά βοήθεια όταν ανησυχεί.
Οι συγγραφείς της μελέτης δεν απορρίπτουν τον ρόλο της τεχνητής νοημοσύνης στην υγεία. Αντίθετα, αναγνωρίζουν ότι μπορεί να αποτελέσει χρήσιμο εργαλείο ενημέρωσης και να συμβάλει στην καλύτερη πρόσβαση σε πληροφορίες.
Ωστόσο, καταλήγουν με σαφήνεια ότι κανένα από τα μοντέλα που εξετάστηκαν δεν είναι ακόμη κατάλληλο για να λειτουργήσει ως ασφαλές μέσο παροχής ιατρικής καθοδήγησης προς ασθενείς.
Η τεχνητή νοημοσύνη μπορεί να βοηθήσει κάποιον να ενημερωθεί ή να κατανοήσει καλύτερα μια ιατρική έννοια. Δεν μπορεί όμως να αντικαταστήσει την κλινική κρίση ενός γιατρού, ιδιαίτερα όταν πρέπει να αξιολογηθούν συμπτώματα που ενδέχεται να κρύβουν μια σοβαρή κατάσταση.
Η υπόσχεση της AI στην υγεία παραμένει ισχυρή. Μέχρι όμως να αποδειχθεί ότι μπορεί να λειτουργήσει με ασφάλεια σε πραγματικές συνθήκες, οι ειδικοί τονίζουν ότι πρέπει να αντιμετωπίζεται ως εργαλείο πληροφόρησης και όχι ως υποκατάστατο της ιατρικής διάγνωσης και της επαγγελματικής συμβουλής.
Διαβάστε ακόμη
Επένδυση 1 δισ. στον Πρίνο για αποθήκευση διοξειδίου του άνθρακα
Πρόγραμμα «Κατασκευάζω – Νοικιάζω»: Σπίτια με φθηνό ενοίκιο και μηδέν φόρο
Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα
