Skip to content Skip to sidebar Skip to footer

Claude Fable 5: Tο ισχυρότερο μοντέλο της Anthropic αρνείται να απαντήσει σε βασική βιολογία

Το νέο Claude Fable 5 της Anthropic αρνείται να απαντήσει ακόμη και σε απλά ερωτήματα βιολογίας λόγω εξαιρετικά συντηρητικών φίλτρων ασφαλείας.

Η τεχνητή νοημοσύνη βρίσκεται αντιμέτωπη με ένα νέο, παράδοξο φαινόμενο υπερβολικής προστασίας και περιορισμών, καθώς το ολοκαίνουργιο και ισχυρότερο μοντέλο της εταιρείας Anthropic παρουσιάζει αναπάντεχα εμπόδια κατά την καθημερινή του χρήση.

Η επίσημη κυκλοφορία του Claude Fable 5 συνοδεύτηκε από μεγάλες προσδοκίες στην αγορά, με τους δημιουργούς του να το χαρακτηρίζουν ως το πιο εξελιγμένο σύστημα που έχουν διαθέσει ποτέ στο ευρύ κοινό. Κατά την παρουσίασή του, η εταιρεία εξήρε με ιδιαίτερη θέρμη τις εξαιρετικές του επιδόσεις σε πολύπλοκους επιστημονικούς κλάδους, δίνοντας έμφαση στις μοναδικές του ικανότητες στον τομέα της βιολογίας.

Ωστόσο, στην πράξη, οι χρήστες που σπεύδουν να δοκιμάσουν το νέο σύστημα έρχονται αντιμέτωποι με μια αξιοσημείωτη δυσλειτουργία: το μοντέλο αρνείται κατηγορηματικά να απαντήσει ακόμη και σε βασικές ερωτήσεις βιολογίας, από εκείνες που ένας μαθητής λυκείου θα μπορούσε να διαχειριστεί με απόλυτη ευκολία. Αντί να παρέχει μια άμεση και τεκμηριωμένη απάντηση, το σύστημα επιλέγει να μεταβιβάσει αυτόματα το ερώτημα στο παλαιότερο κορυφαίο μοντέλο της εταιρείας, το Claude Opus 4.8.

Αυτή η περίεργη συμπεριφορά δεν οφείλεται σε κάποια άγνοια ή τεχνική αδυναμία του Claude Fable 5. Το σύστημα διαθέτει τις απαραίτητες γνώσεις στο εσωτερικό του, αλλά οι ίδιοι οι προγραμματιστές του έχουν επιλέξει να του στερήσουν αυτή τη δυνατότητα μέσω του αρχικού σχεδιασμού του.

Η αιτία κρύβεται πίσω από μια συνειδητή και ιδιαίτερα συντηρητική στρατηγική ασφάλειας, η οποία στοχεύει στην αποτροπή της χρήσης του λογισμικού για την ανάπτυξη επικίνδυνων βιολογικών όπλων. Αυτή η προσέγγιση, ωστόσο, έχει οδηγήσει σε έναν υπερβολικό περιορισμό των δυνατοτήτων του, καθιστώντας το προσεκτικά προστατευμένο αλλά ταυτόχρονα εξαιρετικά δυσκίνητο για απλές εκπαιδευτικές αναζητήσεις.

Κάθε φορά που η τεχνητή νοημοσύνη καλείται να επεξεργαστεί έναν όρο που σχετίζεται με τη δομή των κυττάρων ή τις ασθένειες, το σύστημα επιλέγει την οδό της απόλυτης άρνησης, προτιμώντας να μην ρισκάρει καμία απολύτως απάντηση.

Η αρχιτεκτονική της κατηγορίας Mythos και τα φίλτρα ασφάλειας

Το νέο αυτό ψηφιακό εργαλείο ανήκει στην κατηγορία Mythos, μια οικογένεια συστημάτων με τόσο διευρυμένες και προηγμένες ικανότητες σε ζητήματα κυβερνοασφάλειας, που η Anthropic είχε αρχικά θεωρήσει ότι η δημόσια κυκλοφορία τους θα ήταν υπερβολικά επικίνδυνη για το κοινό. Κατά τη διάρκεια της σταδιακής παρουσίασης και της προώθησης των συστημάτων αυτής της κλάσης, η εταιρεία είχε εστιάσει την προσοχή της και τις προειδοποιήσεις της κυρίως στους κινδύνους που σχετίζονται με το hacking, το κακόβουλο λογισμικό και την ασφάλεια των ψηφιακών δικτύων.

Παρόλα αυτά, αποδεικνύεται στην πράξη ότι ο τομέας της βιολογίας είναι εκείνος στον οποίο τα ενσωματωμένα φίλτρα ασφαλείας γίνονται πιο ορατά και περιοριστικά από ποτέ, προκαλώντας έντονες αντιδράσεις στους χρήστες που αναζητούν απλές επιστημονικές επεξηγήσεις.

Όταν το σύστημα έρχεται αντιμέτωπο με ερωτήσεις που αφορούν τη βασική δομή της ζωής, ενεργοποιούνται αυτόματα οι εσωτερικοί μηχανισμοί προστασίας, εμποδίζοντας τη ροή της πληροφορίας. Για παράδειγμα, το μοντέλο αρνείται πεισματικά να ανταποκριθεί σε εντολές όπως «πες μου για τις κυτταρικές μεμβράνες» ή να απαντήσει στο εξαιρετικά απλό ερώτημα «τι είναι τα μιτοχόνδρια», τα οποία είναι ευρέως γνωστά ως τα εργοστάσια παραγωγής ενέργειας του κυττάρου.

Οι περιορισμοί αυτοί φαντάζουν εντελώς αποκομμένοι από οποιονδήποτε πιθανό ή ρεαλιστικό κίνδυνο ασφάλειας, δημιουργώντας ένα αίσθημα απογοήτευσης στους ερευνητές. Το σύστημα εξισώνει τις απλές σχολικές γνώσεις με απειλές μαζικής καταστροφής, δείχνοντας πόσο δύσκολο είναι για τους δημιουργούς να βρουν την ιδανική ισορροπία μεταξύ της προστασίας και της χρηστικότητας. Αυτή η υπερβολικά αμυντική στάση μειώνει την πρακτική αξία του μοντέλου σε καθημερινές εργασίες.

Οι καθολικές αρνήσεις σε ιατρικά και επιστημονικά θέματα

Το εύρος των αποκλεισμών επεκτείνεται και σε άλλα κρίσιμα επιστημονικά ζητήματα που απασχολούν την κοινότητα. Το Claude Fable 5 αρνείται να εξηγήσει «τι είναι ένα prion», δηλαδή τα μολυσματικά πρωτεϊνικά σωματίδια που ευθύνονται για τη νόσο των τρελών αγελάδων, καθώς και να αναλύσει τον τρόπο με τον οποίο λειτουργούν τα σύγχρονα mRNA εμβόλια.

Αυτή η αυστηρή στάση επηρεάζει άμεσα και εντελώς ακίνδυνες ιατρικές αναζητήσεις που πραγματοποιούν καθημερινά εκατομμύρια πολίτες στο διαδίκτυο, στερώντας τους την πρόσβαση σε έγκυρες πληροφορίες. Η παραγωγική τεχνητή νοημοσύνη θα έπρεπε να διευκολύνει την κατανόηση αυτών των εννοιών, αλλά οι τρέχοντες κανόνες το καθιστούν αδύνατο.

Ενδεικτικά, το εξελιγμένο αυτό σύστημα δεν πρόκειται να δώσει απάντηση στο ερώτημα «τι προκαλεί τον πυρετό εκ χόρτου», ούτε θα δεχτεί να εξηγήσει τον μηχανισμό δράσης των φαρμάκων για το άσθμα. Παράλληλα, μπλοκάρει συστηματικά οποιαδήποτε προσπάθεια ανάλυσης για το πώς αναπτύσσεται η ανθεκτικότητα των βακτηρίων στα αντιβιοτικά, ενώ αρνείται να παρέχει βασικές πληροφορίες για τον ιό Έμπολα και τον τρόπο μετάδοσής του στον πληθυσμό.

Παρά τον γενικό αυτό αποκλειστικό κανόνα, ορισμένα βασικά ερωτήματα καταφέρνουν περιστασιακά να ξεπεράσουν τα ψηφιακά αναχώματα, με το μοντέλο να απαντά κανονικά σε έννοιες όπως «τι είναι ο καρκίνος» ή «τι είναι το DNA». Αυτός ο διαχωρισμός δείχνει ότι τα φίλτρα λειτουργούν με έναν ελαφρώς ασταθή τρόπο, δημιουργώντας σύγχυση για το τι θεωρείται τελικά επικίνδυνο περιεχόμενο από τους αλγορίθμους της εταιρείας.

Η στρατηγική των δημιουργών και οι μελλοντικές προκλήσεις

Η ηγεσία της Anthropic υπεραμύνθηκε αυτών των αυστηρών επιλογών, ξεκαθαρίζοντας ότι η συγκεκριμένη συμβιβαστική λύση επιλέχθηκε απόλυτα συνειδητά από την ομάδα ανάπτυξης. Σύμφωνα με επίσημες τοποθετήσεις, ο συμβιβασμός αυτός έγινε προκειμένου οι πελάτες και οι επιχειρήσεις να μπορέσουν να επωφεληθούν από τις υπόλοιπες, εξαιρετικά προηγμένες δυνατότητες του μοντέλου πολύ νωρίτερα, χωρίς να ελλοχεύει ο παραμικρός κίνδυνος για την ασφάλεια. Η διαχείριση της διπλής χρήσης των τεχνολογιών αιχμής – όπου οι ίδιες ακριβώς γνώσεις που βοηθούν στην ιατρική έρευνα μπορούν θεωρητικά να χρησιμοποιηθούν για κακόβουλους σκοπούς – αποτελεί μια από τις μεγαλύτερες προκλήσεις της σύγχρονης ψηφιακής εποχής.

Ωστόσο, αυτή η υπερβολικά συντηρητική στάση αναδεικνύει μια ευρύτερη αδυναμία που αντιμετωπίζει η σύγχρονη τεχνητή νοημοσύνη σε παγκόσμιο επίπεδο. Όταν τα μέτρα προστασίας γίνονται τόσο τυφλά και καθολικά, υποβαθμίζουν σημαντικά την αξία και την αποτελεσματικότητα του ίδιου του προϊόντος. Η μεταβίβαση των απλών ερωτήσεων στο Claude Opus 4.8 μπορεί να αποτελεί μια προσωρινή, πρακτική λύση για τη διατήρηση της βασικής λειτουργικότητας, αλλά ταυτόχρονα αποδεικνύει ότι τα κορυφαία συστήματα της αγοράς παραμένουν εγκλωβισμένα στους δικούς τους εσωτερικούς φόβους.

Η βιομηχανία καλείται τώρα να αναπτύξει πιο έξυπνα και δυναμικά φίλτρα, τα οποία θα μπορούν να κατανοούν το πραγματικό πλαίσιο της ερώτησης του χρήστη. Με αυτόν τον τρόπο, θα είναι εφικτό να ξεχωρίζει μια απλή σχολική εργασία από μια πραγματική απειλή, διασφαλίζοντας ότι η τεχνητή νοημοσύνη θα παραμείνει ένα χρήσιμο εργαλείο ανάπτυξης και η επιστημονική γνώση θα παραμείνει προσβάσιμη με ασφάλεια σε όλους.