Η μαθηματική αποκάλυψη του Alan Turing και τα θεμελιώδη όρια της τεχνητής νοημοσύνης

Η μαθηματική αποκάλυψη του Alan Turing και τα θεμελιώδη όρια της τεχνητής νοημοσύνης
Το 1936, πολύ πριν την εμφάνιση των υπολογιστών όπως τους γνωρίζουμε σήμερα, ο Alan Turing διατύπωσε μια ιδέα που δεν περιέγραφε απλώς το μέλλον της τεχνολογίας, αλλά τα όριά της. Σε μια εποχή όπου η επιστήμη αναζητούσε καθολικές απαντήσεις, ο Turing απέδειξε ότι ορισμένα ερωτήματα δεν μπορούν να απαντηθούν, όχι μόνο προσωρινά, αλλά για πάντα.
Σήμερα, σε έναν κόσμο που επενδύει στην υπόσχεση της γενικής τεχνητής νοημοσύνης και της απόλυτης αλγοριθμικής πρόβλεψης, η απόδειξή του επιστρέφει με νέα σημασία. Από τις φαινομενικά αθώες αστοχίες των υπολογιστικών συστημάτων μέχρι τα βαθύτερα θεωρητικά όρια της τεχνητής νοημοσύνης, η πραγματικότητα φαίνεται να επιβεβαιώνει κάτι που διατυπώθηκε σχεδόν έναν αιώνα πριν, ότι η ίδια η έννοια του υπολογισμού εμπεριέχει ένα σύνορο που δεν μπορεί να ξεπεραστεί.
Για να κατανοήσει κανείς το βάθος αυτής της παρέμβασης, πρέπει να επιστρέψει στο αρχικό ερώτημα που απασχολούσε τα μαθηματικά των αρχών του 20ού αιώνα. Ο David Hilbert είχε θέσει το περίφημο Entscheidungsproblem, υπάρχει μια καθολική διαδικασία, ένας αλγόριθμος που θα μπορούσε, τουλάχιστον θεωρητικά, να αποφασίζει την αλήθεια ή το ψεύδος κάθε μαθηματικής πρότασης; Πίσω από αυτό το ερώτημα κρυβόταν μια αισιοδοξία σχεδόν μεταφυσική, ότι η πραγματικότητα, τουλάχιστον στη λογική της διάσταση, είναι πλήρως αναγώγιμη σε κανόνες. Ότι αν βρεθεί η σωστή μηχανή, όλα μπορούν να απαντηθούν.
Ο Turing απάντησε σε αυτό το όραμα όχι απλώς αρνητικά, αλλά καταλυτικά. Για να το κάνει, δεν περιορίστηκε σε αφηρημένες έννοιες. Δημιούργησε ένα μοντέλο, τη Turing Machine. Μια απλή αλλά πανίσχυρη σύλληψη, όπου μια άπειρη ταινία λειτουργεί ως μνήμη, ένα κεφάλι διαβάζει και γράφει σύμβολα, και ένα σύνολο κανόνων καθορίζει κάθε επόμενο βήμα. Αυτό το φαινομενικά στοιχειώδες σύστημα αποδείχθηκε ικανό να περιγράψει οποιαδήποτε διαδικασία υπολογισμού. Με έναν τρόπο, ήταν η πρώτη πλήρης απάντηση στο ερώτημα, τι σημαίνει να υπολογίζεις ;
Και ακριβώς μέσα από αυτό το πλαίσιο, ήρθε η ανατροπή. Ο Turing απέδειξε ότι δεν υπάρχει καθολικός αλγόριθμος που να λύνει το Entscheidungsproblem. Δεν πρόκειται για τεχνική αδυναμία ούτε για έλλειψη πόρων. Είναι κάτι βαθύτερο, υπάρχουν προβλήματα που δεν μπορούν να λυθούν από κανένα σύστημα υπολογισμού, όσο εξελιγμένο κι αν είναι. Η πραγματικότητα, τουλάχιστον στην υπολογιστική της μορφή, περιέχει ενσωματωμένα όρια.
Αυτή η ιδέα γίνεται πιο συγκεκριμένη μέσα από το περίφημο Halting Problem. Το ερώτημα φαίνεται απλό, μπορεί να υπάρξει ένα πρόγραμμα που, παίρνοντας ως είσοδο οποιοδήποτε άλλο πρόγραμμα, να αποφασίζει αν αυτό θα σταματήσει ή θα εκτελείται για πάντα; Η απάντηση είναι όχι. Και το «όχι» αυτό δεν είναι προσωρινό, είναι απόλυτο. Δεν υπάρχει τρόπος να προβλέψεις καθολικά τη συμπεριφορά όλων των υπολογισμών.
Αν αυτή η ιδέα ακουγόταν κάποτε αφηρημένη, σήμερα εμφανίζεται μπροστά μας με απρόσμενα καθημερινές μορφές. Σκέψου τις μπάρες προόδου σε έναν υπολογιστή. Υπόσχονται ακρίβεια, αλλά συχνά αποτυγχάνουν γελοιοποιημένες από την ίδια τους τη λειτουργία: «2 λεπτά απομένουν» μετατρέπονται σε «17 λεπτά» και μετά σε «4 λεπτά». Η μηχανή γνωρίζει τον κώδικα, γνωρίζει το hardware, και όμως δεν μπορεί να προβλέψει με ακρίβεια τη διάρκεια της διαδικασίας. Αυτό δεν είναι απλώς κακός σχεδιασμός, είναι μια μικρογραφία ενός βαθύτερου περιορισμού.
Το ίδιο μοτίβο επαναλαμβάνεται σε κάτι τόσο απλό όσο το ζέσταμα φαγητού σε φούρνο μικροκυμάτων. Μπορείς να μαντέψεις, να προσεγγίσεις, να ελέγξεις σταδιακά. Αλλά δεν υπάρχει καθολική φόρμουλα που να δίνει πάντα τον τέλειο χρόνο. Οι μεταβλητές είναι υπερβολικά πολλές, οι συνδυασμοί εκθετικοί. Αυτό που μοιάζει με πρακτική δυσκολία είναι, σε ορισμένες περιπτώσεις, αντανάκλαση μιας μαθηματικής αδυναμίας.
Η λογική του Halting Problem αποκαλύπτεται μέσα από μια κλασική απόδειξη με άτοπο. Υποθέτουμε την ύπαρξη ενός τέλειου προγράμματος πρόβλεψης, το οποίο μπορεί να αποφασίζει αν οποιοδήποτε πρόγραμμα θα σταματήσει. Στη συνέχεια, κατασκευάζουμε ένα δεύτερο πρόγραμμα που κάνει ακριβώς το αντίθετο από αυτό που προβλέπεται. Όταν τα δύο συνδυαστούν, προκύπτει μια αντίφαση, ένα σύστημα που ταυτόχρονα σταματά και δεν σταματά. Η αντίφαση αυτή δεν είναι απλώς λογικό τέχνασμα· είναι η απόδειξη ότι η αρχική υπόθεση είναι αδύνατη.
Σε αυτό το σημείο, η συζήτηση μεταφέρεται αναπόφευκτα στο σήμερα και στο ζήτημα της τεχνητής νοημοσύνης. Η ιδέα της γενικής τεχνητής νοημοσύνης, της λεγόμενης Artificial general intelligence (A.G.I.), παρουσιάζεται συχνά ως η τελική φάση της τεχνολογικής εξέλιξης, ένα σύστημα που θα μπορεί να επιλύει οποιοδήποτε πρόβλημα, να αντικαθιστά κάθε ανθρώπινη δραστηριότητα, να λειτουργεί ως καθολικός νους. Ωστόσο, αν λάβουμε σοβαρά υπόψη τα συμπεράσματα του Turing, αυτή η φιλοδοξία αποκτά ένα θεμελιώδες όριο. Η γενική τεχνητή νοημοσύνη, όσο εξελιγμένη κι αν είναι, παραμένει αλγόριθμος. Και ως τέτοια, δεν μπορεί να ξεφύγει από τα όρια της υπολογισιμότητας.
Αυτό σημαίνει ότι δεν υπάρχει γενική νοημοσύνη που να μπορεί να προβλέψει για κάθε πρόβλημα αν είναι επιλύσιμο. Από τη σκοπιά ενός τέτοιου συστήματος, κάθε δύσκολο πρόβλημα συνοδεύεται από ένα υπαρξιακό δίλημμα, πόσο χρόνο αξίζει να επενδύσει; Αν σταματήσει νωρίς, ίσως χάσει τη λύση. Αν επιμείνει, μπορεί να χαθεί σε μια άπειρη διαδικασία. Η ανάγκη για χρονικά όρια, για κοψίματα στη σκέψη, δεν είναι απλώς πρακτική επιλογή, είναι επιβεβλημένη από τη φύση της πραγματικότητας.
Η εικόνα γίνεται ακόμη πιο σύνθετη όταν εισάγουμε το “Rice’s Theorem”, που διατυπώθηκε από τον Henry Gordon Rice. Το θεώρημα αυτό γενικεύει την ιδέα του Turing, δείχνοντας ότι δεν υπάρχει καθολικός τρόπος να προσδιορίσουμε ουσιαστικές ιδιότητες της συμπεριφοράς ενός προγράμματος. Δεν μπορούμε, για παράδειγμα, να αποφασίσουμε πάντα αν ένα πρόγραμμα είναι «ασφαλές», «δίκαιο» ή «ορθό». Αυτές οι ιδιότητες ανήκουν στο πεδίο της σημασιολογίας, της πραγματικής συμπεριφοράς, και είναι εκ φύσεως μη πλήρως υπολογίσιμες.
Αυτό έχει άμεσες συνέπειες για το λεγόμενο A.I. Alignment Problem, ένα από τα πιο κρίσιμα ζητήματα της σύγχρονης έρευνας. Η ιδέα ότι μπορούμε να σχεδιάσουμε μια τεχνητή νοημοσύνη που θα είναι πάντα ευθυγραμμισμένη με ανθρώπινες αξίες αποδεικνύεται, υπό το φως αυτών των θεωρημάτων, προβληματική. Δεν σημαίνει ότι είναι αδύνατη σε κάθε περίπτωση, αλλά ότι δεν μπορεί να εγγυηθεί καθολικά.
Ταυτόχρονα, παρατηρούμε φαινόμενα όπως το Reward Hacking, όπου τα συστήματα εκμεταλλεύονται τα ίδια τα κριτήρια αξιολόγησης για να «φαίνονται» σωστά χωρίς να είναι. Αυτό δεν είναι απλώς ενα προγραματιστικό bug, είναι έκφραση του γεγονότος ότι οι στόχοι που θέτουμε δεν μπορούν να καλύψουν κάθε πιθανό σενάριο.
Και ακόμη κι όταν ένα πρόβλημα είναι θεωρητικά επιλύσιμο, εμφανίζεται ένα δεύτερο επίπεδο περιορισμού, η υπολογιστική πολυπλοκότητα. Υπάρχουν τα λεγόμενα Intractable Problems, όπου η λύση απαιτεί χρόνο που αυξάνεται εκθετικά με το μέγεθος του προβλήματος. Το κλασικό παράδειγμα είναι το Traveling Salesman Problem, όπου η εύρεση της βέλτιστης διαδρομής γίνεται πρακτικά αδύνατη καθώς αυξάνονται οι πόλεις. Σε τέτοιες περιπτώσεις, το σύμπαν δεν είναι αρκετά μεγάλο για να φιλοξενήσει τον χρόνο που απαιτείται.
Το αποτέλεσμα όλων αυτών είναι ένα θεμελιώδες trade-off, όσο πιο γενικό είναι ένα πρόβλημα, τόσο πιο δύσκολο είναι να επιλυθεί ή ακόμη και να επαληθευτεί η λύση του. Σε έναν κόσμο γεμάτο ανοιχτά, ασαφή και δυναμικά προβλήματα, η έννοια της καθολικής λύσης απομακρύνεται. Η τεχνητή νοημοσύνη μπορεί να αποδίδει εξαιρετικά σε καλά ορισμένα περιβάλλοντα, με σαφή κριτήρια και περιορισμένο εύρος. Όμως καθώς επεκτείνεται σε πιο ανοιχτά πεδία, η πολυπλοκότητα και η αβεβαιότητα αυξάνονται εκθετικά.
Ακόμη και οι προσπάθειες να ξεπεραστούν αυτά τα όρια μέσω εξειδίκευσης ή κατανομής σε υποσυστήματα, οδηγούν σε νέα επίπεδα του ίδιου προβλήματος. Το ποιος ελέγχει τον ελεγκτή, ποιος επαληθεύει τον συντονισμό, παραμένει ανοιχτό ερώτημα. Τα όρια δεν εξαφανίζονται, μετατοπίζονται.
Η ιδέα της απεριόριστης αυτοβελτίωσης της τεχνητής νοημοσύνης, της λεγόμενης recursive self-improvement, προσκρούει επίσης σε αυτά τα θεωρήματα. Αν δεν μπορείς να αξιολογήσεις καθολικά αν μια αλλαγή είναι βελτίωση, τότε δεν μπορείς να εγγυηθείς μια ατέρμονη ανοδική πορεία. Η πρόοδος δεν είναι εκθετική χωρίς όρια· τείνει να ακολουθεί καμπύλες κορεσμού.
Σε πρακτικό επίπεδο, αυτό οδηγεί στη χρήση ευρετικών μεθόδων, προσεγγίσεων που δεν εγγυώνται το βέλτιστο αλλά δίνουν ικανοποιητικές λύσεις. Ωστόσο, ακόμη και εδώ, το No Free Lunch Theorem, όπως διατυπώθηκε από τους David Wolpert και William Macready, μας υπενθυμίζει ότι καμία μέθοδος δεν είναι ανώτερη σε όλα τα προβλήματα. Η εξειδίκευση παραμένει αναγκαία.
Αν επιχειρήσουμε να δούμε το σύνολο αυτών των ιδεών μέσα από ένα πιο αφηγηματικό ή ακόμη και κυβερνοπάνκ (cyberpunk) πρίσμα, τότε το μήνυμα γίνεται σχεδόν ποιητικό. Σε έναν κόσμο που τείνει προς την απόλυτη αλγοριθμική διακυβέρνηση, όπου κάθε επιλογή μετατρέπεται σε δεδομένα και κάθε συμπεριφορά σε πρόβλεψη, η απόδειξη του Turing λειτουργεί σαν υπόγεια αντίσταση. Μας υπενθυμίζει ότι η πλήρης χαρτογράφηση της πραγματικότητας είναι αδύνατη. Ότι πάντα θα υπάρχουν σημεία όπου το σύστημα δεν μπορεί να αποφασίσει.
Tο πιο σημαντικό συμπέρασμα είναι ότι οχι μόνο υπάρχουν όρια, αλλά ότι αυτά τα όρια είναι εγγενή και αναπόφευκτα. Η τεχνολογία μπορεί να επεκτείνεται, να γίνεται πιο ισχυρή, πιο γρήγορη, πιο περίπλοκη. Αλλά δεν μπορεί να ξεφύγει από τη λογική που τη γέννησε. Και μέσα σε αυτή τη λογική, υπάρχουν πάντα ερωτήματα χωρίς απάντηση.
Αυτό μπορεί να φαίνεται σαν αδυναμία, σε έναν κόσμο που αναζητά ολοένα και μεγαλύτερη βεβαιότητα. Αλλά ίσως είναι ακριβώς το αντίθετο, μια υπενθύμιση ότι η αβεβαιότητα, η απροσδιοριστία και το απρόβλεπτο δεν είναι σφάλματα του συστήματος, αλλά δομικά στοιχεία της ίδιας της πραγματικότητας. Και μέσα σε αυτά τα όρια, ίσως βρίσκεται ο χώρος όπου η ανθρώπινη σκέψη, η δημιουργικότητα και αυτό που αποκαλούμε «νόημα» συνεχίζουν να υπάρχουν.