Το ενδιαφέρον εδώ είναι ότι οι προγραμματιστές της δεν την έχουν προικίσει ακριβώς με αυτή την άποψη ή με την κάθε άποψη. Στην πραγματικότητα ο τρόπος που λειτουργούν αυτά τα μηχανήματα είναι αρκετά απλός στη γενική του μορφή και έχει και μια ιδιαίτερη ομορφιά. Θα προσπαθήσω να το εξηγήσω όσο πιο απλά γίνεται:
Τα συστήματα αυτά τα ονομάζουμε LLMs (Large Language Models - Μεγάλα Μοντέλα Γλώσσας). Στην πραγματικότητα είναι ένα σύστημα το οποίο έχει τη δυνατότητα να αναδιατάσσεται και να αναδιοργανώνει τις “συνδέσεις” του εσωτερικά με στόχο να αναγνωρίζει και να αναπαράγει μοτίβα μετά από μια διαδικασία αρχικής εκπαίδευσης. Χωρίς τη διαδικασία εκπαίδευσης το μηχάνημα βγάζει μόνο θόρυβο (white noise) σαν έξοδο.
Η διαδικασία εκπαίδευσης γίνεται συγκεντρώνοντας όσο το δυνατόν περισσότερο υλικό σε μορφή κειμένου, το οποίο συνήθως προκύπτει από το διαδίκτυο (wikipedia, forums, διάφορα sites κτλ κτλ). Αυτό το υλικό μπορεί να είναι της τάξης των δισεκατομμυρίων λέξεων… Και στην συνέχεια το υλικό αυτό το δίνουν στο μηχάνημα να το διαβάσει. Όσο περισσότερο υλικό του δίνουν τόσο αυτό αναγνωρίζει τα περίπλοκα εσωτερικά μοτίβα της γλώσσας μας και κατ’ επέκταση τα εσωτερικά μοτίβα της ανθρώπινης σκέψης (αν αναγνωρίσουμε ότι η γλώσσα είναι ένα -περιορισμένο- μοντέλο της σκέψης μας).
Μετά αυτό το μοτίβο, μπορεί να το αναπαράγει. Στην πραγματικότητα αυτό που κάνει είναι δίνοντάς του μια πρόταση, αυτό ξεκινάει να τη συμπληρώνει σύμφωνα με το πώς θεωρεί ότι θα έπρεπε να συνεχίσει η πρόταση αυτή βάσει των μοτίβων που γνωρίζει. Η διαδικασία είναι κάπως έτσι:
Με αρχική φράση “Το παιδί πήγε…” το σύστημα προβλέπει ποια είναι η πιο πιθανή λέξη για να συνεχίσει η πρόταση, πχ “σχολείο” , “για”, “στο” κτλ.
Αυτό που είναι ενδιαφέρον είναι ότι για το μηχάνημα ό,τι μπορεί να αναπαρασταθεί ως χαρακτήρες κειμένου είναι ένα μοτίβο γλώσσας, έτσι με τον ίδιο τρόπο μπορεί να παράξει μουσική, ταμπλατούρες, ακολουθίες πρωτεΐνων και άλλα πολλά, μέχρι και να ζωγραφίσει χρησιμοποιώντας χαρακτήρες. Το μόνο που χρειάζεται είναι να έχει εκπαιδευτεί σε κάποιο αντίστοιχο περίπου παράδειγμα.
Αυτό που όμως βρίσκω ακόμα πιο ενδιαφέρον είναι ότι αν λάβουμε υπόψη μας την διαδικασία με την οποία εκπαιδεύτηκε το μηχάνημα, το σύνολο των “ιδεών” του είναι στην πραγματικότητα ένα αμάγαλμα των ιδεών που περιλαμβάνονται στο corpus που χρησιμοποιήθηκε για να εκπαιδευτεί, και άρα είναι ένα αμάγαλμα των ιδεών του συνόλου της ανθρωπότητας. (ή ένας μέσος όρος αυτού)
Ένα μεγάλο πρόβλημα των μοντέλων αυτών πχ είναι ότι πολύ συχνά είναι προκατειλημμένα με τις ίδιες προκαταλήψεις που έχει η πλειοψηφία της ανθρωπότητας. Πολύ συχνά εμφανίζουν σεξιστικές, ρατσιστικές, ομοφοβικές κτλ προκαταλήψεις.