του Ανδρέα Κοσιάρη
Από τις κυρίαρχες μιντιακές αφηγήσεις για τα μοντέλα Τεχνητής Νοημοσύνης, είναι δυνατόν να εξάγει κανείς το συμπέρασμα πως τα συστήματα αυτά έχουν μεγάλο βαθμό λειτουργικής αυτονομίας, πως δεν βασίζονται στη συνεχή ανθρώπινη εργασία για να εκτελέσουν τις δυνατότητές τους. Κάτι τέτοιο, όμως, δεν ισχύει σε κανένα επίπεδο.
Όπως έχουμε πει και παλιότερα, οι εφαρμογές τεχνητής νοημοσύνης δεν κάνουν τίποτε άλλο από το να επεξεργάζονται τον τεράστιο όγκο πληροφοριών που έχει δημιουργήσει ο άνθρωπος, αναμασώντας ουσιαστικά την ανθρώπινη γνώση και εφευρετικότητα.
Ακόμα, όμως, κι αυτή η επεξεργασία πληροφοριών και δεδομένων, θα ήταν αδύνατη χωρίς την εργασία εκατομμυρίων κακοπληρωμένων «ψηφιακών χαμάληδων», οι οποίοι φροντίζουν ώστε τα δεδομένα αυτά να έχουν τις σωστές ετικέτες και τη σωστή μορφή.
Ένα παράθυρο στη δουλειά και τη ζωή αυτών των εργαζομένων στις Φιλιππίνες, προσέφερε πρόσφατο ρεπορτάζ των Ρεμπέκα Ταν και Ρετζίνε Καμπάτο για την Washington Post. Περισσότερα από 2 εκατομμύρια άνθρωποι εκτιμάται πως κάνουν αυτή τη δουλειά μονάχα στις Φιλιππίνες, λαμβάνοντας κάτω και από τον κατώτατο μισθό δουλεύοντας για εξωχώριες εταιρείες αξίας δισεκατομμυρίων δολαρίων.
Η δουλειά τους είναι αναγκαία, διότι πολύ πέρα από αυτόνομα συστήματα, τα μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT, το DALL-E και το Midjourney, δεν μπορούν καν να κατανοήσουν τι περιέχουν οι πληροφορίες που τους εισάγεις, χωρίς κάποιος να τους το εξηγήσει.
Για παράδειγμα, εάν τους εισάγεις τα δεδομένα μίας εικόνας, δεν μπορούν να ξεχωρίσουν αν αυτό που περιέχει η εικόνα είναι δέντρα, καμηλοπαρδάλεις ή άνθρωποι — κάποιος άνθρωπος πρέπει να παρέμβει και να δημιουργήσει ετικέτες στα δεδομένα που να «εξηγούν» τι είναι το κάθε τι που φαίνεται σε αυτήν. Τα μοντέλα ΤΝ χρειάζονται λεπτομερείς περιγραφές για να ερμηνεύσουν σωστά τα δεδομένα τους.
Επίσης, στην περίπτωση της εισαγωγής δεδομένων κειμένου, το ανθρώπινο χέρι είναι απαραίτητο ώστε το κείμενο να έχει τη σωστή μορφή και να μην «ταΐζονται» ακαταλαβίστικα στο μοντέλο ΤΝ — αν μπουν ακαταλαβίστικα στο σύστημα, ακαταλαβίστικα θα βγάλει.
Η εργασία αυτή είναι κοπιώδης και πολύωρη — οι «ψηφιακοί χαμάληδες» που την πραγματοποιούν περνούν ατελείωτες ώρες μπροστά από οθόνες, στα σπίτια τους ή σε ίντερνετ-καφέ. Πολύ συχνά δουλεύουν μέσα σε ένα νομικό κενό αέρος, αδήλωτοι και χωρίς τη δυνατότητα διεκδίκησης εργασιακών δικαιωμάτων.
Και η εργασία τους δεν εγγυάται πως το παραγόμενο από τα μοντέλα αποτέλεσμα θα είναι ποιοτικό — μονάχα ότι τα μοντέλα θα «διαβάσουν» τα δεδομένα με ακρίβεια. Το ίδιο το περιεχόμενο των δεδομένων μπορεί να μην είναι ακριβές ή αληθές — στους δισεκατομμυριούχους δημιουργούς των μοντέλων αρκεί τα δεδομένα να είναι ευανάγνωστα και λεπτομερώς ετικετοποιημένα.
Όπως γράφαμε και πριν λίγους μήνες, ήδη από την αρχή της πρόσφατης έξαρσης των μοντέλων ΤΝ, παρατηρήθηκαν περιστατικά όπου η παραγόμενη από αυτά πληροφορία ήταν ψευδής ή «φανταστική». Κι αυτό διότι δεν υπάρχει ουσιαστικός έλεγχος στο τι ποιότητας δεδομένα εισάγονται σε αυτά τα συστήματα — «ταΐζονται» με τα πάντα. Το αποτέλεσμα είναι πως η παραγόμενη πληροφορία μπορεί να είναι αληθοφανής, αλλά μπορεί και να μην είναι αληθινή.
Και, όπως εικάζουν κάποιοι ειδικοί του τομέα, όσο αυξάνεται η παραγόμενη από ΤΝ πληροφορία στο διαδίκτυο, τόσο αυτή θα επιστρέφει για να τροφοδοτήσει με δεδομένα τα μοντέλα που την παρήγαγαν. Το αποτέλεσμα της τροφοδοσίας των μοντέλων με αυτά τα «συνθετικά δεδομένα», όπως αποκαλούνται, είναι η επιδείνωση της ποιότητας των παραγόμενων πληροφοριών και εν τέλει η κατάρρευσή τους.