Και τώρα;

200 χρόνια μετά ξέρουμε πώς να ελαχιστοποιούμε τα σφάλματα.


Κίμων Δρακόπουλος
Επίκουρος Καθηγητής στο University of Southern California, ΗΠΑ

 

Τις τελευταίες δεκαετίες η τεχνητή νοημοσύνη, και ιδίως η μηχανική εκμάθηση, έχει αλλάξει διάφορες πτυχές της ζωής μας και έχει ανοίξει νέους ορίζοντες στον τρόπο με τον οποίο τα δεδομένα χρησιμοποιούνται για τη βελτίωση (ή μη) της καθημερινότητας. Η βασική ιδέα που κρύβεται πίσω από όλα τα μοντέλα μηχανικής εκμάθησης παραμένει η ίδια εδώ και δύο εκατονταετίες. Συγκεκριμένα, χρησιμοποιώντας ιστορικά δεδομένα, προσπαθούμε να μάθουμε μία σχέση μεταξύ της ποσότητας που θέλουμε να προβλέψουμε και όλων των υπόλοιπων παραμέτρων που θεωρούμε ότι σχετίζονται με την ποσότητα αυτή.

Η σύγχρονη επιστημονική κοινότητα οφείλει να εξασφαλίσει την αλγοριθμική διαφάνεια, αλλά και να αντιμετωπίσει αλγοριθμικές προκαταλήψεις.

Μία από τις πρώτες απόπειρες συστηματικής εκμάθησης ενός τέτοιου μοντέλου έγινε από τον Legendre (1805) με στόχο την πρόβλεψη της κίνησης των πλανητών. Το μοντέλο αυτό, του οποίου διαφορετικές εκφάνσεις ήταν ιδιαίτερα δημοφιλείς μέχρι σχετικά πρόσφατα, είχε το τεράστιο πλεονέκτημα της υπολογιστικής απλότητας – σε μεγάλο βαθμό οι υπολογισμοί μπορούσαν να γίνουν «με το χέρι». Από την άλλη, το (φαινομενικά) απλό αυτό μοντέλο υποθέτει μία ιδιαίτερα απλοϊκή σχέση μεταξύ των δεδομένων, γεγονός που καθιστά τις προβλέψεις του λιγότερο ακριβείς.

Πρόσφατα μια σειρά από εξελίξεις στα μαθηματικά της βελτιστοποίησης, καθώς και στην υπολογιστική δύναμη έδωσαν τη δυνατότητα στα μοντέλα μηχανικής εκμάθησης να εκπαιδεύονται σε πιο σύνθετες σχέσεις μεταξύ δεδομένων σχετικά γρήγορα, επιτρέποντας έτσι πολύ ισχυρές προβλέψεις βασισμένες σε τεράστια ποσότητα δεδομένων.

Είναι λοιπόν φυσική η ερώτηση: Αφού μπορούμε να προβλέπουμε τόσο καλά, γιατί η τεχνητή νοημοσύνη δεν βρίσκεται παντού γύρω μας, επαναπροσδιορίζοντας ριζικά την καθημερινότητά μας; Στις περισσότερες εφαρμογές, η απάντηση δεν είναι η έλλειψη δεδομένων ή η τεχνική ανεπάρκεια. Ο βασικός λόγος είναι πως η επιστημονική κοινότητα δικαιολογημένα αφοσιώθηκε για δεκαετίες στην υπολογιστικά αποτελεσματική εκμάθηση σύνθετων μοντέλων, αφήνοντας στο παρασκήνιο όλους τους παράγοντες που θα επιτρέψουν την εφαρμογή και την αποδοχή αυτών των εργαλείων σε ευρεία κλίμακα. Από όλους αυτούς τους παράγοντες θα συζητήσω τους –κατά τη γνώμη μου– δύο πιο σημαντικούς.

Πρώτον, οφείλουμε να εξασφαλίσουμε την αλγοριθμική διαφάνεια. Σε μεγάλο βαθμό οι λύσεις που παρέχει η τεχνητή νοημοσύνη θα χρησιμοποιηθούν από ανθρώπους μη εξειδικευμένους στην Επιστήμη των Δεδομένων. Προκύπτει λοιπόν το θέμα της εμπιστοσύνης. Για ποιον λόγο ένας επαγγελματίας υγείας να εμπιστευτεί ένα σύστημα που προβλέπει την εξέλιξη του καρκίνου ή την αυτοματοποιημένη διάγνωση; Για ποιον λόγο οι πολίτες, η Δικαιοσύνη και οι κυβερνήσεις να εμπιστευτούν συστήματα που προβλέπουν την πιθανότητα κατηγορούμενοι ή καταδικασμένοι να εγκληματήσουν ξανά; Δυστυχώς, τα σύγχρονα συστήματα μηχανικής εκμάθησης, λόγω της υψηλής πολυπλοκότητας, είναι «μαύρα κουτιά» ακόμα και γι’ αυτούς που τα σχεδιάζουν. Με άλλα λόγια, είναι δύσκολο έως αδύνατο το σύστημα να εξηγήσει τις προβλέψεις του με τρόπο κατανοητό από μη εξειδικευμένο κοινό. Προκειμένου λοιπόν η τεχνητή νοημοσύνη να γίνει αποδεκτή από το ευρύ κοινό, τα μοντέλα πρέπει να ανασχεδιαστούν ώστε να επιτρέπουν την περιγραφή των βασικών σχέσεων αιτίου και αιτιατού με τρόπο απλό και κατανοητό.

Δεύτερον, η επιστημονική κοινότητα πρέπει να αντιμετωπίσει αλγοριθμικές προκαταλήψεις. Όσο οξύμωρο και αν ακούγεται επιφανειακά, όλα τα μοντέλα, όσο σύνθετα και αν είναι, εκπαιδεύονται σε ιστορικά δεδομένα. Δυστυχώς, η ανθρώπινη ιστορία χαρακτηρίζεται από μια σειρά συστημικών προκαταλήψεων εναντίον διαφορετικών ομάδων του πληθυσμού. Οι προκαταλήψεις αυτές μολύνουν τα δεδομένα και, άρα, τα μοντέλα τα οποία βασίστηκαν σε αυτά. Κλασικό παράδειγμα είναι συστήματα τα οποία σχεδιάστηκαν για την αυτοματοποιημένη βαθμολόγηση βιογραφικών. Τα συστήματα σχεδιάστηκαν ώστε να μάθουν τη σχέση μεταξύ βιογραφικού και επαγγελματικής ανέλιξης. Από την άλλη, επί πολλές δεκαετίες και σε μεγάλο βαθμό μέχρι σήμερα, οι σεξιστικές και φυλετικές διακρίσεις στον επαγγελματικό χώρο δεν επέτρεψαν σε ιδιαίτερα ταλαντούχους εργαζομένους να διακριθούν. Έτσι, και τα ίδια τα μοντέλα που σχεδιάστηκαν να επιτυγχάνουν μικρό σφάλμα στα ιστορικά δεδομένα αναπαράγουν αυτές τις διακρίσεις, βαθύνοντας το χάσμα μεταξύ πραγματικής αξίας και επαγγελματικής καταξίωσης σε τέτοιες υποεκπροσωπούμενες μειονότητες.

Το πεδίο μας βρίσκεται σε ένα σημείο όπου οι υπολογιστικές μας δυνατότητες έχουν ξεπεράσει κατά πολύ τις ανάγκες της κοινωνίας. Η εφαρμογή των εργαλείων της επιστήμης μας είναι δυσανάλογη της προβλεπτικής τους δύναμης, και το κενό αυτό οφείλεται σε μεγάλο βαθμό στην έμφαση που δόθηκε στην ελαχιστοποίηση των σφαλμάτων, εις βάρος της αντιμετώπισης και μοντελοποίησης των πρακτικών εμποδίων μεταξύ θεωρίας και πράξης.

Με άλλα λόγια, ήρθε η ώρα το πεδίο μας να πάρει μια ανάσα και να αναρωτηθεί γιατί κάνουμε αυτό που κάνουμε και πώς θα χρησιμοποιήσουμε τα κεκτημένα για να αλλάξουμε την ανθρωπότητα προς το καλύτερο.

 

Επιστροφή στο ΤΕΥΧΟΣ 41ο - ΝΟΕΜΒΡΙΟΣ - ΔΕΚΕΜΒΡΙΟΣ 2021