Κάποτε ο διακεκριμένος μαθηματικός, γνωστός κυρίως για τα επιτεύγματα του στην διαφορική γεωμετρία, Eugenio Calabi, είχε διατυπώσει με έναν πολύ έξυπνο τρόπο την μεγάλη διαφορά σκέψης μεταξύ θεωρητικών και εφαρμοσμένων μαθηματικών.
Ο θεωρητικός μαθηματικός, εξήγησε ο Ιταλός, όταν αντιμετωπίζει δυσκολίες στην επίλυση ενός προβλήματος προσπαθεί να «στενέψει» τις προϋποθέσεις ώστε να βγει από το αδιέξοδο. Ο εφαρμοσμένος, αντιλαμβάνεται πως πρέπει να διευρύνει τις μαθηματικές του γνώσεις, ώστε να βρει καινούργια και καλύτερα εργαλεία.
Η άποψη του Ιταλού αποτυπώνει παράλληλα τις διαφορές, αλλά και την αλληλεξάρτηση των δύο τεράστιων κλάδων. Τα μαθηματικά, όταν περιορίζονται μόνο στην σφαίρα του φαντασιακού, καταλήγουν να γίνουν ανούσια. Η εφαρμογή τους από την άλλη, πάντα θα στηρίζεται στα θεμέλια της επιστήμης, με οποιαδήποτε νέα έννοια να πλαισιώνεται αυστηρά από τις παλαιότερες θεωρητικές δομές.
Στην εποχή μας, στα χρόνια του διαδικτύου και της συσσώρευσης πληροφοριών, εμφανίζεται ένα από αυτά τα εμπόδια, στον χώρο της πληροφορικής και του προγραμματισμού. Ενα αδιέξοδο για... εφαρμοσμένους μαθηματικούς. Ο όρος Big Data τα τελευταία χρόνια ακούγεται ολοένα και περισσότερο. Εταιρίες, κρατικές υπηρεσίες, αλλά και ερευνητικές ομάδες, βρίσκονται καθημερινά αντιμέτωπες με αμέτρητα δεδομένα που πρέπει να διαχειριστούν και να επεξεργαστούν.
Τι είναι τα Big Data
Η έννοια «Big Data» αντιπροσωπεύει τα σύνολα δεδομένων που είναι τόσο μεγάλα και πολύπλοκα, ώστε να μην μπορούν να αντιμετωπιστούν με παραδοσιακές μεθόδους και λύσεις. Τα δεδομένα αυξάνονται συνεχώς, σε βαθμό που προκαλεί τεράστιες αδυναμίες στην ανάλυση τους. Στον αιώνα της πληροφορίας, όπως έχει χαρακτηριστεί από πολλούς η σημερινή εποχή, η ανάγκη εύρεσης μεθόδων επεξεργασίας είναι πιο άμεση από ποτέ. Το πρόβλημα των Big Data, αυτο-δημιουργημένο μέσα από τις συνθήκες της εποχής, καθρεφτίζει το «πρόσωπο» των μαθηματικών και της λογικής επαγωγής.
Στην προσπάθεια μας να μάθουμε πως να χειριζόμαστε κατάλληλα τα Big Data, αυτή η άρρηκτη και «πυκνή» σύνδεση θεωρητικών και εφαρμοσμένων μαθηματικών γίνεται ιδιαίτερα εμφανής. Θα μπορούσαμε να πούμε πως αυτή τη στιγμή βρισκόμαστε μπροστά στο αδιέξοδο που αναφερόταν ο Calabi. Η μαθηματική κατανόηση που έχουμε σήμερα γύρω από την «επανάσταση» των τεράστιων δεδομένων και πολύ περισσότερο γύρω από τις τεχνικές που χρησιμοποιούνται για να τα αναλύσουμε, είναι τουλάχιστον... ανεπαρκής.
Το παράδειγμα της Επιβλεπόμενης Μαθησης - Οι αλγόριθμοι των μεγαλύτερων εταιριών παγκοσμίως
Το απλούστερο παράδειγμα είναι αυτό της Επιβλεπόμενης Μάθησης, μιας τεχνικής ανάπτυξης αλγορίθμων που χρησιμοποιείται από εταιρείες όπως η Google, το Facebook και η Apple για να δημιουργήσουν μηχανές φωνητικής ή οπτικής αναγνώρισης με σχεδόν ανθρώπινη ακρίβεια. Αυτή η τεχνική περιλαμβάνει ένα τεράστιο σύνολο από αρχικά «δεδομένα μάθησης», εκατομμυρίων ή και δισεκατομμυρίων φωνητικών εγγραφών ή εικόνων, που χρησιμοποιούνται για να «εκπαιδεύσουν» τους... νευρώνες της αλγοριθμικής σκέψης, δημιουργώντας στατιστικά δεδομένα και πιθανολογικές σχέσεις.
Ενας δυνατός υπολογιστής μπορεί να προγραμματιστεί ώστε να «μάθει» από όλα αυτά τα δεδομένα, χωρίς να χρειάζεται να παρέμβει το ανθρώπινο χέρι σε κάθε μικρή λεπτομέρεια. Αυτά τα μοντέλα δέχονται αρχικές πληροφορίες, με στόχο να τις χρησιμοποιήσουν στο μέλλον για να αναλύσουν τις «άγνωστες» πληροφορίες που θα δεχτούν.
Σαν να έχουμε μια συνάρτηση, χωρίς να ξέρουμε τον τύπο της. Η συνάρτηση έχει ένα πεδίο ορισμού και ένα πεδίο τιμών. Εμεις γνωρίζουμε κάποιες τιμές της συνάρτησης (τα αρχικά δεδομένα, όπως για παράδειγμα οι φωνητικές εγγραφές) και προσπαθούμε να βρούμε μια εκτιμήτρια της πραγματικής συνάρτησης, βάσει όσων γνωρίζουμε.
Για να το καταφέρει αυτό, ο υπολογιστής μπαίνει σε μια διαδικασία να «σπάσει» την άγνωστη συνάρτηση σε έναν αριθμό στρωμάτων από επίσης άγνωστες «σιγμοειδείς» συναρτήσεις (συναρτήσεις που μοιάζουν σαν το αγγλικό “S”). Τα αρχικά δεδομένα εισάγονται στο πρώτο «στρώμα» των σιγμοειδών, οι οποίες τα επεξεργάζονται, τα συνδυάζουν και εν τέλει δίνουν το αποτέλεσμα που θα καταχωρηθεί στο δεύτερο στρώμα. Η διαδικασία συνεχίζεται μέχρι να φτάσει στο τελικό στρώμα, ενώ ο αριθμός των βημάτων καθορίζεται από την πολυπλοκότητα που απαιτείται. Με αυτόν τον, ομολογουμένως παράξενο, τρόπο δημιουργείται ένα τεχνητό νευρωνικό δίκτυο υπολογιστικής νοημοσύνης. Κάπως έτσι λειτουργεί η διαδικασία της τεχνητής νοημοσύνης.
Μια νέα επιστημονική επανάσταση με την τεχνολογία σε... ρόλο οδηγού
Βασική αρχή στις εφαρμοσμένες επιστήμες, πόσω μάλλον στα μαθηματικά, είναι πως όταν ένα μοντέλο λειτουργεί σωστά και είναι αποτελεσματικό, τότε πίσω από το μοντέλο «κρύβεται» μια αυστηρή μαθηματική θεωρία η οποία το στηρίζει. Μέσω του μοντέλου, αρκετές φορές έχουμε καταφέρει να «αλιεύσουμε» το θεωρητικό υπόβαθρο, ακολουθώντας μια αντίθετη διαδρομή και πηγαίνοντας από το αποτέλεσμα στο αίτιο.
Στην συγκεκριμένη περίπτωση όμως, ακόμα δεν έχουμε αντιληφθεί πιο είναι το μαθηματικό πλαίσιο γύρω από αυτή τη διαδικασία. Εχουμε βρει το «πώς» αλλά αδυνατούμε να βρούμε το «γιατί». Οι θεωρητικοί έχουν εκφράσει την σιγουριά τους πως πίσω από τέτοια μοντέλα κρύβεται ένας πολύ μυστήριος γεωμετρικός κόσμος, που περιέχει μέσα του σχέσεις και έννοιες που δύσκολα αντιλαμβάνεται ο ανθρώπινος νους.
Προς το παρόν η τεχνητή νοημοσύνη βρίσκεται στο «βρεφικό» της στάδιο. Παρόλα αυτά, η μαθηματική θεμελίωση της βρίσκεται σε αδιέξοδο, βάζοντας ουσιαστικά την τεχνολογία σε ρόλο «οδηγού» της επιστήμης. Οσο περνάει ο καιρός, όσο οι επιστήμονες εμβαθύνουν στον κόσμο της τεχνητής νοημοσύνης, τόσα περισσότερα θα αρχίσουμε να αντιλαμβανόμαστε για αυτήν.
Πιθανότατα αυτό να αργήσει να συμβεί. Το επικρατέστερο σενάριο είναι η νέα αυτή τεχνολογία να έχει συγκεκριμένα όρια που μπορεί να αναπτυχθεί, με δεδομένη την έλλειψη θεωρητικού υποβάθρου. Επειδή όμως η θεωρία και η εφαρμογή είναι έννοιες συνδεδεμένες, τα τεχνολογικά άλματα των τελευταίων ετών είναι... μαθηματικά βέβαιο πως πρόκειται να οδηγήσουν στην επόμενη «επιστημονική» επανάσταση. Και αυτή, όπως όλα δείχνουν, θα είναι... μεγαλύτερων διαστάσεων από οποιαδήποτε έχει προηγηθεί!