Nel 1801 Palermo era una città moderna, ricca di traffici e commerci. Nonostante la distanza con i grandi centri del sapere europeo, che allora erano soprattutto Parigi, Berlino e Londra, la città ospitava un osservatorio astronomico con delle ottime dotazioni scientifiche.

La specola ferdinandea (dal nome del Re borbone Ferdinando III) era diretta da Giuseppe Piazzi, un valente astronomo intenzionato ad effettuare osservazioni e misurazioni del cielo con degli strumenti all’avanguardia.

Il primo gennaio di quell’anno, misurando la posizione delle stelle nella costellazione del Toro, Piazzi effettuò una interessante scoperta: un corpo celeste che non figurava in alcun catalogo noto di stelle, si spostava nel cielo, abbastanza rapidamente, diversi gradi in pochi giorni.

Nonostante l’oggetto non presentasse una coda visibile come quelle delle ben note comete, l’astronomo Piazzi, prudentemente, lo classificò come una cometa, dandone annuncio alla comunità scientifica con una lettera avendogli attribuito il nome che sarebbe rimasto fino ad oggi: Cerere, la Dea delle Messi e dell’Abbondanza.

Poco tempo dopo l’oggetto, che in realtà era un asteroide, si avvicinò al sole (in quella che tecnicamente si chiama “congiunzione”) e divenne invisibile durante la notte andando perduto.

A Berlino negli stessi anni un giovane e promettente matematico di 24 anni, Carl Friedrich Gauss, era venuto a conoscenza di questo corpo celeste e della sua scomparsa.

A partire dalle sole 3 misurazioni che Piazzi aveva realizzato ideò un metodo, noto come metodo dei minimi quadrati, che consentiva di determinare l’orbita del corpo celeste.

Il 31 dicembre dello stesso anno due astronomi tedeschi, utilizzando la predizione fatta da Gauss, ritrovarono Cerere, che divenne ufficialmente il primo asteroide ad essere scoperto.

La fama di Gauss e di Piazzi divenne grandissima, non solo era stato scoperto il primo corpo celeste più piccolo di un pianeta in orbita attorno al sole, ma era stato inventato un potente metodo di calcolo adatto a stimare orbite e determinare leggi fisiche.

Machine Learning

Due secoli dopo possiamo considerare questa tecnica, a buon diritto, il primo esempio di Machine Learning.

L’idea per quei tempi era rivoluzionaria: un insieme di equazioni (di solito semplici polinomi) veniva applicato ai dati esistenti.

I parametri di queste equazioni ricavati dal metodo di ottimizzazione (per esempio, minimizzando gli scarti quadratici), avrebbero fornito poi un modello calibrato per fare predizioni su dati non ancora osservati.

Note alcune posizioni dell’orbita già percorsa diventava possibile ricavare, con un certo errore, le posizioni future dei punti del cielo in cui un corpo celeste come Cerere si sarebbe trovato.

Imparare dai dati, utilizzando la matematica, era il modo giusto di procedere, mentre associare ad ogni predizione un errore un’idea geniale.

La disciplina del Machine Learning, che dovremmo chiamare più propriamente statistical learning, è quella branca della statistica che utilizza i dati presenti, per addestrare modelli (cioè insiemi di equazioni) in modo da poter fornire predizioni (o classificazioni) su dati non ancora osservati.

In un mondo di leggi regolari l’osservazione del passato fornisce i valori su cui basare le predizioni per il futuro: sfruttare le regolarità per fare delle predizioni.

Al servizio postale americano, negli anni 80 del secolo appena passato avevano un problema: troppi indirizzi scritti a mano sulle buste risultavano difficili da interpretare e si perdeva del tempo prezioso per l’invio della corrispondenza.

Se fosse stato possibile addestrare un computer insegnandogli a classificare le cifre e le lettere correttamente riconoscendo gli indirizzi si sarebbe ottenuto un sistema di aiuto per indirizzare la corrispondenza.

Per addestrare un modello di Machine Learning bisognava tuttavia creare un database di immagini di lettere e numeri.

Fu così che il National Institute of Standards and Technology NIST raccolse le immagini di 60 mila cifre scritte a mano da oltre 500 persone e creò un database di numeri che sarebbe diventato molto famoso: il dataset noto come MNIST che è un vero e proprio banco di prova per la Machine Learning.

Nonostante il database, in quel momento le prestazioni dei metodi erano scadenti, e da quel momento, iniziò una gara scientifica e tecnologica per trovare una soluzione ottimale al problema del riconoscimento dei caratteri.

I migliori sistemi della Machine Learning fornivano nel caso migliore una predicibilità attorno all’80%, ovvero 20 indirizzi su 100 sarebbero risultati sbagliati un risultato inaccettabile, ben al di sotto delle performance di riconoscimento umano della grafia.

Il problema rimase per un po’ di anni irrisolto, fino a che un contributo fondamentale venne da un campo della Machine Learning a quel tempo abbastanza esotico e minoritario: le reti neurali.

Reti neurali

Negli anni 50 il meccanismo biochimico del funzionamento dei neuroni era stato finalmente svelato: un segnale elettrico attraversava la cellula nervosa e si propagava agli altri neuroni attraverso dei lunghi filamenti nervosi, gli assoni, ma solo quando lo stimolo avesse superato una certa soglia.  

Lo psicologo Frank Rosenblatt nel 1958 lavorava al Cornell Aeronautical Laboratory e aveva accesso ad uno dei primi elaboratori IBM, la sua formazione specialistica dando accesso a tutta la letteratura sul cervello mentre le sue ricerche si concentravano sul tema dell’apprendimento.

Sarebbe stato possibile creare un sistema artificiale in grado di apprendere dall’esperienza? Un metodo di Machine Learning (allora chiamata anche cibernetica) che, come le equazioni di Gauss, avesse iniziato ad imparare dai casi che gli venivano presentati? Ancora se i dati predetti fossero diventati, a loro volta, nuovo input, la predizione la precisione del modello sarebbe migliorata?

Rosenblatt e i suoi colleghi del tempo battezzarono questo semplice sistema di retroazione con il nome di rete neurale.

Il neurone era una singola equazione gestita da una funzione di attivazione, un meccanismo matematico per far scattare il neurone ed iniziare il processamento dei dati solo ad una certa soglia esattamente come i neuroni del cervello scattavano quando lo stimolo elettrochimico raggiungeva una certa intensità.

Il metodo delle reti neurali creò grandi speranze, si iniziò a parlare di intelligenza artificiale, ma presto ci si rese conto che da solo e con la capacità di calcolo del tempo non sarebbe bastato a risolvere anche i più semplici problemi non lineari, ovvero quelli che già le equazioni di Gauss risolvevano egregiamente. 

Rispetto al caso semplice, lineare, un primo miglioramento si ebbe con l’introduzione delle reti neurali profonde (deep neural networks).

L’idea assomigliava molto a quella di Fontana, il noto pittore milanese che aveva iniziato a praticare tagli sulla tela, le equazioni si sarebbero disposte non solo in estensione – come su un foglio di carta – ma anche in profondità: una dopo l’altra fino al risultato finale.

Se si fosse creata una catena di equazioni dove il risultato di una equazione veniva elaborato da un’altra equazione fino a convergere al risultato finale e l’apprendimento fosse stato diviso in pezzi, allora il sistema sarebbe stato in grado di effettuare virtualmente qualsiasi predizione. 

Questa tecnica nota come deep learning non era priva di problemi, ma nelle sue successive elaborazioni, che continuano ancora oggi e sono in fortissimo sviluppo, ha prodotto dei risultati strabilianti.

Il sistema postale ora dispone di un software che effettua la classificazione dei caratteri scritti con una precisione superiore al 99%: meglio di un essere umano.

Centinaia di sistemi, basati sul deep learning e sulle reti neurali convoluzionali oggi giorno risolvono compiti ripetitivi e forniscono previsioni di ogni genere, per esempio verificano le frodi sulle carte di credito, validano contratti legali, eseguono diagnosi su immagini mediche e classificano i materiali come il legno per garantire la loro qualità.

Il tutto però è partito due secoli fa da un asteroide scomparso e poi ritrovato!

 


Richiedi una consulenza