La Data Science è rimasta per anni confinata nei laboratori delle università. Molti modelli e tecniche sono stati sviluppati all’interno di progetti di ricerca e utilizzati per risolvere problemi di ricerca fondamentale. Con la recente ondata dei Big Data si è capito che quelle stesse tecniche potevano essere la salvezza per avere ragione del “diluvio dei dati” e gradualmente si è passati alla fase di trasferimento tecnologico.
Per esempio alcune applicazione avanzate di Intelligenza Artificiale, quelle del Deep Learning in particolare, non sarebbero state possibile con la grande massa di dati prodotta da Internet, i social network e gli apparati dell IoT. Di fatto questo processo è ancora in atto e la percezione che hanno le aziende di questo campo è in alcuni casi di qualcosa di sperimentale. Quindi, soprattutto nelle “corporate”, quando si parla di Data Science si invoca immediatamente il dipartimento di R&D (ricerca e sviluppo).
Per chi è nel mondo del business è chiaro che questo è molto vicina a una ghettizzazione. Non lo è necessariamente, ma nella maggioranza dei casi l’idea è: “mettiamola lì, come un costo che, chissà, potrà fruttare in futuro, e comunque lì non fa danni.”
Ci sono quindi schiere di Data Scientist che lavorano a ogni genere di POC e attività sperimentale, che nel migliore dei casi servono a mostrare quanto l’azienda sia innovativa, di quanto si stia occupando dell’ultimo ritrovato tecnologico.
La Data Science quindi come attività di marketing e di showcase per le conferenze di settore. Poi ovviamente ci sono le eccezioni, sempre più numerose in Italia, l’unica realtà economica che conosco in questo momento. Ci sono delle aziende che fanno sul serio, che hanno intrapreso un percorso di formazione interna, che non riguardasse solo i dipartimenti tecnici, ma anche il management, e che in alcuni casi hanno scoperto che valorizzare i dati in azienda, che saperli mettere in comunicazione tra loro, che adottare degli algoritmi di “anomaly detection” sui segnali delle proprie catene di produzione poteva portare a risparmi di tempo e di risorse, e talvolta anche aprire nuove linee di business.
Tutte cose che non solo rendono più efficienti i processi aziendali e le economie di scala, ma che possono velocemente diventare un vantaggio competitivo rispetto alla concorrenza.
Per le PMI il discorso è molto diverso e molto più complicato. Normalmente una realtà di piccole/medie dimensioni non si può proprio permettere un dipartimento di R&D, quindi il problema si pone dall’inizio, non c’è la scappatoia della riserva indiana per gli scienziati. La Data Science deve dimostrarsi immediatamente utile e applicabile.
E qui entra in gioco la parte metodologica, un processo graduale che velocizzi tutta la parte di trasferimento tecnologico della soluzione e che in itinere adatti e personalizzi piattaforme e tecniche. Qui il ritorno dell’investimento, per quanto inizialmente piccolo, deve essere quasi immediato. Mi verrebbe da dire che in un certo senso è una situazione più “sana” rispetto alle “‘corporate”, che ha il pregio di non ritardare indefinitamente il processo di trasferimento tecnologico, ghettizzandolo in qualche anfratto dipartimentale.
In Linkalab l’offerta “agile” di “Data Science as a Service” che mettiamo in campo in questi casi prevede una fase di formazione molto concentrata, lo sviluppo di sessioni di “sprint” dalle quali emerge sempre qualche deliverable tangibile e con un ROI misurabile, includendo attività di “training on the job” per il personale aziendale che si affianca ai nostri data scientist.
Il passo successivo che stiamo sviluppando in questi mesi è la messa in opera di una piattaforma dati/algoritmi che tenga traccia dei processi e che consenta un accesso unificato al patrimonio informativo. In questo senso ci sono delle proposte commerciali interesanti come Dataiku, ma anche il mondo open source si sta muovendo molto rapidamente e la suite Jupyter, con le opportune personalizzazioni, si sta proponendo come un ottimo candidato.
Quindi vorrei concludere provocatoriamente affermando che considere la Data Science un’attività di R&D è potenzialmente pericoloso, se dall’inizio non si instaurano delle connessioni virtuose e operative con la parte manageriale dell’azienda. Infatti creiamo spesso dei corto circuiti diretti tra data scientist e sales manager, facciamo in modo che già in fase di pre-sales ci possa essere per il prospect una visione della sostanza algoritmica che potrebbe incidere nella risoluzione dei problemi dell’azienda, utilizzando il responsabile sales come mediatore.
Se non adeguatamente sollecitati gli “scienziati dei dati” tendono a chiudersi in se stessi e occuparsi di problemi scientifici super interessanti e soddisfacenti per loro, ma irrilevanti per le applicazioni business. Un vero peccato e una grande occasione persa per tutte le aziende del nostro paese che presto potrebbe costituire un problema nel contesto competitivo europeo e internazionale.