Tutte le aziende di consulenza che operano nei settori avanzati nel mondo digitale, più o meno vantano di occuparsi di “dati” e soprattutto di Intelligenza Artificiale (AI acronimo inglese). Tutti sono alla ricerca di figure specializzate, come i Data Scientist, da poter includere in organico e allargare la propria offerta.
Ma una cosa è affrontare un progetto di Data Science ‘a posteriori’ sulla scia di una problematica che emerge contestualmente a un progetto già avviato, un’altra è impostare un’attività ‘data driven’ come approccio qualificante sin dall’inizio nella fase di progettazione.
C’è da dire che non sempre un approccio guidato dai dati si possa applicare e che in alcuni casi anche una ‘bassa intensità’ scientifica possa essere vincente e aggiungere complessità tecnologica semplicemente non serve. Per riconoscere le aziende che hanno l’approccio corretto provo a descrivere i due estremi che non dovrebbero mai essere toccati.
Da un lato abbiamo l’approccio che potremmo definire lo “scienziato pazzo”. Nelle brochure vedrete capannelli di ricercatori davanti a lavagne piene di formule matematiche che parlano e si confrontano tra di loro, ma quanto è presente l’azienda e il rapporto che hanno con il cliente, quando si è presi dalla matematica? Solo in un secondo momento propongono qualche soluzione pronta che piove dall’alto, stile ‘cargo cult’, perché la scienza è talmente potente che prevale su tutto, si adatta senza problemi alle varie necessità e non è neanche chiaro quanto abbia bisogno di dati per essere alimentata. Esiste una cieca fiducia negli algoritmi e nel loro potere predittivo.
Dal lato opposto abbiamo il modello “sotto da dashboard niente”, qui le brochure evitano gli scienziati pazzi, ma pullulano di widget grafici con indici, trend, mappe tematiche, promesse di “facilità d’uso” e la soluzione certa dei problemi. È un approccio commerciale spinto che mette davanti agli occhi del cliente quello che si aspetta come risultato finale, senza dire molto del dietro le quinte.
Quindi nel primo caso potremmo sintetizzare con: ‘fidati della scienza che la soluzione la troviamo’ e nel secondo: ‘guarda ho già pronta la soluzione e non ti preoccupare di cosa c’è sotto’.
È evidente che non esistono aziende che sono totalmente dall’una o dall’altra parte di questa pericolosa china. Di volta in volta troverete un po’ dell’una e un po’ dell’altra, ma il vero punto è capire cosa sta nel mezzo, al punto di equilibrio di questi due estremi.
Proveremo a descriverlo in breve, anche visivamente. Al centro di tutto ci deve essere il consulente scientifico che si mette l’elmetto da lavoro, quello che dovrebbe proteggere dagli infortuni nei cantieri e scende sul campo col cliente per vedere di persona cosa succede negli uffici o nelle linee produzione. Quindi più che sporcarsi col gesso in prima battuta si dovrebbe sporcare di grasso. E deve ascoltare e fare domande, senza dover spiegare niente.
Lo scopo di questa prima fase è capire il settore di riferimento e i problemi che affliggono l’azienda. La seconda fase consiste invece di capire le fonti dati potenzialmente esistenti.
Ci sono flussi dati dai macchinari od occorre mettere sensori? È realistico farlo? Che dati ci sono nei sistemi informativi? Sono sufficienti?
Per definizione la Data Science parte dai dati, i dati sono la materia prima e senza i dati non si può costruire niente. Certe aziende non sanno neanche dove hanno i dati. Mi è capitato di sentire un imprenditore esprimere il suo massimo desiderio affermando al primo incontro: “intanto mi piacerebbe vedere i miei dati”.
In Italia, soprattutto per le PMI, sono ancora bloccate in queste prime due fasi. La terza è quella dei modelli, degli algoritmi e della famosa Intelligenza Artificiale. Ma senza le prime due non si può partire e possono passare mesi.
Più del 50% dei progetti di AI falliscono perché si è sottovalutata la reale disponibilità dei dati. Ci vogliono mesi ma alla fine è il grosso del percorso, perché nella stragrande maggioranza dei casi gli algoritmi ci sono e sono stati ben affinati negli ultimi 10/15 anni di studi e applicazioni. Sono ormai una commodity se si escludono i problemi più avanzati, che sono una netta minoranza.
Aldilà di tutto ciò rimane il problema dell’ingegnerizzazione e messa in produzione di dati e algoritmi, soprattutto in ambienti Cloud. Gli scienziati alla lavagna non hanno abbastanza consapevolezza di cosa si tratta quando parliamo di Cloud, molto spesso e per i markettari delle dashboard è un problema che porranno alla fine, quando non se ne potrà fare a meno.
Per chiudere la panoramica e rispondere alla domanda come riconoscere le aziende che sono in grado di portare avanti un progetto di Data Science end-to-end? Dovete puntare su chi vi propone un metodo verificabile che parta dai dati e arrivi alla soluzione senza trascurare alcun passaggio. Per l’appunto non basta la matematica fine a se stessa o delle grafiche colorate. Fidatevi di chi vi ascolta e vi propone un percorso che possa accompagnarvi verso la soluzione finale, coinvolgendo tutte le componenti rilevanti dell’azienda.