Il mondo della Business Intelligence (BI) è stato storicamente dominato da soluzioni desktop, basate su sistemi di dash-boarding integrati, con visualizzazioni configurabili e selettori di date oltre alle varie proprietà grafiche.
Il mondo della Data Analysis avanzata, oggi diremmo in senso lato “Data Science“, è sempre stato più sullo sfondo, con gli sviluppatori che programmavano gli algoritmi, talvolta in collaborazione con gli analisti, per essere poi implementati nell’interfaccia dell’applicazione, a disposizione dell’utente finale.
Questo modello classico di deploy di un applicazione software con tutti gli aggiornamenti, mano mano che le nuove “release” venivano proposte al mercato, ha rappresentato per anni lo standard della BI, soprattutto per i manager aziendali che avevano bisogno di soluzioni chiavi in mano per monitorare l’azienda, il mondo esterno e prendere decisioni informate.
Come strumento complementare e certe volte sostitutivo, sicuramente il foglio elettronico Excel ha giocato un ruolo da protagonista.
Prima che il diluvio dei Big Data si abbattesse sulle aziende e su tutti noi, una buona pratica nell’utilizzo di qualche funzione avanzata del foglio è stata per decenni la soluzione ideale anche di analisti molto sofisticati.
E non solo la parte di calcolo ovviamente, ma anche la possibilità di avere delle visualizzazioni avanzate e interattive, collegate con il progress dei calcoli che mano mano prendevano forma nelle celle del foglio.
Nel tempo sono stati sviluppati dei veri e proprio linguaggi di programmazione, VBA per Excel ad esempio, ma anche Google Apps Script per i Google Spreadsheet, capaci non solo di generare nuove funzioni avanzate, ma anche dei veri e proprio “addon” che estendono le potenzialità dell’applicazione di base.
Tutto questo sta radicalmente cambiando, come detto, con l’avvento dei Big Data, che mette in evidenza i limiti sia di Excel che in generale delle applicazioni desktop che propongono un modello chiuso e limitato.
I principali problemi che sorgono sono scalabilità della soluzione e capacità di automazione e aggancio a pipeline di calcolo esterne.
Excel vs. Python
Ma come riuscire a coniugare il rassicurante mondo di Excel e delle classiche applicazione BI, col mondo avanzato della Data Science e dell’Artificial Intelligence (AI), per un manager che al meglio del suo background di formazione economica ricorda le nozioni fondamentali di statistica descrittiva?
Python, lo stesso linguaggio che utilizzano i Data Scientist professionisti, è la soluzione!
Non che uno strumento di programmazione possa automaticamente colmare lacune di Algebra Lineare o conoscenze di frontiera su AI, ma in questo caso un linguaggio ben progettato, utilizzabile a più livelli, può costituire un eccellente ponte tra i due mondi.
Possiamo immaginare un “basso livello”, quello degli sviluppatori, che codificano da zero o quasi gli algoritmi, magari facendo leva su librerie matematiche avanzate e un livello che potremmo definire “macro”, in cui gli analisti utilizzano moduli che contengono al loro interno tutta la complessità di calcolo per risolvere i problemi di business.
Python, con la libreria Pandas, offre inoltre un tipo di dato in forma tabellare, il DataFrame, con intestazioni di colonna e funzioni avanzate di manipolazione dati, in tutto simile a quello che potrebbe essere sviluppato tramite un foglio elettronico.
Quindi se vogliamo, con i DataFrame, possiamo avere in Python la maneggevolezza del trattamento dati di un foglio elettronico, all’interno della flessibilità e scalabilità di un moderno linguaggio di programmazione.
In ambito Big Data Analytics uno dei maggiori limiti degli fogli elettronici e delle applicazioni Desktop e la capacità di maneggiare grandi quantità di dati.
Excel ha dei limiti intrinseci nel numero di righe e colonne e anche quando non si raggiungono questi limiti i calcoli diventano lentissimi.
Python, con le librerie di appoggio che sfruttano in maniera trasparente le memorie di massa, non ha quasi limiti di memoria, con l’ulteriore possibilità d’interazione remota con sistemi Cloud che possono offrire sia spazio disco che risorse di calcolo praticamente illimitate.
Da più parti si sente ormai ripetere che Python è l’Excel del futuro. Si passa da un approccio puramente desktop a un’interazione di tipo ‘scripting’ alla Matlab/Mathematica molto usato da ingegneri e scienziati.
Si lanciamo comandi macro che scatenato potenti funzioni di elaborazione Big Data, si sviluppano visualizzazioni con pochi parametri da linea di comando e tutto può essere facilmente ingegnerizzato in una sequenza di semplici linee di codice, molto intuitive, replicabile e controllabili.
Siamo all’inizio di una nuova rivoluzione nel settore della Business Intelligence.
Non più applicazioni BI fatte a compartimenti stagni, con da una parte gli sviluppatori e dall’altra gli analisti, ma un’unica piattaforma software in cui Python e le sue principali librerie vengono utilizzate a diversi livelli di profondità, magari mediate da un ambiente di sviluppo integrato.
In questo senso pare molto promettetene l’ecosistema dei notebook in Jupyter Lab che propone un’esperienza molto simile ai sistemi di dashboarding a finestre e interazioni tramite menù, ma con dietro le quinte la potenza dei codici Python a sostanziare tutte le operazioni di calcolo e visualizzazione.
Se vuoi comprendere meglio cosa Linkalab può fare per il tuo business sfruttando la Data Science, prenota una call con noi.
Ti forniremo una panoramica esaustiva su quello che facciamo in ambito business e marketing grazie alle competenze dei nostri data scientist e analyst.