Linkalab è nato nel 2008 basando le proprie attività nell’ambito della Teoria dei Sistemi e delle Reti Complesse.

In questi anni ha portato avanti innumerevoli studi e progetti di ricerca ambiziosi che, nel tempo, hanno portato allo sviluppo e realizzazione di importanti prodotti scientifici di successo.

Tali prodotti hanno risolto i problemi dei clienti con cui lavoriamo e che si sono affidati a noi perché hanno visto il valore aggiunto della nostra componente scientifica applicato alla realizzazione di soluzioni innovative ed efficaci.

In primo piano, attualmente, abbiamo diversi lavori legati all’intelligenza artificiale e che si basano quindi sullo sviluppo di modelli di Machine Learning e Deep Learning.

Data science per Talent Garden

In particolare, tra questi mi piace citare come primo il caso di Gini.

Gini è un sistema di raccomandazione semi-supervisionato di utenti sviluppato per il Talent Garden con lo scopo di incrementare il networking tra tutti i campus internazionali, promuovere lo scambio di conoscenza e competenze, abilitare sinergie di business.

L’aspetto affascinante di questo progetto è stato il modo in cui siamo riusciti ad applicare un modello di ML supervisionato a un caso in cui era difficilmente applicabile in quanto non erano disponibili abbastanza dati di validazione dei match per un training affidabile.

In questo caso, la soluzione adottata è stata quella di istanziare inizialmente un modello non supervisionato e sviluppare un sistema per acquisire dagli utenti stessi un feedback sui risultati forniti dal modello.

Questi risultati sono stati periodicamente utilizzati per addestrare un modello supervisionato che nel tempo ha quindi fornito dei risultati sempre maggiormente personalizzati e corretti.

Ottimo trucchetto, non ti pare?

Machine Learning in Sardegna

Altrettanto interessante, anche perché questo ha un impatto diretto sulla meravigliosa isola dove abito e dove Linkalab ha la sua sede principale, è l’insieme degli analytics che abbiamo sviluppato per la creazione di una piattaforma digitale dei dati del turismo in Sardegna.

L’obiettivo era creare un punto di riferimento per gli attori regionali per la generazione di indicatori innovativi delle performance del settore (https://dih.linkalab-cloud.com/).

In questo caso abbiamo spremuto dai social tutta l’informazione che era possibile estrarre ottenendo un cocktail di dati che si è rivelato indispensabile per comprendere nella sua interezza le problematiche legate al fenomeno del turismo in Sardegna.

Twitter, Facebook, TripAdvisor, Booking e AirBnb, ognuno di loro ha avuto un ruolo essenziale per ricomporre i vari pezzi del puzzle:

  • domanda e offerta;
  • cluster delle destinazioni turistiche;
  • differenze nel rating legate alla regione di provenienza;
  • correlazioni tra le offerte dei prezzi e gli eventi locali;
  • stagionalità;
  • rating dei clienti e la loro affluenza;
  • ruolo degli influencer nella concentrazione di picchi di volumi di presenza.

Il massimo della soddisfazione poi, in questi progetti, si ha quando vedi che tutte le tue analisi scientifiche vengono raccolte in un portale che espone i grafici aggiornati dinamicamente, gli indicatori di sintesi collocati geograficamente, le tabelle con le metriche di interesse.

Ed è allora che finalmente le tue formule, i tuoi codici e i tuoi modelli diventano un prodotto, e l’emozione a questo punto non si può più contenere.

Il lavoro di Data Science

Ogni lavoro di Data Science poi, se deve essere di alto livello, non può più prescindere dall’utilizzo di un Data Lake per la gestione dei dati.

Qui in Linkalab su questo argomento abbiamo una grande esperienza.

Tutti i dati, raccolti dai sistemi automatici di ingestion, vengono organizzati, durante il loro ciclo di vita, all’interno di un Data Lake dove vengono pre-processati più volte.

Come previsto dalle specifiche di questa innovativa architettura, gli facciamo compiere il cammino dei diversi livelli di memorizzazione durante i quali vengono puliti, normalizzati, riconciliati, arricchiti e validati, in modo che siano pronti per essere processati dagli analytics.

In questo ecosistema informatico il data scientist ha il pieno controllo della storia del dato.

Ad esempio, utilizzando dei watermark per taggare i dati a ogni step del ciclo di vita all’interno dei diversi livelli del Data Lake, è possibile ricostruire in modo puntuale la sua storia per poter capire l’origine di un risultato di un certo tipo e verificare la corretta interpretazione di quanto viene restituito da uno specifico algoritmo.

Tramite l’utilizzo di un data catalog, inoltre, tutti i dati sono costantemente associati ai metadati che li definiscono e che specificano la fonte da cui sono stati presi e le informazioni temporali legate al loro momento di creazione.

Tutti questi fattori sono strategici per il nostro lavoro di Data Science in Linkalab perché ci garantiscono la bontà del dato elaborato e ci permettono di ottenere un valore efficace dai dati analizzati. 

Essere un data scientist in Linkalab

Dal punto di vista dell’orgoglio aziendale e personale, oltre a quanto vi ho già illustrato, abbiamo anche il piacere di fornire servizi e consulenza su temi di Data Science per il Reputation Lab di Eni.

In questo contesto di altissimo livello abbiamo sviluppato e ingegnerizzato, tramite l’utilizzo di tool che sono lo stato dell’arte nel campo dell’architettura di sistemi di calcolo distribuiti su cloud, degli algoritmi che permettono di monitorare costantemente i dati forniti dalle più importanti fonti di notizie relativamente ai temi di discussione in rete e le interrogazioni sui motori di ricerca come Google Trends.

Per tale progetto abbiamo sviluppato uno speciale codice in grado di aggregare i dati in combinazioni maggiori rispetto a quelle fornite di base dal servizio, Google News, Twitter, Facebook, Wikipedia e specifici portali come Eni.com e altri.

In questi casi, l’ottimizzazione degli algoritmi in termini di tempo di calcolo e di utilizzo delle risorse e l’utilizzo al loro massimo potenziale delle possibilità offerte dei servizi su Cloud.

Tali servizi sono la chiave di volta che ha permesso in questi anni di realizzare tutta una serie di analisi di Data Science al top per quanto riguarda gli obiettivi richiesti da un cliente così importante.

Ci ha dato inoltre la possibilità di imparare ancora di più rispetto a quanto già sapevamo fare, ricordandoci che in questo entusiasmante lavoro non esiste la possibilità di annoiarsi ma, anzi, ogni nuovo progetto è una sfida che ci mette in gioco e ci fa crescere sempre di più la voglia di andare oltre quanto già sappiamo fare.

 


Richiedi una consulenza