Big Data Analytics

Il proliferare di sorgenti dati, della più disparata natura, come file testuali, spreadsheet, log, social network, web services, database relazionali e non, richiede un superamento delle tradizionali modalità di storage, elaborazione, analisi e visualizzazione.

 

Big Data Analytics interpreta e codifica un nuovo approccio all’elaborazione dei Dati. Tale approccio si rende necessario quando ci si ritrova a dover gestire moli di dati con ordini di grandezza anche 100 o 1000 volte superiori  in termini di dimensioni rispetto al passato, i cosiddetti “Big Data”.

In uno scenario come quello appena descritto i tradizionali data warehouse vengono sostituiti dai Data Lake in cui coesistono sorgenti dati eterogenee, strutturate e non, che vengono memorizzate nel loro formato originario ed elaborate soltanto quando se ne ha la reale necessità.

In questo ambito sono le tecnologie open source della suite Hadoop a farla da padrone, ed in particolare HDFS, il file system di Hadoop, che consente lo storage fisico dei dati in maniera distribuita e replicata, per garantire da una parte la rapidità di accesso e dall’altra la persistenza sicura dei dati.

Gli strumenti della suite Hadoop sono disponibili sia in versione On Premise che in Cloud tramite i più famosi servizi come Google Cloud Platform, Amazon AWS e Microsoft Azure, che mettono a disposizione le loro distribuzioni Hadoop già configurate, clusterizzate e facilmente scalabili in base alle esigenze puntuali degli utenti.

Si rende necessario dunque un passaggio da un approccio ETL (Extract, Transform and Load), in cui si definisce a priori un rigido schema che richiede una trasformazione dei dati prima del loro effettivo caricamento ad un approccio ELT (Extract, Load and Transform) in cui i dati vengono memorizzati, distribuiti e replicati ed in cui le trasformazioni vengono eseguite soltanto quando e se necessario ai fini delle analisi.

La fase di load viene quindi anticipata ed è possibile utilizzare molteplici strumenti che consentono di trattare singolarmente le differenti tipologie di dati, oppure affidarsi a suite come Talend o Informatica che permettono di poter integrare fra loro le differenti sorgenti, col vantaggio di dover imparare a governare un solo strumento e non decine. Quest’ultima tipologia di soluzioni permette di ridurre il time-to-market dei nostri dati, con conseguenti vantaggi anche sul costo di produzione delle informazioni.

Lo spostamento della fase di trasformazione ad ultimo step del flusso consente al business di poter avere informazioni in tempo reale ed all’IT di poter gestire in maniera più efficace le risorse, soprattutto in uno scenario “pay-as-you-go” tipico dei servizi di cloud computing.

La self-service Business Intelligence chiude il cerchio della Big Data Analytics consentendo al business ed agli stakeholder di poter accedere alle informazioni e generare report personalizzati con poco sforzo.

Per esprimere appieno il potere informativo dei dati, elaborarli in tempo reale non è sufficiente. Chi analizza i dati ha bisogno di strumenti di data visualization potenti e semplici da utilizzare, di cui possa usufruire autonomamente. Questi strumenti, come Microsoft Power BI o Tableau permettono di costruire dashboard e report di grande impatto.

Ma la vera innovazione offerta da questi tool consiste nel mettere a disposizione, oltre che grafici innovativi ed interattivi, anche centinaia di connettori verso le più disparate sorgenti dati.

Le fasi di data visualization e quella di transform sono dunque legate a doppia mandata: è possibile, ad esempio, avviare specifiche trasformazioni su un cluster Hadoop direttamente durante l’elaborazione del report in maniera tale che i dati siano sempre aggiornati in tempo reale.

La Big Data Analytics, con tutte le tecnologie che la compongono, consente dunque di tenere sotto controllo tutto il processo che va dalla generazione dei dati fino alla loro consultazione, con un aggiornamento in tempo reale passo dopo passo che consente al business di prendere decisioni, analizzando le informazioni giuste al momento giusto.

I consulenti di Arancia-ICT supportano le aziende che intendono adottare metodologie di Big Data Analytics attraverso la ridefinizione dei processi, la formazione e l’introduzione di tecnologie abilitanti.

Richiedi Informazioni
Per saperne di più contatta il nostro team…

Questo sito web utilizza i cookie

Utilizziamo i cookie per personalizzare contenuti ed annunci, per fornire funzionalità dei social media e per analizzare il nostro traffico. Condividiamo inoltre informazioni sul modo in cui utilizzi il nostro sito con i nostri partner che si occupano di analisi dei dati web, pubblicità e social media, i quali potrebbero combinarle con altre informazioni che hai fornito loro o che hanno raccolto dal tuo utilizzo dei loro servizi. Acconsenti ai nostri cookie se continui ad utilizzare il nostro sito web.

Approfondisci Chiudi