Quanto sono grandi i Big Data? Ed esiste una classificazione in base alla quantità di dati elaborati? L’unica cosa certa è che non esiste una definizione univoca. La complessità dei sistemi che, in qualche modo, li generano tuttavia viene a cadere quando si passa da un’architettura monolitica di questi dati a quella distribuita.
Oggi si producono più dati di quanti se ne possano memorizzare in computer convenzionali e quindi ci si pone il problema di come gestirli.
Se la dimensione non è ciò che conta, allora che cosa rende davvero utile l’analisi dei Big Data? La risposta è nella natura dei dati stessi che, sempre più, hanno bisogno di integrare un valore intrinseco, o condurre alla generazione di valore. Non più solo grandi, quindi, ma sempre più anche buoni. Good Data è la risposta.
Focalizzandosi sulla loro gestione strategica la questione, in effetti, muta completamente.
Ogni buon data scientist cerca, infatti, di comprendere correttamente un problema aziendale che necessita di una soluzione, spesso scegliendo tra quelli che impattano sulla cosiddetta business intelligence. In ambito aziendale, le domande aperte, quelle che davvero possono migliorare il processo decisionale e influenzare positivamente la pianificazione strategica, sono così specifiche che spesso si rendono necessari modelli ad hoc.
Le unità di analisi con questa precisazione di metodo, non applicano modelli di machine learning solo perché è una pratica comune, ma trovano informazioni preziose e le rendono fruibili.
In sostanza, l’analisi dei Big Data, diventa “buona” e quando è capace di estrarre informazioni rilevanti dalle vaste sequenze disponibili per metterle a frutto. Si crea valore e si aumenta la produttività in azienda quando i database di informazioni grezze diventano set che permettono di prendere decisioni sensate in linea con i risultati delle analisi.
La dimensione del dato, in altri termini, non è il vero indicatore e nemmeno dice molto sulla sua tipologia, ma il vero core è il tipo di analisi che si vuole effettuare con le informazioni ciò che rende i Big Data dei veri Good Data.
In termini generali le azioni che si possono intraprendere sui dati per estrarre valore sono tre:
Salvarli: accedere a miliardi di dati in tempi ragionevoli, farne un backup, utilizzarli per analisi ad hoc con software di analisi.
Elaborarli: cercare la risposta a una domanda posta in precedenza spesso prevede l’utilizzo dei bot, del machine learning su vasta scala e spesso l’utilizzo dell’intelligenza artificiale.
Visualizzarli: saper sintetizzare in modo comprensibile il significato di tutto ciò che si è raccolto, memorizzato ed analizzato per far emergere l’informazione determinante per prendere decisioni accurate.
È questa, dunque, la grande sfida dei data scientist, dei data designer e degli analisti di tutto il mondo: creare nuovi modi di presentare le informazioni sapendo che la visualizzazione dei dati è un modo semplice e veloce per trasmettere concetti o informazioni il più rapidamente possibile.