La scienza dei dati e la sua relazione con i big data e il processo decisionale basato sui dati

Le aziende di quasi tutti i settori si stanno concentrando sullo sfruttamento dei dati per ottenere un vantaggio competitivo, grazie al volume di dati attualmente disponibile. È diventato più difficile analizzare grandi quantità di dati manualmente o anche con database standard. Grazie ai progressi nella potenza di calcolo e all’uso diffuso delle reti, è ora possibile condurre ricerche di profondità e ampiezza senza precedenti utilizzando algoritmi che collegano i database. Come risultato della convergenza di questi fenomeni, la scienza dei dati viene attualmente applicata in un numero crescente di applicazioni commerciali.

Il processo decisionale basato sui dati (DDD) si riferisce al processo di decisione basato sull’analisi dei dati piuttosto che sull’intuizione. Un marketer, ad esempio, potrebbe scegliere gli annunci pubblicitari esclusivamente in base alla sua vasta conoscenza del settore e alla sua intuizione per ciò che avrà successo. In alternativa, potrebbero basare la loro decisione sui risultati di un’analisi dei dati su come i clienti rispondono ai vari annunci pubblicitari. Possono anche utilizzare una combinazione delle strategie. DDD non è una strategia tutto o niente; piuttosto, diverse aziende vi si impegnano a vari livelli e intensità.

Esistono principi essenziali che guidano l’estrazione metodica di informazioni e conoscenze dai dati utilizzando tecniche di scienza dei dati. Il data mining è forse il concetto più strettamente correlato alla scienza dei dati poiché implica l’effettiva estrazione di informazioni dai dati utilizzando tecnologie che aderiscono a questi principi. Esistono centinaia di algoritmi di data mining distinti e un ampio grado di profondità metodologica nell’argomento. Tuttavia, dietro tutte queste specificità c’è un insieme molto più piccolo e compatto di principi fondamentali.

La scienza dei dati comprende i principi, le procedure e i metodi per comprendere i fenomeni attraverso l’analisi dei dati (automatizzata). Di recente, l’economista Erik Brynjolfsson ei suoi colleghi del MIT e della Penn’s Wharton School hanno condotto uno studio sull’impatto del DDD sulle prestazioni aziendali. Hanno stabilito una metrica DDD che classifica le aziende in base alla misura in cui utilizzano i dati per prendere decisioni a livello aziendale.

Le aziende basate sui dati sono più produttive, anche quando tengono conto di un’ampia gamma di potenziali circostanze confondenti. Questo è dimostrato statisticamente. Questo è mostrato statisticamente. Di conseguenza, una singola variazione standard più alta dell’indice DDD è collegata a un aumento della produttività del 4-6%. Inoltre, il DDD si riferisce a un maggiore utilizzo delle risorse, valore di mercato, rendimento del capitale proprio e rendimento delle attività e la relazione sembra essere causale.

I data scientist hanno identificato una serie di concetti fondamentali che governano l’estrazione pragmatica di conoscenza dai dati in relazione ai big data e al processo decisionale basato sui dati.

  1. Metodologia di estrazione dei dati: un metodo predefinito di estrazione dei dati.
  2. Valutazione dei dati considerando il contesto: i dati raccolti verranno analizzati sulla base dei risultati attesi.
  3. Secchi di dati: utilizzando il framework di analisi del valore atteso, la relazione tra il problema aziendale e la soluzione di analisi può essere spesso scomposta in sottoproblemi praticabili.
  4. Conclusione basata sui fattori di confondimento: per ricavare informazioni dai dati, trarre conclusioni sull’inclusione o l’esclusione di fattori di confondimento.

È necessario dedicare più tempo per determinare se la scienza dei dati emergerà come materia perché viene trascurata la dimensione della veridicità, che potrebbe essere più vicina a questo obiettivo in termini di rilevanza. La necessità dei data scientist è stata riconosciuta dalle aziende, che hanno capito che i dati possono essere utilizzati per aiutare nel processo decisionale, in particolare su larga scala dove la precisione può rendere un’azienda più competitiva

Esistono numerose prove che il processo decisionale basato sui dati, le tecnologie dei big data e le metodologie di data science basate sui big data possono migliorare sostanzialmente le prestazioni aziendali. La scienza dei dati facilita il processo decisionale basato sui dati e, occasionalmente, consente il processo decisionale automatico su larga scala e fa affidamento sulla tecnologia per l’archiviazione e l’ingegneria dei “big data”. Tuttavia, i principi della scienza dei dati sono unici e devono essere studiati e articolati in modo chiaro affinché la scienza dei dati raggiunga il suo pieno potenziale.



linkin


disclaimer

Le opinioni espresse sopra sono proprie dell’autore.



FINE ARTICOLO



.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *