Monitorare l’ascesa della scienza dei dati

In tutto il mondo, i leader aziendali si stanno orientando verso un processo decisionale basato sui dati nelle loro organizzazioni e accettano prontamente che la capacità di gestire bene i dati è fondamentale per aiutarli a superare la concorrenza. Tuttavia, questo sviluppo richiedeva anni.

Secondo Juan M. Lavista Ferres, capo scienziato dei dati e vicepresidente del colosso tecnologico Microsoft, i metodi attualmente in uso non sono affatto nuovi, mentre la nostra passione per i dati è iniziata decenni fa.

Con un master in machine learning e data mining presso la John Hopkins University nel 2005, molto prima che la scienza dei dati fosse coniata come termine, Lavista Ferres dovrebbe conoscerne una o due.

Il punto di svolta per la scienza dei dati

In un’intervista a Educazione alla fortuna, Lavista Ferres osserva che la scienza dei dati è il culmine degli sforzi in più campi per lavorare con i dati. Da economisti, statistici e informatici, esperti in varie discipline hanno creato nel corso degli anni vari metodi incentrati sui dati per lavorare con i dati.

La scienza dei dati è essenzialmente la fusione di queste tecniche e strategie.

E i metodi di manipolazione dei dati oggi sono sostanzialmente invariati negli ultimi 100 anni, afferma Lavista Ferres. Anche gli algoritmi di apprendimento automatico “più recenti” risalgono ancora a due o tre decenni fa.

Il semplice motivo per cui molti di questi algoritmi non sono stati utilizzati in passato è dovuto alla mancanza di dati o alla potenza di elaborazione inadeguata, considerazioni che la digitalizzazione pervasiva e il cloud computing hanno ridotto, se non addirittura rimosso.

“[A] molti di questi algoritmi non sono stati utilizzati perché non c’erano abbastanza dati. Oggi disponiamo di una potenza di elaborazione significativamente maggiore e di una quantità notevolmente maggiore di dati che non avevamo prima”, ha affermato Lavista Ferres.

“[We are seeing an] crescita esponenziale dei dati. C’è stata un’enorme riduzione del costo di archiviazione dei dati e un enorme aumento della potenza di elaborazione. Ci si aspetta che tutte queste cose continuino a crescere e forniscano incredibili opportunità che prima non esistevano”.

Costruire un team di data science eccezionale

Questa miniera di dati può aiutare a risolvere un numero enorme di problemi, afferma Lavista Ferres, che spiega la carenza di data scientist mentre le aziende si affrettano ad assumerli.

La barriera per essere un data scientist non è così alta come si crede. Lui spiega:[In general]non è necessario aver studiato data science per essere un data scientist… la maggior parte dei data scientist che lavorano in Microsoft e nel settore tecnologico oggi non ha studiato particolarmente data science, ma ha studiato una disciplina che aveva molto [of] elementi di scienza dei dati.

Mentre Lavista Ferres afferma che la maggior parte delle abilità di un data scientist viene appresa sul lavoro, una solida base attorno a elementi chiave come la codifica o i dati è vitale. Infine, un background molto forte in statistica sarà estremamente utile per capire cosa si può (o non si può) fare con i dati.

Ma come possono le aziende creare un team di data science eccezionale? Si scopre che i team migliori sono quelli con un background diversificato, afferma Lavista Ferres: “Attualmente, nel mio team, ho economisti, statistici, informatici, fisici, persone con un background di ingegneria elettrica e ci sono quelli provenienti da nuove discipline che si concentrano principalmente sulla scienza dei dati e lavoriamo con loro”.

Non sorprende che la capacità di un data scientist di comunicare bene sia considerata un’abilità essenziale da Lavista Ferres. Ciò implica spiegare cosa dicono i dati e metterli in un modo che altre persone possano capire.

La scienza dei dati è per tutti

Se c’è un takeaway, sarebbe sicuramente la convinzione di Lavista Ferres che la scienza dei dati sia per tutti. Secondo lui, i data scientist stanno attualmente colmando le lacune in molte discipline, dai medici ai fisici, a causa della mancanza di competenze incentrate sui dati.

Ma poiché le capacità di scienza dei dati alla fine proliferano tra organizzazioni e settori, ci si aspetta che le competenze di scienza dei dati diventino prevalenti.

E proprio come il modo in cui la programmazione viene ora insegnata nei corsi non informatici o anche come corsi di arricchimento per bambini, non è troppo difficile immaginare che la scienza dei dati alla fine si troverà ovunque.

Paul Mah è l’editore di DSAITrends. Ex amministratore di sistema, programmatore e docente di informatica, gli piace scrivere sia codice che prosa. Puoi raggiungerlo a [email protected].​

Credito immagine: iStockphoto/lzf

.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *