Data scientist contro esperti di dominio

Dieci anni dopo, si ipotizza che il ruolo del data scientist possa essere di breve durata.

In un articolo della Harvard Business Review del 2012, Thomas Davenport e DJ Pati hanno affermato: Data Scientist: Sexiest Job of the 21st Century. Nel 2022, gli autori hanno pubblicato di nuovo con il titolo: Data Scientist è ancora il lavoro più sexy del 21° secolo? Non hanno preso posizione su questo, ma hanno fatto alcuni commenti utili:

Il ruolo era relativamente nuovo all’epoca. Tuttavia, poiché sempre più aziende hanno cercato di dare un senso ai big data, si sono rese conto di aver bisogno di persone in grado di combinare capacità di programmazione, analisi e sperimentazione. A quel tempo, quella domanda era principalmente limitata alla San Francisco Bay Area e ad alcune altre città costiere. Le startup e le aziende tecnologiche in quelle aree sembravano volere tutti i data scientist che potevano assumere. Abbiamo ritenuto che la necessità si sarebbe ampliata man mano che le aziende tradizionali hanno abbracciato l’analisi aziendale e nuove forme e volumi di dati.

Il prototipo del data scientist nel 2012 è stato reclutato tra le fila dei dottorandi di campi come la fisica, la statistica o la matematica o altre discipline quantificative con esperienza nella sperimentazione nelle rispettive aree di ricerca. Come si suol dire, le loro capacità erano necessarie ma non sufficienti. Un progetto di scienza dei dati significativo, da un capo all’altro, comporta troppi passaggi e troppi domini di competenze per una sola persona. Spesso responsabile dell’intero sforzo, il data scientist doveva fornire competenze nelle seguenti aree:

  • Analisi statistica e calcolo
  • Apprendimento automatico
  • apprendimento approfondito
  • Elaborazione di grandi set di dati
  • Visualizzazione dati
  • Data Wrangling
  • Matematica
  • programmazione
  • Statistiche
  • Analisi esplorativa dei dati
  • Visualizzazione dei risultati per la presentazione inclusi BI, Powerpoint e presentazione di persona

Da Il futuro dei data scientist: il prossimo decennio assisterà a una completa estinzione?

Cosa implica la scienza dei dati?

Per cominciare, la scienza dei dati è l’arte di estrarre informazioni rilevanti, approfondimenti e conoscenze importanti da un determinato insieme di dati. Quindi, il risultato di qualsiasi progetto di scienza dei dati è principalmente una serie di diapositive o un PPT che sostanzialmente conclude l’intero scenario per i capi aziendali per prendere decisioni o per un gruppo di esperti tecnici e di prodotto per concludere come lavorare su un sito.

I passaggi chiave che dirigono il flusso di lavoro di qualsiasi progetto di data science sono principalmente:

  • Raccolta di molti dati (per fonti verificate)
  • Analizzare i dati e ripeterli più volte per sviluppare una solida comprensione dei dati
  • Suggerire ipotesi o azioni che includono l’analisi e l’aggiornamento periodico dei dati.
  • Le organizzazioni attualmente cercano di creare un valido framework per la scienza dei dati assumendo team grandi e coerenti e radicati, confrontati con l’impostazione di linee guida del settore.

Come risultato della probabilità che un data scientist sia competente in più di alcuni di questi requisiti, secondo Noah Gift:

Molti team di data science non hanno fornito risultati che possono essere misurati in ROI dai dirigenti. Per attività complesse di ingegneria dei dati, sono necessari cinque ingegneri dei dati per ogni scienziato dei dati.

Il ritmo del software di automazione è piuttosto drammatico e influenzerà la natura del lavoro di scienza dei dati, incluso l’apprendimento automatico. Tutti i principali fornitori di cloud hanno investito molto in qualche tipo di iniziativa AutoML. Un data scientist non è più caratterizzato dalle capacità di codifica, il che è confermato dalla crescente importanza di nessun codice, accordi di ML automatico come DataRobot, Amazon, Dataiku, Google Cloud, Databricks, H20, Rapid Miner e Alteryx. Questo significa che la scienza dei dati è una cattiva scelta professionale? Senza dubbio, la posizione è in evoluzione. I data scientist dovrebbero cercare di migliorare le proprie competenze in cose che non sono automatizzabili:

  • Abilità comunicative
  • Competenza nel dominio applicato
  • Creazione di entrate e valore aziendale

Il processo di spremitura del reclutamento è passato a pensatori critici, analisti e risolutori di problemi che comprendono tutte le sfumature del business, della sua area di competenza e dei suoi vari collaboratori. Quindi, il semplice know-how di diversi pacchetti software o la capacità di vomitare un paio di righe di codice non porterebbero a termine il lavoro.

L’unica cosa certa è il cambiamento, e i cambiamenti stanno arrivando alla scienza dei dati. Mentre il titolo di data scientist si ritirerà, il lavoro del data scientist sarà distribuito a ingegneri di apprendimento automatico, ingegneri di dati, manipolatori di intelligenza artificiale, comunicatori di intelligenza artificiale, responsabili di etica di intelligenza artificiale, responsabili di prodotto di intelligenza artificiale, amministratori di produzione di intelligenza artificiale e architetti di intelligenza artificiale. Ciò che gli attuali data scientist dovrebbero fare per rimanere pertinenti è abbracciare le competenze trasversali. Dovrebbero deviare dalle attività che possono essere facilmente automatizzate – ingegneria delle funzionalità, analisi dei dati esplorativa, modellazione banale – e passare a attività che sfidano l’automazione e producono un sistema di intelligenza artificiale che ha un impatto aziendale misurabile con metriche aziendali verificabili e aumento dei ricavi.

Le aziende che vogliono essere all’avanguardia possono abbracciare il pragmatismo e l’automazione delle attività di apprendimento automatico per ottenere un chiaro vantaggio strategico.

La mia opinione: cosa si può concludere sul destino dei data scientist?

Ovviamente, la scienza dei dati non potrà mai estinguersi. Tuttavia, le posizioni e i ruoli titolari del data scientist noteranno sicuramente un cambiamento dinamico. In un altro decennio circa, specialisti del settore, analisti aziendali ed esperti sul campo esperti di dati diventeranno esperti di scienza dei dati ricevendo una formazione in AI e ML.

Questi specialisti saranno in grado di permeare l’analisi con le loro profonde conoscenze industriali, indipendentemente dal fatto che siano in grado di programmare. I loro titoli rispecchieranno la loro attitudine invece dei metodi che eseguono.

Non credo che lo scienziato dei dati sia stato il lavoro più sexy del 21° secolo nel 2012, e non lo è ora. In effetti, stiamo già assistendo a un calo degli annunci di lavoro per i data scientist e un corrispondente aumento degli annunci per la scomposizione della concezione originale della scienza dei dati.

.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *