Data science

Ciao, sono Simone Ghezzi, nato e cresiuto a Milano, ho lavorato per 17 anni per eBay come analista di dati; dal 2019 lavoro come data scientist in Svizzera per una azienda di telecomunicazioni. Mi puoi contattare qui: simone.ghezzi@gmail.com

In questo sito voglio condividere con te quello che ho imparato e sto imparando nei miei primi 20 anni di analisi dei dati.

Lo faccio indirizzandoti verso le risorse che ritengo piu utili, e privilegiando le fonti

- gratuite

- che vanno al punto e non ti fanno perdere tempo.

- di universita' prestigiose

- in italiano, quando esistono; ma ti avviso che per ora il meglio e' in inglese.

Cominciamo dalle basi:

La cosa numero zero e' la capacita' di capire la domanda che ti viene fatta, cosa vogliamo scoprire, qual'e' il problema.

Questo tema e' alla base di tutto il resto. difficile, richiede capacita' di investigare, fare domande e sapere ascoltare.

Asking the right questions

Active listening

L'arte di ascoltare

A questo punto vediamo gli strumenti per trovare la risposta:

La prima cosa da imparare e' Excel. il modo piu facile per fare le tue prime analisi, basate su dati di una o due tabelle di massimo qualche migliaio di righe.

qui e' facile, c'e' il corso di Alessandro Colombi, Friendly Excel: https://www.youtube.com/channel/UCG_3tiSkvRaibEScIKtFPUg

La seconda e' SQL. inizi a prendere molte tabelle, eventualmente piu grandi di qualche migliaio di righe.

Se la tua azienda ha un database, impara quello, altrimenti impara postgresql che al momento e' lo standard.

sqlite va bene solo per fare i primi passi, ma poi ha troppe limitazioni per un utilizzo professionale.

Ok fin qui siamo nel territorio degli analisti di dati; il salto recente a data science e' determinato dalle cose che si imparano qua sotto:

La terza e' imparare a programmare in Python e/o in R.

Questo e' anche un buon momento per imparare a lavorare su un terminale; per questo ti servono:

- jupyter notebook

- i comandi linux (chiamati anche shell, bash).

- git

La quarta e' machine learning / deep learning.

La quinta Big Data, per ora il modo migliore a mio avviso e' imparare Spark.

Qui mi fermo, per me padroneggiare questi punti ti rende a tutti gli effetti un data scientist.