Ludovica Sartorelli

Insegno alle macchine a leggere i mercati finanziari dal 2014. Il mio lavoro combina analisi quantitativa, sviluppo algoritmi e oltre 8 anni di esperienza in modelli predittivi.

Perché scrivo qui

Ho iniziato questo progetto nel 2019 per documentare metodi, errori e risultati reali nella modellazione finanziaria con machine learning.

Troppi contenuti sul tema promettono miracoli o nascondono le complessità dietro termini vaghi. Io mostro codice funzionante, set di dati concreti e analisi che hanno richiesto settimane di test. Ogni articolo include numeri verificabili e riferimenti precisi.

Non troverai formule magiche o strategie garantite. Troverai invece pipeline complete per il preprocessing dei dati, confronti tra 4 algoritmi diversi su serie storiche di 12 anni, e l'analisi onesta di 37 modelli falliti prima di ottenere un R² accettabile.

Scrivo per chi vuole capire davvero come funzionano random forest, reti neurali ricorrenti e LSTM applicati a dati finanziari. Il mio pubblico include data scientist, analisti quantitativi e chiunque abbia familiarità con Python, pandas e scikit-learn.

Cosa posso fare per te

Tre aree dove ho costruito competenze misurabili negli ultimi 9 anni di lavoro continuativo.

Modelli predittivi

Ho sviluppato 142 modelli di previsione per 6 asset class diverse. Gradient boosting, ensemble methods e deep learning su serie temporali finanziarie.

Feature engineering

Trasformo dati grezzi in variabili predittive. Ho testato oltre 200 indicatori tecnici e creato 47 feature personalizzate con correlazione superiore a 0.6.

Pipeline produzione

Scrivo codice che gira in produzione senza interventi manuali. Sistemi che processano 2.3 milioni di righe al giorno con latenza sotto 300ms.

2014

Primi esperimenti

Ho iniziato con regressione lineare e alberi decisionali su dati storici dello S&P 500. I primi 18 modelli hanno fallito completamente con RMSE superiore al 15%.

2017

Svolta algoritmica

Ho scoperto XGBoost e gradient boosting. Il primo modello funzionante ha raggiunto 0.71 di R² su test set fuori campione di 3 anni. Da lì ho raffinato l'approccio.

2019

Lancio del blog

Ho fondato Harn Umet per condividere metodi e codice. Il primo articolo documentava 7 settimane di hyperparameter tuning su LSTM. 2.800 combinazioni testate.

2023

Sistemi in produzione

Oggi gestisco pipeline che analizzano dati tick-by-tick per 12 mercati. Modelli ensemble che combinano 5 algoritmi diversi con performance verificabile su 24 mesi di dati live.

142 modelli sviluppati

2.3M righe processate al giorno

9 anni di esperienza

Pipeline di elaborazione dati finanziari