Ludovica Sartorelli
Insegno alle macchine a leggere i mercati finanziari dal 2014. Il mio lavoro combina analisi quantitativa, sviluppo algoritmi e oltre 8 anni di esperienza in modelli predittivi.
Perché scrivo qui
Ho iniziato questo progetto nel 2019 per documentare metodi, errori e risultati reali nella modellazione finanziaria con machine learning.
Troppi contenuti sul tema promettono miracoli o nascondono le complessità dietro termini vaghi. Io mostro codice funzionante, set di dati concreti e analisi che hanno richiesto settimane di test. Ogni articolo include numeri verificabili e riferimenti precisi.
Non troverai formule magiche o strategie garantite. Troverai invece pipeline complete per il preprocessing dei dati, confronti tra 4 algoritmi diversi su serie storiche di 12 anni, e l'analisi onesta di 37 modelli falliti prima di ottenere un R² accettabile.
Scrivo per chi vuole capire davvero come funzionano random forest, reti neurali ricorrenti e LSTM applicati a dati finanziari. Il mio pubblico include data scientist, analisti quantitativi e chiunque abbia familiarità con Python, pandas e scikit-learn.
Cosa posso fare per te
Tre aree dove ho costruito competenze misurabili negli ultimi 9 anni di lavoro continuativo.
Modelli predittivi
Ho sviluppato 142 modelli di previsione per 6 asset class diverse. Gradient boosting, ensemble methods e deep learning su serie temporali finanziarie.
Feature engineering
Trasformo dati grezzi in variabili predittive. Ho testato oltre 200 indicatori tecnici e creato 47 feature personalizzate con correlazione superiore a 0.6.
Pipeline produzione
Scrivo codice che gira in produzione senza interventi manuali. Sistemi che processano 2.3 milioni di righe al giorno con latenza sotto 300ms.
Primi esperimenti
Ho iniziato con regressione lineare e alberi decisionali su dati storici dello S&P 500. I primi 18 modelli hanno fallito completamente con RMSE superiore al 15%.
Svolta algoritmica
Ho scoperto XGBoost e gradient boosting. Il primo modello funzionante ha raggiunto 0.71 di R² su test set fuori campione di 3 anni. Da lì ho raffinato l'approccio.
Lancio del blog
Ho fondato Harn Umet per condividere metodi e codice. Il primo articolo documentava 7 settimane di hyperparameter tuning su LSTM. 2.800 combinazioni testate.
Sistemi in produzione
Oggi gestisco pipeline che analizzano dati tick-by-tick per 12 mercati. Modelli ensemble che combinano 5 algoritmi diversi con performance verificabile su 24 mesi di dati live.