Misurare non è spiegare: il nodo causale nella ricerca pedagogica
Quando i dati diventano retorica scientifica.
Abstract
Negli ultimi anni, la ricerca pedagogica ha conosciuto una crescente enfasi sulle pratiche di misurazione empirica e sull’uso di strumenti quantitativi, spesso assunti come garanzia di scientificità. In questo quadro, l’individuazione di correlazioni statistiche viene talvolta interpretata come prova di nessi causali, legittimando teorie e interventi educativi senza un’adeguata ricostruzione esplicativa dei fenomeni osservati. Il contributo propone una critica epistemologica di tale impostazione, mostrando come la confusione tra correlazione e causalità trasformi il dato empirico in una forma di retorica scientifica. Attraverso un esempio paradigmatico e un’analogia strutturale con pratiche di ricerca pedagogica, l’articolo evidenzia il ruolo delle variabili latenti e dei meccanismi di mediazione, sostenendo la necessità di distinguere rigorosamente tra misurazione, descrizione e spiegazione causale nella costruzione di conoscenza educativa scientificamente fondata.
⸻
1. Introduzione
Negli ultimi decenni la ricerca pedagogica ha conosciuto una crescente valorizzazione dei metodi empirico-quantitativi, spesso assunti come criterio privilegiato di scientificità. Raccolta sistematica dei dati, costruzione di griglie di osservazione e analisi statistiche vengono frequentemente considerate condizioni sufficienti per la validazione teorica di pratiche e modelli educativi.
Tale orientamento metodologico, pur avendo prodotto un ampliamento significativo delle informazioni disponibili, rischia tuttavia di generare un equivoco epistemologico rilevante: l’assimilazione della correlazione statistica alla dimostrazione di un nesso causale. Questo contributo intende problematizzare tale assimilazione, mostrando come la misurazione, in assenza di un adeguato impianto teorico, non equivalga a spiegazione.
⸻
2. Correlazione e causalità: una distinzione epistemologica necessaria
Dal punto di vista epistemologico, la correlazione indica una variazione congiunta tra due variabili, mentre la causalità implica un rapporto asimmetrico, temporalmente e concettualmente strutturato, tra un fattore esplicativo e un esito.
Una correlazione può derivare da:
• una relazione causale diretta;
• una relazione causale inversa;
• l’azione di una o più variabili latenti;
• effetti di selezione o vincoli strutturali.
Senza una teoria che giustifichi il passaggio dalla covariazione alla spiegazione, il dato statistico resta descrittivo. La confusione tra questi livelli costituisce una delle principali fragilità metodologiche di una parte della ricerca pedagogica empirica.
⸻
3. Correlazione, variabili latenti e mediazione causale: un esempio paradigmatico
Si consideri il caso in cui una ricerca individui una correlazione positiva tra la longevità degli individui e il numero medio annuale di volte in cui essi si lavano i denti. Tale correlazione è statisticamente plausibile e non problematica in sé. La difficoltà emerge quando essa viene interpretata come prova di un nesso causale diretto.
Un’analisi concettualmente fondata mostra che la frequenza dei lavaggi dei denti non costituisce la causa della longevità, bensì una variabile proxy, ossia un indicatore empirico di una variabile latente: un orientamento salutare complessivo verso le abitudini quotidiane. Tale orientamento comprende attenzione alla prevenzione, cura del corpo e adozione di comportamenti complessivamente sani.
La struttura causale del fenomeno risulta dunque mediata:
• l’orientamento salutare agisce come fattore causale primario;
• la frequenza dei lavaggi ne rappresenta una manifestazione osservabile;
• la longevità costituisce un esito mediato dall’insieme delle pratiche che derivano da tale disposizione.
Attribuire efficacia causale alla variabile proxy significa confondere un indicatore con il meccanismo esplicativo. Da tale errore discendono inferenze logicamente infondate, come l’idea che un incremento arbitrario della frequenza dei lavaggi possa produrre, di per sé, un aumento dell’aspettativa di vita.
⸻
4. Analogia strutturale con la ricerca pedagogica empirica
Una struttura logica analoga è riscontrabile in numerose ricerche pedagogiche, nelle quali variabili osservabili vengono interpretate come cause dirette di esiti formativi.
In molti casi, tali pratiche funzionano come proxy di disposizioni più ampie (motivazione intrinseca, capitale culturale, supporto familiare, aspettative educative, etc etc ), che restano poco o nulla osservate, ma causalmente determinanti. L’intervento educativo non è necessariamente la causa dell’esito positivo, ma può costituirne una conseguenza o un indicatore.
La correlazione empirica viene così elevata a prova di efficacia, senza che siano esplicitati i meccanismi causali sottostanti.
⸻
5. Scientificità e rischio di retorica scientifica
La scientificità della ricerca pedagogica non può essere ridotta alla misurazione né alla sofisticazione delle tecniche statistiche. Una ricerca è scientifica nella misura in cui è in grado di spiegare i fenomeni che osserva, rendendo espliciti:
• i nessi causali ipotizzati;
• il ruolo delle variabili latenti;
• le condizioni di validità delle inferenze prodotte e i principi espliciti di falsificazione (questi ultimi quasi mai considerati).
Quando il coefficiente di correlazione viene assunto come criterio di verità, il dato empirico rischia di assumere una funzione retorica: non strumento di conoscenza, ma mezzo di legittimazione teorica e normativa.
⸻
6. Conclusione
Il contributo ha mostrato come la confusione tra correlazione e causalità rappresenti una fragilità epistemologica significativa in una parte rilevante della ricerca pedagogica contemporanea. Misurare non equivale a spiegare, e l’evidenza empirica, se non integrata in un quadro teorico esplicativo, rischia di trasformarsi in una forma di retorica scientifica.
La validazione di pratiche educative innovative fondata esclusivamente su correlazioni statistiche produce evidenze solo apparenti, capaci di sostenere conclusioni normative prive di adeguato fondamento causale. Una ricerca rigorosa richiede invece un esplicito lavoro teorico sui meccanismi che legano le variabili osservate agli esiti educativi, riconoscendo il ruolo delle mediazioni, delle disposizioni latenti e dei contesti e delle forme di falsificazione da terzi.
Solo mantenendo una distinzione netta tra misurazione, descrizione e spiegazione causale è possibile restituire alla ricerca pedagogica una scientificità non meramente procedurale, ma autenticamente conoscitiva.

Giusta osservazione: troppe volte si confonde correlazione con causazione.
Ma il discorso sarebbe ancor più ampio e complesso, e potrebbe estendersi ad una seria critica della scienza moderna…e a tutti i suoi limiti…
Articolo chiaro e ben esposto. Condivisibile in ogni suo punto.
Lettura piacevole, sempre bene riportare all’attenzione certi temi, prima che vengano fagocitati dalla distrazione o dalla negligenza.
Grazie.
Buongiorno. Si potrebbe avere una bibliografia?
Certamente Ylenia.
Riportiamo di seguito una bibliografia essenziale e ragionata a supporto delle tesi sviluppate, presentata per macro voci tematiche A-B-C-D-E.
A. Correlazione ≠ causalità (fondamentale)
Pearl, J. (2009).
Causality: Models, Reasoning, and Inference. Cambridge University Press.
→ Testo di riferimento assoluto sulla distinzione formale tra correlazione e causalità; utile per legittimare il passaggio teorico dell’articolo, con esempi paradigmatici.
Pearl, J., Glymour, M., & Jewell, N. P. (2016).
Causal Inference in Statistics: A Primer. Wiley.
→ Chiarisce perché i dati correlazionali non sono sufficienti a inferenze causali, che purtroppo spesso vengono impropriamente dedotte.
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002).
Experimental and Quasi-Experimental Designs for Generalized Causal Inference. Houghton Mifflin.
→ Classico dedicato alla cosiddetta scienza dell’educazione: mostra i limiti delle inferenze causali fuori da disegni controllati e/o con tesi prestabilite.
⸻
B. Variabili latenti, proxy e mediazione
Bollen, K. A. (1989).
Structural Equations with Latent Variables. Wiley.
→ Fondamentale per il concetto di variabile latente e per la critica all’uso ingenuo degli indicatori osservabili nella ricerca pedagogica.
Cronbach, L. J., & Meehl, P. E. (1955).
Construct validity in psychological tests. Psychological Bulletin, 52(4), 281–302.
→ Testo classico sulla distinzione necessaria tra costrutti teorici e indicatori empirici.
MacCallum, R. C., et al. (1993).
Modeling interaction effects in latent variables. Psychological Methods.
→ Supporta l’idea che molti degli esiti richiamati nell’articolo siano mediati da strutture non direttamente osservabili.
⸻
C. Spiegazione scientifica vs descrizione
Hempel, C. G., & Oppenheim, P. (1948).
Studies in the Logic of Explanation. Philosophy of Science.
→ Testo fondativo sulla differenza tra descrivere regolarità e spiegare causalmente. Riporta tipici bias insidiosi riscontrabili nella ricerca pedagogica.
Salmon, W. C. (1984).
Scientific Explanation and the Causal Structure of the World. Princeton University Press.
→ Centrale per sostenere che senza meccanismi causali non c’è spiegazione scientifica. Esempi di paradossi che mostrano cause addirittura mutuamente esclusive.
⸻
D. Critica del positivismo metodologico e della “retorica dei dati”
Popper, K. (1959).
The Logic of Scientific Discovery. Routledge.
→ Un classico. Fondamentale per il tema della falsificabilità, richiamato esplicitamente nell’articolo.
Lakatos, I. (1970).
Falsification and the Methodology of Scientific Research Programmes.
→ Rafforza la critica alla scientificità ridotta a procedura, tipica di molti protocolli di ricerca sociologica e pedagogica.
Bourdieu, P., Chamboredon, J.-C., & Passeron, J.-C. (1968).
Le métier de sociologue. Mouton.
→ Centrale per la critica all’empirismo ingenuo e alla naturalizzazione dei dati.
⸻
E. Metodologia e ricerca pedagogica
Biesta, G. (2007).
Why “what works” won’t work: Evidence-based practice and the democratic deficit in educational research. Educational Theory, 57(1).
→ Perfettamente allineato con la tesi dell’articolo sulla retorica dell’evidenza.
Biesta, G. (2010).
Good Education in an Age of Measurement. Routledge.
→ Critica fortemente la riduzione della qualità educativa a indicatori misurabili e dati in batteria.
Mortari, L. (2007).
Cultura della ricerca e pedagogia. Carocci.
→ Riferimento italiano autorevole sulla distinzione tra metodo, teoria e senso educativo.
Vandenberghe, F. (1999).
“What’s causal about causal explanation?” Sociological Theory.
→ Ottimo ponte tra epistemologia e scienze sociali e pedagogiche. Premessa agli errori deduttivi di alcune recenti sperimentazioni.
Hernán, M. A., & Robins, J. M. (2020).
Causal Inference: What If. Chapman & Hall/CRC.
→ Testo di riferimento contemporaneo sull’inferenza causale nelle scienze sociali e pedagogiche; chiarisce in modo rigoroso perché le associazioni statistiche non costituiscano, di per sé, evidenza causale e mette in luce il ruolo imprescindibile delle assunzioni teoriche, delle variabili latenti e dei modelli esplicativi nella costruzione di spiegazioni scientificamente fondate.
Hernán, M. A., & Robins, J. M. (2020).
Causal Inference: What If. Chapman & Hall/CRC.
→ Testo di riferimento contemporaneo sull’inferenza causale nelle scienze sociali e psicopedagogiche; chiarisce in modo rigoroso perché le associazioni statistiche non costituiscano, di per sé, evidenza causale e sottolinea il ruolo imprescindibile delle assunzioni teoriche e dei modelli esplicativi.
Cartwright, N., & Hardie, J. (2012, ma ancora pienamente attuale).
Evidence-Based Policy: A Practical Guide to Doing It Better. Oxford University Press.
→ Critica l’uso ingenuo delle “evidenze” empiriche nelle premesse a molte delle riforme scolastiche e nei contesti applicativi, mostrando come l’efficacia osservata dipenda da meccanismi causali e condizioni contestuali spesso ignorate (rif. alla ricerca pedagogica evidence-based).
Gentilissimi, sto tentando di dare una spiegazione del vostro intervento con l’intento di convincermi che state fornendo spunti di riflessione/indicazioni valide sia per i ricercatori che per noi umili insegnanti, ma ancora mi mancano alcune informazioni per poter arrivare ad una conclusione. Per esempio, chi siete, cosa fate come mestiere, qual è la bibliografia che sostiene le vostre tesi, esiste un filone di ricerca-sperimentazione attualmente in atto da qualche parte del mondo occidentale e in particolare in Europa, cosa intendete con la frase “Il contributo ha mostrato come la confusione …”. Vi prego aiutatemi a comprendere meglio, Grazie
Buongiorno,
la ringraziamo per il suo commento. Proviamo a rispondere puntualmente, nei limiti di uno spazio che non può naturalmente sostituire un dibattito metodologico più ampio.
A) Per quanto riguarda le informazioni su chi siamo e sul contesto da cui muove il nostro intervento, esse sono disponibili nella sezione Chi siamo del sito, accessibile dal menu (icona con le tre barre orizzontali in alto a destra). Il gruppo sta aumentando di settimana in settimana, accogliendo profili molto diversi. Ma in generale persone che insegnano a vari livelli da quello primario a quello universitario di tutti i settori disciplinari.
B) Il contributo a cui fa riferimento si colloca esplicitamente sul piano epistemologico e metodologico: non intende proporre modelli didattici, prescrizioni operative né indicazioni per la pratica scolastica, ma interrogare criticamente alcune modalità oggi diffuse di produzione e legittimazione della conoscenza empirica in ambito educativo. Le evidenze richiamate sono pertanto di natura teorica e argomentativa e trovano fondamento in una letteratura consolidata della filosofia della scienza e della metodologia della ricerca educativa e sociale.
C) Le criticità discusse non sono formulate in astratto, ma corrispondono a errori sistematici e ricorrenti ampiamente rilevati nella produzione scientifica del settore; per ragioni di correttezza deontologica evitiamo naturalmente di citare titoli o autori specifici, poiché l’obiettivo non è la polemica personale, bensì la discussione di assetti strutturali.
Uno di questi assetti riguarda la formazione metodologica dei ricercatori nelle scienze della formazione. In molti percorsi accademici, la preparazione statistica è affidata a insegnamenti di pochi crediti, nei quali vengono condensati ambiti molto eterogenei della statistica descrittiva e inferenziale. Ne consegue che aspetti centrali della statistica avanzata — come le assunzioni dei modelli, la gestione degli errori di primo e secondo tipo, il controllo dei falsi positivi, le correzioni per test multipli, la distinzione tra significatività statistica ed effetto sostanziale, i modelli a effetti misti, le strutture gerarchiche dei dati, nonché i problemi di endogeneità e mediazione — restano spesso poco compresi o applicati in modo prevalentemente procedurale (Shadish et al., 2002; Pearl, 2009; Hernán & Robins, 2020).
D) Questa fragilità è oggi ulteriormente amplificata dalla diffusione di software statistici e strumenti di analisi automatizzata, che consentono di produrre rapidamente risultati quantitativi senza un’adeguata analisi delle ipotesi e delle condizioni di applicabilità dei modelli, condizioni che sono spesso complesse e fortemente vincolanti ai fini dell’attendibilità inferenziale. In assenza di una solida formazione matematico-statistica, tali strumenti rischiano di favorire interpretazioni indebitamente causali di evidenze puramente correlazionali.
E) Il confronto con altri ambiti di ricerca empirica — in particolare quello medico — è qui illuminante non in senso gerarchico, ma strutturale. In ambito medico, la ricerca è sottoposta a verifiche preventive molto stringenti: valutazione da parte di comitati etici indipendenti (Ethics Committee / IRB), preregistrazione dei protocolli, controllo rigoroso del disegno sperimentale e dell’analisi statistica, nonché peer review multilivello che coinvolge clinici, statistici specialisti e metodologi. Studi metodologicamente deboli possono essere bloccati prima ancora della raccolta dei dati.
In ambito pedagogico, invece, non esistono agenzie regolatorie equivalenti; la preregistrazione delle ipotesi è molto rara, quasi inesistenti; l’approvazione preventiva di comitati etici non è obbligatoria (salvo casi molto specifici e di nicchia); il principale meccanismo di accreditamento resta la pubblicazione su riviste scientifiche tramite peer review. Quest’ultima opera prevalentemente come filtro ex post, con revisori interni allo stesso settore disciplinare, un controllo statistico non specialistico e una limitata attenzione all’inferenza causale.
L’ulteriore accreditamento avviene poi attraverso indicatori istituzionali e bibliometrici (indicizzazione, fasce di rivista, citazioni, ASN, VQR), che misurano visibilità e circolazione dei lavori, ma non garantiscono di per sé la solidità epistemica delle inferenze prodotte. In questo senso, l’accreditamento riguarda soprattutto l’autore e la sede editoriale, più che la robustezza causale del singolo studio. Come dire se lo studio circola diventa importante e affidabile in quanto citato.
F) Quanto al testo, dove si afferma che “il contributo ha mostrato come la confusione tra correlazione e causalità rappresenti una fragilità epistemologica significativa”, si intende richiamare l’attenzione su questo insieme di condizioni strutturali, non mettere in discussione il valore del lavoro di insegnanti o ricercatori, né negare l’importanza della ricerca empirica in educazione. Al contrario, l’intento è sollecitare una riflessione condivisa sui limiti e sulle responsabilità dell’uso dei dati quantitativi, affinché la misurazione non venga scambiata per spiegazione e l’evidenza empirica non assuma una funzione meramente retorica, a fronte di risultati in situazione spesso imbarazzanti.
Ci auguriamo che questo chiarimento contribuisca a rendere più comprensibile il senso dell’intervento e restiamo aperti al confronto, che riteniamo essenziale proprio per una ricerca educativa autenticamente rigorosa.
PS per la bibliografia e per le ricerche di riferimento la rimandiamo alla risposta poco sopra, ad un’altra utente di nome Ylenia.
Bellissimo articolo.