La statistica computazionale è una disciplina a cavallo tra statistica e informatica che studia metodi statistici applicati tramite metodi computazionali. È la branca delle scienze computazionali specifica della statistica. Quest'area si sta sviluppando rapidamente, tanto che si discute di farla diventare parte integrante dell'insegnamento della statistica.[1]
Come nella statistica tradizionale, l'obiettivo della statistica computazionale è trasformare i dati grezzi in conoscenza,[2] incentrandosi però su quei metodi statistici che necessitano l'uso di computer, come nei casi in cui la dimensione del campione è molto grande e i dataset non sono omogenei.[2]
I termini "statistica computazionale" e "computazione statistica" sono spesso usati in modo intercambiabile, anche se Carlo Lauro (ex presidente dell'International Association for Statistical Computing) ha proposto di fare una distinzione, definendo "computazione statistica" come "l'applicazione dell'informatica alla statistica", e "statistica computazionale" come la disciplina "finalizzata alla progettazione di algoritmi per implementare metodi statistici su computer, compresi quelli impensabili prima dell'era dei computer (es. bootstrap, simulazioni), nonché per far fronte a problemi analiticamente intrattabili" [sic].[3]
Il termine "statistica computazionale" può essere utilizzato anche per riferirsi a metodi statistici con una impronta computazionale (computationally intensive), tra cui metodi di ricampionamento, metodi Catena di Markov Monte Carlo, regressione locale, stima dei kernel di densità, reti neurali artificiali e modelli additivi generalizzati.