Bei Paneldaten handelt es sich um zweidimensionale Daten, die im Rahmen einer Panelstudie erhoben werden. Von Paneldaten zu unterscheiden sind Querschnittsdaten, in denen die Einheiten zu einem einzigen Zeitpunkt erfasst werden, und Zeitreihendaten, in denen eine einzige Einheit über mehrere Zeitperioden beobachtet wird. Neben den immer selben Untersuchungseinheiten (z. B. Personen, Haushalte oder Unternehmen) im Panel und der mehrfachen Durchführung der Erhebung (z. B. monatlich, jährlich oder zweijährlich) wird als drittes Merkmal genannt, dass dieselben oder zumindest die gleichen Inhalte erfragt oder erhoben werden.[1]
Die Paneldatenanalyse ist die statistische Analyse von Paneldaten im Rahmen der Panelforschung. Obwohl es sich bei einem Panel weiterhin um Beobachtungsstudien handelt (es findet keine Intervention statt), besteht ein wesentliches Ziel darin, der Kausalanalyse so nah wie möglich zu kommen.
Paneldaten werden in Tabellen organisiert, die aus Zeilen und Spalten bestehen. Dabei gibt es zwei wesentliche Formate. Beim Wide-Format entspricht eine Zeile einem Untersuchungsobjekt und die Messwerte der Zeitpunkte werden als Spalten angehängt. Anders beim Long-Format, in dem für jede durchgeführte Beobachtung eine Zeile hinzugefügt wird, also dasselbe Objekt in mehreren Zeilen auftaucht (vgl. Wide-Format und Long-Format). Wird jede Person-Jahr-Kombination als einzelne Beobachtung betrachtet, spricht man von gepoolten Daten.