Statistiques directionnelles

Les statistiques directionnelles (qui incluent les statistiques circulaires et sphériques) sont une discipline des statistiques qui fournit des outils mathématiques pour traiter les observations angulaires, les directions (vecteurs unités dans Rn) ou les rotations de Rn. Plus généralement, les statistiques directionnelles traitent les observations dans des variétés riemanniennes compactes. Gaile et Burt[1] ont posé les premières bases et outils de cette discipline en 1980.

La forme globale d'une protéine peut être représentée par un groupe de points situés sur la sphère unité. L'image ci-dessus illustre l'histogramme sphérique de ces points pour un ensemble de protéines. Le traitement de telles données est le domaine des statistiques directionnelles[2].

On constate que les outils statistiques usuels ne fonctionnent pas correctement sur des angles : par exemple, il serait absurde que la moyenne d'un angle de 2 degrés et d'un angle de 358 degrés soit un angle de 180 degrés, puisque 0 et 360 degrés correspondent au même angle. Cela illustre la nécessité d'outils statistiques spécifiques à l'étude de données cycliques, comme les angles, mais aussi les périodes répétées (jours de la semaines, mois de l'année, etc.). Le même problème se pose pour des données qui représenteraient des angles dièdres ou des rotations en géométrie 3D, par exemple dans l'étude de la structure des molécules.

  1. Directional Statistics, Concepts and Techniques in Modern Geography, 25, 1980, http://www.qmrg.org.uk/files/2008/11/25-directional-statistics.pdf
  2. Thomas Hamelryck, John T. Kent et Anders Krogh, « Sampling realistic protein conformations using local structural bias », PLOS Computational Biology, vol. 2, no 9,‎ , e131 (PMID 17002495, PMCID 1570370, DOI 10.1371/journal.pcbi.0020131, Bibcode 2006PLSCB...2..131H)

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne