Phi-divergence, disparity a informačně-statistické vzdálenostní míry na pravděpodobnostních prostorech s aplikacemi

V rámci naší podskupiny se zabýváme užitím různých statistických vzdáleností (metrik, pseudo-vzdáleností, phi-divergencí) v teorii odhadu, identifikaci modelu a klasifikace. Především se zabýváme odhady s minimální vzdáleností/ divergencí a to jak parametrickými tak neparametrickými, zkoumáme jejich statistické vlastnosti, jako konzistenci, robustnost a eficienci. Tyto odhady pak používáme k identifikaci neznámého modelu dat, nebo ke klasifikaci dat pocházejících z distribuční směsi skutečného a znečišťujícího rozdělení. Míra znečištění dat typicky není známá, proto je třeba nalézt metody, které jsou robustní, ale zároveň eficientní, tedy dávají dobré výsledky jak pro znečištěná tak pro neznečištěná data. Takto vyvinuté a otestované třídy divergencí jsou následně používány v různých aplikačních oborech, např. v defektoskopii materiálů pro klasifikaci zdrojů akustické emise (mikrotrhlin) nebo v elastické spektroskopii materiálů s hysterezním chováním či v přesné detekci příchodů signálů). Dále v současnosti aplikujeme phi-divergenční metody identifikace a klasifikace na data pocházející z Fermilabu (Batavie, IL, USA) pro proton-antiprotonové srážky, kde řeší úlohu oddělení signálu od fyzikálního backgroundu pro případ rozpadové řady TopQ, SingleTopQuark a „ttbar+lepton+jet“ kanálů (viz grant Ingo II FNAL).

1a
Obr.1a: Hodnoty Rényiho rozlož. divergence
1a
Obr.1b: Po vyhlazení průměrovací maskou

Vedoucí skupiny: Ing. Václav Kůs, PhD.

Studenti:

Ing. Jitka Hrabáková (téma: Odhady pravděpodobnostních hustot, jejich vlastnosti a aplikace, konzistence a robustnost Kolmogorov-Cramérova odhadu, vztahy dominancí mezi statistickými vzdálenostmi)

Ing. Michal Záveský (téma: Vývoj nových phi-divergencí, zjišťování jejich statistických vlastností a jejich použití ve fyzice vysokých energií (FNAL))

Bc. Jan Kučera (téma: Rényiho rozložitelné divergence, PC simulace, optimalizační numerické procedury při hledání statistických odhadů parametrů, statistické testy separačních atributů, FNAL separace pomocí divergenčního rozhodovacího stromu)

Petr Bouř (téma: Komparativní studie divergenčních statistických odhadů vybraných parametrických rozdělení, testování kvality odhadů pro Weibullovo rozdělení)

Spolupracující studenti (aplikace divergencí):

Ing. Zuzana Dvořáková (téma: Aplikace divergencí v akustické emisi a reverzních technikách defektoskopie)

Bc. Jana Papoušková (téma: Divergenční kritéria v numerické identifikaci pravděpodobnostních hustot v Preisach-Mayergoyzově PM prostoru, identifikace struktury elastického materiálu)

Colette Kožená (téma: Identifikace statistických distribucí v Preisach-Mayergoyzově prostoru hysteronů)

Bc. Michaela Sluková (téma: Statistická analýza a klasifikace dat pomocí metod založených na phi-divergencích s aplikacemi v akustické emisi a ve fyzice elementárních částic)

Bc. Jan Máca (téma: detekce příchodů signálů – change point analysis – parametrické i neparametrické algoritmy)

p-hodnoty pro data z D0 Tevatron
Obr.2: p-hodnoty standardních statistických testů pro data z rozpadového kanálu z experimentu D0 Tevatron ve Fermilabu (rozpad „ttbar+lepton+jet“ pro 4+ jety).

Dlouhodobá spolupráce od roku 1998:

Prof. Domingo Morales (Universidad Miguel Hernández de Elche, Centro de Investigación Operativa) – spolupráce v oblasti teorie a aplikací phi-divergencí, statistické odhady parametrů modelu, testy dobré shody

Významné výstupy:

Kůs V., Nonparametric Density Estimates Consistent of the Order of n-1/2 in the L1-norm, Metrika, Vol. 51, 2004.

Kůs V., Morales D. and Vajda I., Extensions of the Parametric Families of Divergences Used in Statistical Inference, Kybernetika, Vol. 44/1, 2008.

Hanousková J., Kůs V., Consistency and robustness of Cramér-von Mises type estimators, Proceedings of the 17th EYSM2011, Lisbon, Portugal, 2011.

Papoušková J., Kůs V., Dos Santos S., PM space Density Identification for Nonlinear Physical Systems: L2 and D-Minimization Methods, POMA (publisher ASA - Acoustical Society of America), Volume 16, pp. 045018 (11 pages).

Frýdlová L., Vajda I., Kůs V., Modified Power Divergence Estimators in Normal Models – Simulation and Comparative Study, Kybernetika, Vol. 48/1, 2012.

Hrabáková, J., Kůs, V., The Consistency and Robustness of Modified Cramér - Von Mises and Kolmogorov - Cramér Estimators. Communication in Statistics - Theory and Method. 2013, vol. 42, no. 20, p. 3665-3677. ISSN 0361-0926.

Hrabáková, J., Kůs, V., Minimum Distance Density Estimates of a Probability Density on the Real Line. Chapter In Essays on Mathematics and Statistics: Volume 3. Athens: Athens Institute for Education and Research, 2013, p. 97-107. ISBN 978-960-9549-34-9.

Štěpánek, M., Franc, J., Kůs, V., Separating signals from backgrounds using Model Based Clustering method. Journal of Physics: Conference Series. 2014 (accepted), ISSN 1742-6588.