Modele de hurdle

Les modèles à obstacles supposent qu`il n`existe qu`un seul processus par lequel un zéro peut être produit, tandis que les modèles à gonflement nul supposent qu`il existe deux processus différents qui peuvent produire un zéro. Exemple: les modèles à obstacles peuvent être motivés par des processus décisionnels séquentiels confrontés à des individus. Vous décidez d`abord si vous avez besoin d`acheter quelque chose, et puis vous décidez de la quantité de ce quelque chose (qui doit être positif). Lorsque vous êtes autorisé (ou peut potentiellement) acheter rien après votre décision d`acheter quelque chose est un exemple d`une situation où le modèle zéro gonflé est approprié. Les zéros peuvent provenir de deux sources: a) aucune décision d`acheter; b) voulait acheter mais a fini par ne rien acheter (par exemple en dehors des stocks). C`est ce qu`on appelle le modèle d`obstacle normal tronqué, qui est proposé dans Cragg (1971). [1] en ajoutant un paramètre de plus et en détachant la décision de montant avec la décision de participation, le modèle peut s`adapter à plus de contextes. Sous cette configuration de modèle, la densité de l`y {displaystyle y} donnée x {displaystyle x} peut être écrite comme: modélisation des données nulles et non nulles avec un modèle, puis modélisation des données non nulles avec une autre. C`est souvent ce qu`on appelle un «modèle de l`obstacle».

Le modèle d`obstacle normal tronqué est généralement estimé par MLE. La fonction log-vraisemblance peut être écrite comme: les modèles de Hurdle sont des formes à deux et trois équations. Les modèles à obstacles concernent des résultats limités. Par exemple, le nombre de personnes qui passent au cinéma est délimité par zéro. En ce sens, les modèles à obstacles ressemblent beaucoup à des modèles Tobit. Ils diffèrent en ce que les modèles d`obstacle fournissent des équations distinctes pour les résultats limités et non bornés, alors que les modèles Tobit utilisent la même équation pour les deux. Les modèles à obstacles supposent que les résultats illimités sont le résultat de la suppression d`un obstacle. Lorsque l`obstacle n`est pas effacé, les résultats limités résultent.

Zeileis, Achim, Christian Kleiber et Simon Jackman 2008. «Modèles de régression pour les données de comptage dans R.» Journal des logiciels statistiques, 27 (8). URL http://www.jstatsoft.org/v27/i08/. Modélisation d`un paramètre d`inflation zéro qui représente la probabilité qu`un zéro donné provient de la distribution principale (disons la distribution binomiale négative) ou est un excès de zéro. En ce qui concerne les modèles à obstacles, voici une citation des avances en mathématiques et modélisation statistique (Arnold, Balmakitte, Sarabia, & Mínguez, 2008): les modèles de haies supposent que les résidus de l`équation (s) de l`obstacle et l`équation de résultat sont non corrélés. Pour que cette hypothèse soit plausible, vous devez généralement supposer que ce sont des personnes différentes qui s`alignent parmi les alternatives possibles. Dans le système de santé chilien, par exemple, les personnes qui achètent le minimum (maximum) sont différentes de celles qui achètent une politique intérieure. Les modèles de Hurdle sont une classe de modèles pour les données de comptage qui aident à gérer les zéros excédentaires et la surdispersion. Pour motiver leur utilisation, examinons certaines données dans R.