Hurdle Models in Psychology—A Practical ...
Document type :
Article dans une revue scientifique: Article original
DOI :
Permalink :
Title :
Hurdle Models in Psychology—A Practical Guide for Inflated Data
Author(s) :
Mabire‐Yon, Renaud [Auteur]
Psychologie : Interactions, Temps, Emotions, Cognition (PSITEC) - ULR 4072 [PSITEC]
Psychologie : Interactions, Temps, Emotions, Cognition (PSITEC) - ULR 4072 [PSITEC]
Journal title :
International Journal of Psychology
Abbreviated title :
Int J Psychol
Volume number :
60
Pages :
e70042
Publisher :
Wiley
Publication date :
2025-04-18
ISSN :
1464-066X
English keyword(s) :
count data analysis
data science in psychology
Hurdle model
psychological research
R programming
zero inflation
data science in psychology
Hurdle model
psychological research
R programming
zero inflation
HAL domain(s) :
Sciences cognitives
French abstract :
Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. ...
Show more >Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. Les modèles Hurdle relèvent ce défi en séparant le processus générateur de zéros de la distribution des observations non nulles (ou non limites), permettant ainsi une modélisation plus précise du comportement et des résultats. Dans cet article, je présente les bases conceptuelles des modèles Hurdle et montre comment ils peuvent être appliqués aux données de comptage ainsi qu'à d'autres types de données (par exemple, les variables continues avec un excès de zéros). À l'aide d'un tutoriel étape par étape dans R, j'illustre comment la structure en deux parties du modèle Hurdle, composée d'une composante binaire pour les observations ponctuelles et d'une distribution tronquée pour les valeurs positives (ou supérieures au seuil), fournit des informations nuancées que les modèles plus simples ne permettent souvent pas d'obtenir. Pour illustrer cette approche, j'examine un ensemble de données fictives sur le dépistage du VIH à domicile chez les hommes ayant des relations sexuelles avec des hommes, en soulignant la capacité du modèle Hurdle à traiter simultanément la surdispersion et l'excès de zéros. En mettant l'accent sur l'évaluation itérative des modèles, les contrôles d'adéquation et une série de recommandations pratiques, cet article vise à fournir aux psychologues un cadre analytique robuste qui favorise des interprétations plus approfondies et plus conformes à la théorie des données, ce qui, à terme, favorisera la recherche innovante dans divers domaines de la science psychologique.Show less >
Show more >Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. Les modèles Hurdle relèvent ce défi en séparant le processus générateur de zéros de la distribution des observations non nulles (ou non limites), permettant ainsi une modélisation plus précise du comportement et des résultats. Dans cet article, je présente les bases conceptuelles des modèles Hurdle et montre comment ils peuvent être appliqués aux données de comptage ainsi qu'à d'autres types de données (par exemple, les variables continues avec un excès de zéros). À l'aide d'un tutoriel étape par étape dans R, j'illustre comment la structure en deux parties du modèle Hurdle, composée d'une composante binaire pour les observations ponctuelles et d'une distribution tronquée pour les valeurs positives (ou supérieures au seuil), fournit des informations nuancées que les modèles plus simples ne permettent souvent pas d'obtenir. Pour illustrer cette approche, j'examine un ensemble de données fictives sur le dépistage du VIH à domicile chez les hommes ayant des relations sexuelles avec des hommes, en soulignant la capacité du modèle Hurdle à traiter simultanément la surdispersion et l'excès de zéros. En mettant l'accent sur l'évaluation itérative des modèles, les contrôles d'adéquation et une série de recommandations pratiques, cet article vise à fournir aux psychologues un cadre analytique robuste qui favorise des interprétations plus approfondies et plus conformes à la théorie des données, ce qui, à terme, favorisera la recherche innovante dans divers domaines de la science psychologique.Show less >
English abstract : [en]
In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating ...
Show more >In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating the zero‐generating process from the distribution of nonzero (or non‐boundary) observations, thereby allowing for more accurate modelling of behaviour and outcomes. In this paper, I introduce the conceptual basis of Hurdle models and demonstrate how they can be applied to count data as well as other types of data (e.g., continuous variables with excess zeros). Using a step‐by‐step tutorial in R, I illustrate how the two‐part hurdle structure—consisting of a binary component for point‐mass observations and a truncated distribution for positive (or above‐threshold) values—provides nuanced insights that simpler models often miss. To illustrate this approach, I walk through a fictional dataset examining home‐based HIV testing among men who have sex with men, highlighting the Hurdle model's ability to simultaneously handle overdispersion and excess zeros. Emphasising iterative model evaluation, goodness‐of‐fit checks and a series of practical recommendations, this paper aims to equip psychologists with a robust analytical framework that promotes deeper, theory‐aligned interpretations of data—ultimately fostering innovative research in diverse areas of psychological science.Show less >
Show more >In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating the zero‐generating process from the distribution of nonzero (or non‐boundary) observations, thereby allowing for more accurate modelling of behaviour and outcomes. In this paper, I introduce the conceptual basis of Hurdle models and demonstrate how they can be applied to count data as well as other types of data (e.g., continuous variables with excess zeros). Using a step‐by‐step tutorial in R, I illustrate how the two‐part hurdle structure—consisting of a binary component for point‐mass observations and a truncated distribution for positive (or above‐threshold) values—provides nuanced insights that simpler models often miss. To illustrate this approach, I walk through a fictional dataset examining home‐based HIV testing among men who have sex with men, highlighting the Hurdle model's ability to simultaneously handle overdispersion and excess zeros. Emphasising iterative model evaluation, goodness‐of‐fit checks and a series of practical recommendations, this paper aims to equip psychologists with a robust analytical framework that promotes deeper, theory‐aligned interpretations of data—ultimately fostering innovative research in diverse areas of psychological science.Show less >
Language :
Anglais
Peer reviewed article :
Oui
Audience :
Internationale
Popular science :
Non
Administrative institution(s) :
Université de Lille
Research team(s) :
Justice & Travail
Submission date :
2025-04-22T08:27:44Z
2025-04-22T10:23:16Z
2025-04-22T10:23:16Z
Files
- Hurdle_paper_Mabire-Yon_2025.pdf
- Version éditeur
- Restricted access
- Access the document