Hurdle Models in Psychology—A Practical ...
Type de document :
Article dans une revue scientifique: Article original
DOI :
URL permanente :
Titre :
Hurdle Models in Psychology—A Practical Guide for Inflated Data
Auteur(s) :
Mabire‐Yon, Renaud [Auteur]
Psychologie : Interactions, Temps, Emotions, Cognition (PSITEC) - ULR 4072 [PSITEC]
Psychologie : Interactions, Temps, Emotions, Cognition (PSITEC) - ULR 4072 [PSITEC]
Titre de la revue :
International Journal of Psychology
Nom court de la revue :
Int J Psychol
Numéro :
60
Pagination :
e70042
Éditeur :
Wiley
Date de publication :
2025-04-18
ISSN :
1464-066X
Mot(s)-clé(s) en anglais :
count data analysis
data science in psychology
Hurdle model
psychological research
R programming
zero inflation
data science in psychology
Hurdle model
psychological research
R programming
zero inflation
Discipline(s) HAL :
Sciences cognitives
Résumé :
Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. ...
Lire la suite >Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. Les modèles Hurdle relèvent ce défi en séparant le processus générateur de zéros de la distribution des observations non nulles (ou non limites), permettant ainsi une modélisation plus précise du comportement et des résultats. Dans cet article, je présente les bases conceptuelles des modèles Hurdle et montre comment ils peuvent être appliqués aux données de comptage ainsi qu'à d'autres types de données (par exemple, les variables continues avec un excès de zéros). À l'aide d'un tutoriel étape par étape dans R, j'illustre comment la structure en deux parties du modèle Hurdle, composée d'une composante binaire pour les observations ponctuelles et d'une distribution tronquée pour les valeurs positives (ou supérieures au seuil), fournit des informations nuancées que les modèles plus simples ne permettent souvent pas d'obtenir. Pour illustrer cette approche, j'examine un ensemble de données fictives sur le dépistage du VIH à domicile chez les hommes ayant des relations sexuelles avec des hommes, en soulignant la capacité du modèle Hurdle à traiter simultanément la surdispersion et l'excès de zéros. En mettant l'accent sur l'évaluation itérative des modèles, les contrôles d'adéquation et une série de recommandations pratiques, cet article vise à fournir aux psychologues un cadre analytique robuste qui favorise des interprétations plus approfondies et plus conformes à la théorie des données, ce qui, à terme, favorisera la recherche innovante dans divers domaines de la science psychologique.Lire moins >
Lire la suite >Dans la recherche psychologique, les variables présentent souvent une inflation ponctuelle (par exemple, de nombreuses réponses nulles ou d'autres regroupements aux limites) qui défie les techniques de régression standard. Les modèles Hurdle relèvent ce défi en séparant le processus générateur de zéros de la distribution des observations non nulles (ou non limites), permettant ainsi une modélisation plus précise du comportement et des résultats. Dans cet article, je présente les bases conceptuelles des modèles Hurdle et montre comment ils peuvent être appliqués aux données de comptage ainsi qu'à d'autres types de données (par exemple, les variables continues avec un excès de zéros). À l'aide d'un tutoriel étape par étape dans R, j'illustre comment la structure en deux parties du modèle Hurdle, composée d'une composante binaire pour les observations ponctuelles et d'une distribution tronquée pour les valeurs positives (ou supérieures au seuil), fournit des informations nuancées que les modèles plus simples ne permettent souvent pas d'obtenir. Pour illustrer cette approche, j'examine un ensemble de données fictives sur le dépistage du VIH à domicile chez les hommes ayant des relations sexuelles avec des hommes, en soulignant la capacité du modèle Hurdle à traiter simultanément la surdispersion et l'excès de zéros. En mettant l'accent sur l'évaluation itérative des modèles, les contrôles d'adéquation et une série de recommandations pratiques, cet article vise à fournir aux psychologues un cadre analytique robuste qui favorise des interprétations plus approfondies et plus conformes à la théorie des données, ce qui, à terme, favorisera la recherche innovante dans divers domaines de la science psychologique.Lire moins >
Résumé en anglais : [en]
In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating ...
Lire la suite >In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating the zero‐generating process from the distribution of nonzero (or non‐boundary) observations, thereby allowing for more accurate modelling of behaviour and outcomes. In this paper, I introduce the conceptual basis of Hurdle models and demonstrate how they can be applied to count data as well as other types of data (e.g., continuous variables with excess zeros). Using a step‐by‐step tutorial in R, I illustrate how the two‐part hurdle structure—consisting of a binary component for point‐mass observations and a truncated distribution for positive (or above‐threshold) values—provides nuanced insights that simpler models often miss. To illustrate this approach, I walk through a fictional dataset examining home‐based HIV testing among men who have sex with men, highlighting the Hurdle model's ability to simultaneously handle overdispersion and excess zeros. Emphasising iterative model evaluation, goodness‐of‐fit checks and a series of practical recommendations, this paper aims to equip psychologists with a robust analytical framework that promotes deeper, theory‐aligned interpretations of data—ultimately fostering innovative research in diverse areas of psychological science.Lire moins >
Lire la suite >In psychological research, variables often exhibit point‐mass inflation—for example, many zero responses or other boundary lumps—that defy standard regression techniques. Hurdle models address this challenge by separating the zero‐generating process from the distribution of nonzero (or non‐boundary) observations, thereby allowing for more accurate modelling of behaviour and outcomes. In this paper, I introduce the conceptual basis of Hurdle models and demonstrate how they can be applied to count data as well as other types of data (e.g., continuous variables with excess zeros). Using a step‐by‐step tutorial in R, I illustrate how the two‐part hurdle structure—consisting of a binary component for point‐mass observations and a truncated distribution for positive (or above‐threshold) values—provides nuanced insights that simpler models often miss. To illustrate this approach, I walk through a fictional dataset examining home‐based HIV testing among men who have sex with men, highlighting the Hurdle model's ability to simultaneously handle overdispersion and excess zeros. Emphasising iterative model evaluation, goodness‐of‐fit checks and a series of practical recommendations, this paper aims to equip psychologists with a robust analytical framework that promotes deeper, theory‐aligned interpretations of data—ultimately fostering innovative research in diverse areas of psychological science.Lire moins >
Langue :
Anglais
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Établissement(s) :
Université de Lille
Équipe(s) de recherche :
Justice & Travail
Date de dépôt :
2025-04-22T08:27:44Z
2025-04-22T10:23:16Z
2025-04-22T10:23:16Z
Fichiers
- Hurdle_paper_Mabire-Yon_2025.pdf
- Version éditeur
- Accès restreint
- Accéder au document