Minorize–maximize algorithm for the generalized odds rate model for clustered current status data
Current status data are widely used in epidemiology and public health, where the only observable information is the random inspection time and the event status at inspection. This article presents a unified methodology to analyze such complex data subject to clustering. Given the random clustering e...
Saved in:
Published in | Canadian journal of statistics Vol. 51; no. 4; pp. 1150 - 1170 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | English |
Published |
Ottawa
Wiley Subscription Services, Inc
01.12.2023
|
Subjects | |
Online Access | Get full text |
ISSN | 0319-5724 1708-945X |
DOI | 10.1002/cjs.11733 |
Cover
Summary: | Current status data are widely used in epidemiology and public health, where the only observable information is the random inspection time and the event status at inspection. This article presents a unified methodology to analyze such complex data subject to clustering. Given the random clustering effect, the time to event is assumed to follow a semiparametric generalized odds rate (GOR) model. The nonparametric component of the GOR model is approximated via penalized splines, with a set of knot points that increase with the sample size. The within‐subject correlation is accounted for by a random (frailty) effect. For estimation, a novel MM algorithm is developed that allows the separation of the parametric and nonparametric components of the model. This separation makes the problem conducive to applying the Newton–Raphson algorithm that quickly returns the roots. The work is accompanied by a complexity analysis of the algorithm, a rigorous asymptotic proof, and the related semiparametric efficiency of the proposed methodology. The finite sample performance of the proposed method is assessed via simulation studies. Furthermore, the proposed methodology is illustrated via real data analysis on periodontal disease studies accompanied by diagnostic checks to identify influential observations.
Les données de statut présent sont omniprésentes en épidémiologie et en santé publique, où la seule information observable est le temps d'inspection aléatoire et l'état de l'événement à l'inspection. Cet article présente une méthodologie unifiée pour analyser ces données complexes souvent regroupées en grappes. Compte tenu de l'effet de grappe aléatoire, les auteurs supposent que les durées de vie suivent un modèle à rapports de cotes généralisé (GOR) semi‐paramétrique. L'estimation de la composante non paramétrique du modèle GOR est basée sur des splines pénalisées dont le nombre de nœuds croît avec la taille de l'échantillon. La corrélation intrasujets est expliquée par un effet aléatoire (fragilité), alors que les composantes paramétriques et non paramétriques du modèle sont estimées séparément, et ce, grâce à un nouvel algorithme MM développé dans le cadre du présent travail. Cette séparation rend le problème propice à l'application de l'algorithme Newton‐Raphson qui converge rapidement vers les solutions recherchées. En plus d'une analyse de la complexité de l'algorithme proposé, les auteurs établissent les propriétés clés de leur méthodologie, notamment la convergence asymptotique et l'efficacité semi‐paramétrique. Enfin, ils présentent des études de simulation numériques pour évaluer la performance de cette méthode semi‐paramétrique, ainsi qu'une illustration pratique sur des données réelles issues d'études de maladies parodontales, accompagnée de tests diagnostiques pour dépister des observations influentes. |
---|---|
Bibliography: | ObjectType-Article-1 SourceType-Scholarly Journals-1 ObjectType-Feature-2 content type line 14 |
ISSN: | 0319-5724 1708-945X |
DOI: | 10.1002/cjs.11733 |