Doctoral thesis (Dissertations and theses)
Statistical methods for analysing serum protein electrophoretic data in External Quality Assessment (EQA) programmes
Zhang, Lixin
2010
 

Files


Full Text
PhThesis-LixinZHANG-2010.pdf
Author postprint (2.5 MB)
Request a copy

All documents in ORBi are protected by a user license.

Send to



Details



Keywords :
Quality control; contrôle de qualité; electrophoresis; électrophorèse; outlying data profiles; profils hors-limites; clinical laboratory performance; performance analytique des laboratoires; robust statistics; statistique robuste; multivariate coefficient of variation; coefficient de variation multivarié
Abstract :
[en] Les examens de laboratoire jouent un rôle essentiel dans la pratique médicale. Ils sont utilisés à des fins diagnostique, pronostique, thérapeutique ou encore pour dépister des maladies spécifiques dans des populations présumées en bonne santé (Tietz, 1986). Quotidiennement, les laboratoires de biologie clinique réalisent des millions de tests fournissant autant de données à interpréter. Les responsables des soins de santé ont toujours été préoccupés par la qualité globale du travail réalisé dans les laboratoires. En dépit de procédures de contrôle de qualité interne rigoureuses, les résultats obtenus pour un même échantillon dans deux laboratoires peuvent occasionnellement différer de façon notoire. Il serait inacceptable cependant qu’un résultat d’un test biologique soit considéré comme « normal » dans un laboratoire et « anormal » dans l’autre.Les programmes d’Evaluation Externe de la Qualité (EEQ) ont précisément comme objectif de contrôler la performance analytique des laboratoires de biologie clinique à une grande échelle et généralement par le biais d’un organisme externe. Le but de l’EEQ est de s’assurer que les résultats des tests soient compatibles quel que soit le laboratoire qui réalise les analyses, en d’autres termes de garantir la comparabilité des laboratoires et par là-même d’administrer les meilleurs soins aux patients (Libeer, 1993). Les protocoles EEQ consistent à organiser des enquêtes dans lesquelles les laboratoires participants doivent réaliser des analyses sur un même échantillon contrôle comme s’il s’agissait d’analyses de routine. Il faut ensuite renvoyer les résultats de ces analyses au centre EEQ avec des informations détaillées sur les techniques de dosage utilisées. Les résultats sont alors soumis à une analyse statistique. En réalité, l’analyse statistique poursuit trois objectifs : (1) obtenir une estimation robuste de la concentration du constituant (moyenne) dans l’échantillon contrôle et de la variabilité entre les laboratoires (écart-type), une estimation robuste étant nécessaire car les résultats EEQ contiennent souvent des valeurs aberrantes qui peuvent sérieusement affecter la moyenne et de l’écart-type ; (2) évaluer la qualité des laboratoires en mettant en évidence les résultats « hors-limites » et les laboratoires « peu performants » et ce, à court et à long termes ; (3) évaluer et comparer la précision analytique des techniques/équipements utilisés par les participants (Albert, 1997). Depuis plusieurs dizaines d’années, des programmes EEQ ont été mis en place dans de nombreux pays et ils contrôlent la plupart des analyses de biologie clinique classiques comme le glucose, le cholestérol ou le calcium, ou encore les enzymes et les hormones.Ce travail a débuté lorsque l’électrophorèse de protéines fut introduite dans le panel des analyses de laboratoire soumises à l’EEQ. Contrairement aux autres tests contrôlés jusqu’alors, l’électrophorèse de protéines fournit non pas une valeur mais cinq fractions, respectivement, l’albumine, les globulines alpha1, alpha2, beta; et &#61543;, dont la somme fait 100% et dont l’interprétation doit se faire globalement. En d’autres termes, les données électrophorétiques obtenues dans l’EEQ doivent être analysées par des méthodes de la statistique multivariée (Zhang et al, 2008). Ceci nécessite l’adaptation à l’environnement EEQ de méthodes multivariées existantes (telles qu’on les trouve dans les ouvrages de référence) ou le développement d’approches nouvelles. Dans cette thèse, nous nous sommes fixé comme but d’apporter une solution théorique et pratique au problème de l’analyse et de l’interprétation des résultats d’électrophorèses dans le domaine de l’Evaluation Externe de la Qualité.Dans l’introduction de ce travail, un bref rappel est fait des protocoles EEQ et de leur mise en pratique notamment en ayant recours à l’Internet. Les méthodes univariées de statistique robuste permettant d’estimer la moyenne et l’écart-type des résultats EEQ sont décrites et la notion de valeur « hors-limites » est définie. Ceci permet d’apprécier la qualité d’un laboratoire par rapport à ses pairs sur base du résultat qu’il a fourni. Le concept de coefficient de variation (CV) est aussi présenté comme un moyen de mesurer et de comparer la reproductibilité analytique des techniques de laboratoire. Finalement, on rappelle quelques notions relatives aux électrophorèses de protéines, leur utilité clinique et les méthodes de dosage utilisées. Les bases de données EEQ qui servent à illustrer la méthodologie statistique développée dans ce travail sont décrites en détail. Elles proviennent principalement des enquêtes de l’Evaluation Externe de la Qualité réalisées entre 2004 et 2008 en France et en Belgique.La première partie de cette thèse concerne le problème de l’évaluation de la performance des laboratoires pour le dosage de l’électrophorèse de protéines. La façon la plus simple consiste à appliquer les méthodes univariées classiques à chaque fraction de l’électrophorèse. Cette façon de procéder cependant ignore que les fractions doivent être interprétées globalement car elles sont corrélées. De plus, elles sont linéairement dépendantes (car leur somme est égale à 100%), ce qui conduit à une matrice de variances-covariances singulière et donc non inversible. La première approche multivariée que nous proposons vise à retirer une des cinq fractions et ainsi éviter le problème de singularité, ensuite à obtenir une estimation robuste du vecteur moyen et de la matrice de variances-covariances par la technique du déterminant de covariance minimum (MCD) publiée par Rousseuw et Van Driessen (1999). On utilise alors la distance de Mahalanobis pour identifier les profils électrophorétiques « hors-limites » et détecter les laboratoires dont la qualité est insatisfaisante (Zhang et al. 2008). Appliquée aux bases de données EEQ, cette méthode simple s’avère ne pas être optimale car elle donne des corrélations peu fiables et décèle trop de laboratoires « hors-limites ». C’est la raison pour laquelle, une approche nouvelle est proposée dans laquelle une transformation log-ratio (Egozcue et al. 2003) est appliquée aux profils électrophorétiques avant de les analyser statistiquement. Cette méthode transforme les cinq fractions électrophorétiques en quatre variables indépendantes et sans dimension. La technique MCD est alors appliquée pour obtenir des estimations robustes du vecteur moyen et de la matrice de dispersion. Les estimations sont utilisées pour calculer la distance de Mahalanobis et mettre en lumière les laboratoires « hors-limites ». Appliquée aux bases de données EEQ, cette seconde approche est meilleure que la première, non seulement d’un point de vue théorique mais aussi pratique, en détectant un nombre plus raisonnable de laboratoires peu performants. Des méthodes de représentations graphiques des profils électrophorétiques sont aussi proposées au moyen du « MCD z-score plot » ou du « star plot » obtenu à partir de l’analyse en composantes principales (ACP) robuste. La seconde partie de la thèse s’attache à l’évaluation et à la comparaison de la précision analytique des techniques de dosage d’électrophorèses utilisées par les laboratoires participants à l’EEQ. Ceci nous a conduit à rechercher des méthodes d’extension du coefficient de variation (CV) classique au cas multivariée. Les coefficients de variation multivariés publiés dans la littérature sont passés en revue, en ce compris ceux de Reyment (1960) et de Van Valen (1974, 2005). Reyment fut le premier à proposer une définition du CV multivarié et à donner une formule permettant de calculer l'erreur type de l'estimation. Van Valen suggéra une définition plus générale car applicable en toute circonstances mais qui malheureusement ne tient pas compte explicitement des corrélations entre les variables. Par ailleurs, nous avons exploité une idée de Voinov et Nikulin (1996) pour développer un CV multivarié basée sur la distance de Mahalanobis et qui est invariant par rapport à l’échelle utilisée. Nous l’avons appliqué aux données de l’EEQ franco-belge de 2004 et avons ainsi pu classer les techniques électrophorétiques par ordre décroissant de précision analytique (Zhang et al. 2010). Malheureusement, cette approche comme celle du CV de Reyment requiert une matrice de covariance non singulière et n’est donc pas applicable pour des groupes d’effectif faible (n < 5) de laboratoires utilisant la même technique. Nous avons dès lors proposé une définition originale et tout à fait générale du CV multivarié, notée CVm (Albert et Zhang, 2010). Cette nouvelle formulation jouit de propriétés intéressantes; elle est simple et facile à calculer, ne requiert aucune inversion de matrice (contrairement aux autres techniques) mais uniquement le calcul de formes quadratiques. On n’impose aucune restriction sur le nombre d’observations ni sur le nombre de variables du problème. Nous avons appliqué cette méthode CVm aux bases de données EEQ d’électrophorèses et nous avons pu démontrer en pratique sa grande flexibilité. Elle nous a permis de classer toutes les techniques électrophorétiques même pour des groupes de participants de petite taille (n = 2) et de mettre en évidence les plus précises, comme celle de l’électrophorèse capillaire de zone (CZE) complètement automatisée. Nous avons aussi appliqué la nouvelle méthode à des données de cytométrie de flux récoltées dans le cadre d’une enquête EEQ réalisée en Belgique en 2010 ainsi qu’à un échantillon de données de « microarray » publié dans la littérature (Golub et al. 1999), confirmant ainsi son applicabilité à des domaines variés. Enfin, nous présentons quelques développements théoriques personnels sur le CV de Reyment afin de corriger la définition initiale, entachée à notre sens d’une erreur de dimension, son estimation ainsi que la formule de l’erreur type. En résumé, la méthodologie statistique développée dans ce travail propose une solution complète à l’analyse des données électrophorétiques ou de tout autre profil de tests de laboratoire récoltés dans le cadre d’enquêtes de l’Evaluation Externe de la Qualité.
Disciplines :
Public health, health care sciences & services
Author, co-author :
Zhang, Lixin ;  Université de Liège - ULiège > MESP - Médecine - Département des sciences de la santé publique
Language :
English
Title :
Statistical methods for analysing serum protein electrophoretic data in External Quality Assessment (EQA) programmes
Defense date :
03 December 2010
Institution :
Université de Liège
Degree :
Doctorat en sciences médicales
Promotor :
ALBERT, Adelin
President :
CHAPELLE, Jean-Paul
Jury member :
HAESBROECK, Gentiane
VAN CAMPENHOUT, Christel
DE MOOR, Georges
LIBEER, Jean-Claude
HENNY, Joseph
Available on ORBi :
since 27 March 2024

Statistics


Number of views
1 (0 by ULiège)
Number of downloads
0 (0 by ULiège)

Bibliography


Similar publications



Contact ORBi