Mesures en dentisterie

Aller au contenu
Aller à la navigation

Les cahiers de prothèse n° 115 du 01/09/2001

DENTISTERIE FONDÉE SUR DES PREUVES

Auteur(s) : Alan B. Carr * Glen P. McGivney **

Fonctions :
* DDS, MS - Professor
School of Dentistry
Ohio State University
Columbus, Ohio (États-Unis)
** DDS - Rédacteur
The Journal of Prosthetic dentistry
Mosby
11830 Westline Industrial Drive
Saint-Louis Missouri 63146 (États-Unis)

Scénario clinique

Vous avez travaillé avec une nouvelle hygiéniste durant les 6 derniers mois et avez étendu ses responsabilités de façon qu'elle ait un rôle plus actif dans le dépistage des patients qui ont besoin de traitement. Bien que séduit par l'opportunité de croissance de votre exercice que cela représente, votre opinion diverge au sujet des traitements nécessaires. Vous avez l'impression qu'elle suggère régulièrement des options de traitements non appropriées et plus de traitements que nécessaire. Vous en parlez avec votre associé qui, lui, vous dit que son expérience avec la nouvelle hygiéniste est contraire à la vôtre, qu'elle ne suggère pas assez de traitements.

Ces différences d'opinions posant un problème, vous décidez de suivre de plus près cette situation pendant les mois suivants. Durant cette période, vous découvrez que les dents sur lesquelles vos opinions divergent sont des dents présentant des restaurations existantes, et vous vous demandez si ceci ne serait pas un dénominateur commun. Au cours de cette période d'observation, un article paraît dans un hebdomadaire national, décrivant la variabilité des traitements décidés par différents dentistes. Cet article a créé de sérieux remous dans l'opinion de votre localité et le journal local vous a demandé de le commenter. Vous êtes ainsi face à un problème similaire à celui rencontré dans votre cabinet, sauf que vous devez répondre désormais à la communauté locale au nom de votre profession. Vous décidez alors de faire une recherche sur les « variations » associées aux « diagnostics et plans de traitements » en dentisterie. Vous aimeriez, en particulier, être capable de répondre sur la fréquence des désaccords cliniques, leurs raisons et leurs caractéristiques et comment réduire le degré de désaccord. De plus, il vous apparaît évident que pouvoir répondre à ces questions vous aidera aussi à résoudre le problème au sein de votre cabinet.

Vous passez donc un certain temps sur votre ordinateur afin de faire une recherche dans la littérature avec les mots clés suivants : dentisterie, antécédents dentaires et examen physique, examen dentaire, diagnostic, plan de traitement, modèles de traitements, variabilité de l'examinateur et fiabilité de l'examinateur. Cette recherche vous a permis de trouver 12 articles correspondant aux mots clés. Cependant, la lecture des résumés ne vous a permis de sélectionner qu'un seul article, « Harmonie des recommandations des dentistes en dentisterie restauratrice » de Bader et Shugars [¹], qui pourrait être utile pour répondre à vos questions, vous préparer à répondre à la presse et, en même temps, résoudre le problème avec votre hygiéniste pour ce qui est des besoins de traitements des patients dont elle fait les bilans.

Résumé

À partir d'un cas concret de gestion clinique posé à un praticien, cet article aborde les principes de base associés à la prise de décision reposant sur des mesures. Les différents types d'échelle de mesure sont définis et hiérarchisés. La mesure doit avoir une relation établie avec la question posée et ne présenter aucune erreur. La validité des mesures doit reposer sur la sélection rigoureuse des informations ou des substituts reconnus comme des indicateurs valables de résultats. Pour le lecteur, le contrôle des erreurs systématiques et aléatoires devrait être explicitement décrits dans tout travail de recherche. Pour l'exemple choisi, consistant à déterminer quels sont les traitements les mieux adaptés à un patient donné, il y a lieu de considérer les mesures qui ont un impact sur les dimensions du soin perçu par ce patient.

Summary

Measurement in dentistry

From a concrete case of clinical management, this article discusses the basic principles associated with making clinical decisions based on measurments. Different measurement scales are outlined and ranked. The measure must have some established relevance to the initial question and must be error free. The validity of the measures must lie upon a strict selection of the informations or of surrogates taht have been established as valid indicators of the outcomes. For the reader, controls made for both systematic and random measurement errors should be explicitly described as a part of every research effort. For the chosen example which consists in determining which are the most adequate treatments for a patient, we must consider the measures that impact patient-perceived dimensions of care.

Key words

errors, measurement scales, reliability, results, validity

Les soignants sont entraînés à évaluer l'état de santé des patients et à prescrire des plans de traitement successifs en vue de la restauration ou du maintien de la santé de ceux-ci. Les observations issues des examens cliniques et de laboratoire sont utilisées en vue du diagnostic, de la prescription d'un traitement et du suivi de la réponse du patient. Ces observations fournissent les caractéristiques requises pour la comparaison avec les standards de santé ou les observations antérieures. Les règles et directives, qui permettent d'établir un ordre qualitatif et quantitatif aux caractéristiques enregistrées, sont présentées et discutées comme des principes de mesure. En pratique et dans la littérature médicale/dentaire, la mesure des signes cliniques et des symptômes procure la base pour une analyse de toute condition clinique ou de son report dans la littérature. Les méthodes utilisées pour obtenir ces mesures peuvent être simples ou sophistiquées, mais cette distinction ne présage pas d'une protection contre les erreurs associées aux mesures obtenues [², ³].

Cet article de la série sur la dentisterie fondée sur des preuves décrit des principes de base associés à la prise de décisions cliniques reposant sur des mesures. Le lecteur est invité à revoir ou se référer au glossaire publié dans l'article d'introduction de cette série.

Observation clinique : mesures et différences

Les différences d'observations cliniques, de diagnostics et de décisions de gestion sont courantes en médecine et dentisterie : elles peuvent conduire à un échec dans la délivrance des meilleurs soins aux patients [⁴]. Par exemple, un diagnostic incorrect sur une articulation temporo-mandibulaire ou sur un état pulpaire peut aboutir à un acte chirurgical ou un traitement restaurateur qui aura un effet négatif sur le bien-être du patient.

Les désaccords cliniques apparaissent de deux façons. Une décision clinique fondée sur un signe ou un symptôme peut se révéler mauvaise lorsqu'elle est confrontée à une preuve plus valable, telle qu'une biopsie, une radiographie ou un examen arthroscopique. De même, des décisions cliniques peuvent se révéler illogiques lorsque l'examen du même patient par un autre praticien (ou une seconde fois par le même praticien) montre un désaccord. Le premier exemple de différence est une question de validité alors que le second est un problème de fiabilité. Dans les deux situations, une différence est apparue. Ces mêmes phénomènes existent dans les domaines de la pratique clinique et de la recherche et, si elles ne sont pas comprises et contrôlées, de telles différences peuvent rendre les meilleures intentions vaines. Les décisions de gestion des patients sont améliorées quand les erreurs et les variations, qui peuvent être associées à des mesures objectives, sont comprises et lorsque des méthodes d'amélioration de la fiabilité des mesures sont couramment prises.

Les mesures et les désaccords cliniques sont présentés conjointement car ils ont en commun des considérations qui s'appliquent à la fois aux soins du patient et à la recherche. Les mesures cliniques comprennent des observations cliniques, avec ou sans instrumentation spécifique, qui sont ensuite utilisées pour prendre une décision. Les variations de ces observations, parce qu'elles sont en rapport avec les soins du patient, sont considérées comme des désaccords cliniques. Ils comprennent les différences en termes de diagnostic, de pronostic et de thérapeutique.

Webster définit une mesure comme, « l'étendue, les dimensions et le volume de quelque chose, notamment lorsqu'elle est déterminée par un standard ». Les attributs mesurables peuvent être classés dans un certain nombre d'échelles de mesure. Habituellement 4 types d'échelles sont reconnus [⁴] et peuvent être mémorisés grâce au sigle « NOIR » : nominale, ordinale, intervalle et ratio. Les échelles nominales consistent en des nombres ou des noms, utilisés pour représenter un arrangement de classes à la fois exclusives et exhaustives, auxquelles une attribution est faite (mâle/femelle, race, groupe sanguin, prothèse). Les échelles ordinales sont comme les échelles nominales, à la différence près que les classes peuvent être ordonnées ou hiérarchisées. Ce classement détermine une direction, mais ne tient pas compte des écarts entre les catégories, le long de l'échelle, comme par exemple les échelles psychosociales (approuve fortement, approuve, désapprouve, désapprouve fortement ). Les échelles d'intervalles sont similaires aux échelles ordinales avec, en plus, le fait que les écarts entre les classes adjacentes sont égaux et, conceptuellement, que ces échelles sont infinies, sans début ni fin (par exemple, la température, le calendrier ou le temps). Les échelles de ratios sont identiques aux échelles d'intervalles avec, en plus, l'existence d'un point-zéro et sans valeur négative (par exemple, le poids, la pression sanguine, les surfaces cariées, les consultations dentaires) et autorisent ainsi des jugements sur les différences d'amplitude (par exemple, 2 à 3 fois plus large). Les différences entre ces échelles sont importantes par la manière dont les mesures sont analysées et résumées.

Selon les éléments ci-dessus, une mesure résulte donc de règles pour attribuer des classifications ou des nombres à des attributs observables [⁴]. Ces attributs comprennent des qualités et éléments distinctifs comme les propriétés, les caractéristiques, les dimensions ou les comportements. Les variables quantitatives, les plus souvent et facilement prises en compte lorsque l'on parle de mesures, sont des variables qui sont mesurées à l'aide d'un instrument physique ou de moyens objectifs comme le décompte. Les sous-classes pour les variables quantitatives sont identifiées par des nombres significatifs et classées par des échelles d'intervalles ou de ratios. Les variables quantitatives peuvent être discontinues, c'est-à-dire qu'elles prennent un ensemble de valeurs finies ou dénombrables, comme les profondeurs de poches ou les valeurs de Périotest. Elles peuvent aussi être continues, c'est-à-dire qu'elles prennent alors un ensemble infini ou indénombrable de valeurs, par exemple, le nombre de consultations pour une large population des patients. Les variables qualitatives, fréquemment utilisées dans les évaluations cliniques, sont mesurées en affectant les observations ou les sujets à des sous-classes à la fois exclusives et exhaustives. Ces sous-classes sont identifiées par des noms ou des nombres qui peuvent être numériquement non significatifs ou, parfois, indiquer un ordre des sous-classes. Les échelles nominales, comme les échelles ordinales, sont considérées comme qualitatives.

Mesures cliniques et réflexions sur la recherche

L'intérêt principal de cette série d'articles sur les preuves est d'informer les cliniciens, afin qu'ils puissent choisir et utiliser les meilleures preuves possibles, en vue de leurs décisions cliniques. En tant que cliniciens, nous utilisons une variété d'échelles de mesures pour prendre nos décisions. Ces mêmes échelles de mesure sont fréquemment utilisées dans la littérature pour déterminer d'importantes différences de diagnostic, de pronostic et de thérapeutique. Comment pouvons-nous décider quelles mesures sont les plus importantes à considérer en dentisterie ? Comme nous l'avons mentionné précédemment [⁵], le centre d'intérêt de votre question clinique donne des indices sur le fait que les mesures sont importantes pour répondre à votre question, mais aussi pour les chercheurs qui étudient les questions cliniques.

La formulation correcte d'une question de recherche est fondamentale pour la mesure car le chercheur doit choisir les meilleurs moyens (et donc mesures) pour répondre à cette question. Dans un rapport de recherche sous forme écrite, le paragraphe d'introduction présente le problème qui concerne le clinicien et apporte l'information de départ, à partir de recherches antérieures sur le sujet, afin d'aider à se centrer sur la question de la recherche. Une justification claire et une définition des attributs intéressants sont essentielles au lecteur pour savoir ce qui va être mesuré et pourquoi une telle mesure est utile à la question considérée. Décrire l'attribut qui doit être mesuré est un préalable indispensable pour savoir comment il doit être mesuré. La technique de mesure est décrite dans la méthode et consiste en des techniques variées de collection des données lors de l'étude (« attribution de nombres »). Les « règles » lors de la définition de la méthode de mesure spécifient les conditions d'une description explicite de la méthode. Si la mesure est utilisée pour comparer des personnes, il est impératif que les règles soient non ambiguës et utilisables par différents observateurs.

Résultats en dentisterie

On peut souvent observer que différents rapports de recherche, concernant des questions cliniques similaires, utilisent différentes méthodes de mesures des résultats. Les paramètres cliniques valables, choisis pour la mesure des résultats des soins, devraient présenter des niveaux acceptables de fiabilité et de sensibilité et être cliniquement significatifs [⁶].

Dans la tentative de réponse à la question : « Quelle mesure est importante pour le processus spécifique de prise de décision ? », il est important de reconnaître que la mesure doit avoir une relation établie avec le problème initial du patient. Il est possible d'avoir une mesure très précise qui n'est toutefois pas en relation avec le problème actuel du patient et, par conséquent, n'apporte rien dans la réponse aux questions cliniques. Pour comprendre pourquoi une mesure devrait être en relation avec le problème du patient, il est utile de considérer la différence entre les mesures et les résultats [⁷].

Les résultats, qui sont l'aboutissement final d'un processus, représentent ce qui affecte le patient et ce qui est utilisé pour juger de l'adéquation du « soin » délivré. Les mesures (comme la profondeur de poche ou la perte osseuse) sont utiles si elles sont de bonnes représentations ou de bons substituts d'un résultat qui est important pour le patient [⁸]. Ceci peut représenter un dilemme, car les corrélations entre les mesures de processus médicaux ou dentaires et les résultats du patient sont souvent faibles [⁹, ¹⁰]. Spilker décrit une relation des résultats au sein d'une hiérarchie dans laquelle un indice général de bien-être, défini comme la qualité de vie (QDV), est l'ultime critère de jugement. Ce jugement de la QDV est réalisé en utilisant de larges notions d'expériences de vie, incluant des domaines physiques, psychologiques, économiques et sociaux. Chacun de ces domaines comprend différentes composantes qui peuvent inclure des sous-mesures de chaque domaine (par exemple, pour les domaines physiques : mastication, déglutition et phonation) [¹¹].

La maladie ou les conditions de mauvaise santé diminuent le bien-être du patient. C'est par désir de rétablir leur bien-être que les patients sont poussés à réclamer certaines formes de soins de santé (^{fig. 1}).

Un argument fort en faveur de ce classement fondé sur la QDV est le fait que les patients sont les meilleurs juges de l'impact des soins de santé sur leur QDV. Ceci vient du fait que les cliniciens jugent plus la réponse clinique que la façon dont la réponse clinique est perçue par les valeurs et convictions du patient pour déterminer leur propre estimation de la QDV. C'est ce jugement final de la « valeur de perception des soins » qui détermine en fin de compte quels facteurs de traitement (par exemple les bénéfices contre les risques) s'additionnent, et si le changement global représente un effet négatif ou positif sur la QDV [¹¹]. Ceci est la base de la « force » relationnelle, associée à la validité des caractéristiques des résultats, au sein d'un tel modèle de classement.

Ce concept de classement des résultats, par la mesure finale de la QDV du patient, est spécialement important pour comprendre les maladies qui ne menacent pas la vie, les traitements qui sont souvent choisis et où les options de traitement varient selon les méthodes utilisées (par exemple, chirurgical contre non-chirurgical). Le modèle de classement des résultats donne un moyen de relater une variété de mesures cliniques (aussi bien processus que résultats) référencées pour leurs impact sur la QDV du patient. Par exemple, le concept de hiérarchie contribue lui-même à comprendre comment l'état de dents absentes concerne le patient dans son ensemble et quelles mesures peuvent être utilisées pour juger d'un soin efficace (^{fig. 1}) [¹²]. Le poids associé à la perte de la dent est ce qui pousse le patient à demander un soin. La fin du traitement (c'est-à-dire l'objectif du traitement) représente une réduction de l'influence de la dent absente pour le patient en question.

Toute recherche qui n'est pas directement associée à un soin clinique (par exemple, les études de bench-top communes en prothèse) est considérée comme importante seulement si elle peut avoir un impact sur les caractéristiques d'un soin clinique propre à un patient. Les discussions sur les résultats cliniques des traitements dirigés vers la réduction de l'influence de la perte d'une dent ont souligné que plusieurs facteurs interviennent sur la perception par le patient du « temps de retraitement » pour toutes les prothèses. De tels résultats sont utiles parce qu'ils permettent une comparaison croisée entre les traitements et autorisent l'évaluation des sous-mesures qui ont de l'impact au niveau du patient [¹¹]. Pour les actes « techniques » dentaires courants, l'association de la qualité technique avec le temps de retraitement est importante à établir et à comprendre. Mais ne pas reconnaître l'importance primordiale des résultats perçus par le patient conduit l'activité de recherche à manquer le bénéfice potentiel de son impact (ou à perdre son impact) sur le soin de santé buccale. Cela perturbe le lecteur qui recherche des réponses aux problèmes liés au bénéfice du patient. Ce dilemme est une raison pour laquelle de nombreux journaux réclament aux auteurs d'établir des faits décrivant la signification clinique des résultats de la recherche.

Erreur de mesure : pourquoi est-ce important ?

Une mesure est précise si elle reflète la « vraie » valeur de l'attribut mesuré. La « véracité de la mesure » est aussi considérée comme « validité » et non seulement représente le vrai état de l'attribut mesuré, exempt d'erreur de mesure, mais englobe également des considérations sur ce qui est mesuré et sur la méthode de mesure. Il est possible qu'une mesure, faite sans erreur de mesure, soit inappropriée à l'usage attendu, car ce qui est en réalité mesuré n'est pas ce qu'il était prévu. Un exemple de ce type de mesure inappropriée est l'utilisation de révélateurs de plaque pour estimer la quantité de plaque, alors que l'on sait qu'ils colorent aussi la pellicule acquise [¹³]. Il a également été suggéré que de nombreux points de repère céphalométriques ont été déterminés plus pour la facilité d'identification et de reproductibilité que pour la représentation valable de l'anatomie réelle [¹⁴].

Une mesure est imprécise à partir du moment où elle dévie de la « vérité ». La variation de la mesure d'un attribut implique qu'il existe de vraies différences parmi les attributs ou entre les sujets, ou bien qu'il y a une erreur aléatoire associée aux mesures répétées. La précision peut être représentée par l'équation suivante, qui illustre le fait que l'utilité d'une mesure dépend de l'étendue selon laquelle les 2 types d'erreurs masquent la vraie valeur :

Valeur mesurée = Vraie valeur

+ Erreur systématique (Biais)

+ Erreur aléatoire (Bruit)

L'erreur aléatoire, aussi appelée bruit ou variation aléatoire, est la variation au sein d'un échantillon que l'on peut s'attendre à voir par hasard. Ce type d'erreur apparaît quand les mesures répétées du même attribut sous diverses conditions diffèrent, mais qu'il n'y a pas de déviation systématique de l'état vrai de l'attribut. Une telle erreur est toujours présente et une large taille de l'échantillon minimise son effet. L'erreur systématique est une erreur qui altère systématiquement chaque observation faite par tel observateur ou par tel instrument, elle est considérée comme un type de biais. Elle peut résulter d'une machine calibrée selon un standard erroné, ou des résultats quand les observateurs qui les collectent ne comprennent pas les attributs du traitement. De par le fait que cette erreur crée une différence entre ce que l'on désire mesurer et ce qui est réellement mesuré cette forme d'erreur de mesure altère non seulement la précision mais aussi la validité de l'étude. Une erreur de mesure peut toutefois être considérée comme le taux selon lequel une mesure est incorrecte, de par l'influence de plusieurs problèmes potentiels inhérents au processus de mesure.

Dans cette illustration, les 2 séries de mesures répétées suivantes sont des estimations d'un échantillon d'une large population de patients. Si la population entière pouvait être mesurée, la moyenne serait représentée par « A » et « B » :

Comme illustré ici, les mesures répétées « A » montrent une relativement grande erreur aléatoire, qui peut présumer d'une faible précision, comparativement aux mesures « B ». Cependant « A » est (aléatoirement) centrée autour de la « vérité ». Les mesures répétées « B » présentent une relativement faible erreur aléatoire (plus précise que « A »), mais elles sont biaisées dans la mesure où leur valeur moyenne n'est pas égale à la vraie valeur. La moyenne estimée obtenue par un échantillon suffisamment large, avec les mesures répétées « A », est plus utile, parce que les décisions fondées sur ces résultats procurent plus de bénéfices que d'inconvénients si elles représentent un vrai échantillon de l'attribut. Au contraire, une moyenne estimée à partir des mesures répétées « B » pourrait être dommageable, parce que l'estimation est imprécise et ne représente pas la vraie estimation de l'attribut. Les décisions fondées sur une analyse utilisant cette mesure imprécise peuvent faire en fait plus de mal que de bien.

Les erreurs de mesure peuvent être classées et évaluées en considérant la source d'erreur chez l'examinateur, l'examiné ou l'examen [¹⁵].

Lorsqu'une erreur est associée à des mesures répétées réalisées par le même examinateur, elle est appelée erreur intra-examinateur ou intra-observateur. Entre observateurs ou examinateurs, il existe des variations biologiques des sens et des variations de perception, de connaissances et de motivation qui peuvent influencer l'examen physique. Une erreur associée à des mesures du même attribut réalisées par différents examinateurs est appelée erreur interexaminateur ou inter-observateur. Les désaccords entre examinateurs peuvent être influencés par les attentes initiales, même lorsque des outils sophistiqués de diagnostic sont utilisés, et par une interprétation des classifications des diagnostics pour les catégories qui se superposent ou de leurs « points de rupture » qui est différente selon les cliniciens.

Parfois, à cause du sujet examiné, les résultats peuvent être modifiés d'une façon uniforme ou systématique (par exemple, par les horaires ou la température ambiante) alors que, d'autres fois, cette influence est non-systématique (par exemple, une réponse à des variations normales dans un matériau). Ce sont des exemples d'erreurs inhérentes au sujet. Les erreurs associées à l'individu examiné peuvent être dues à des variations biologiques de l'attribut (par exemple, pression sanguine, croissance, réponse à la douleur), aux effets de la maladie ou de la médication, et à la mémoire du patient relative à des indicateurs historiques importants en relation avec des éléments physiques (soins antérieurs, traumatisme, réponse à des interventions antérieures).

Une erreur peut également être due à l'instrument utilisé pour la mesure. Que ces instruments soient des équipements (microscopes, thermomètres, radiogrammes, testeurs pulpaires) ou des outils « papier » utilisés pour évaluer les comportements ou caractéristiques psychologiques (études, satisfaction du patient/qualité de vie), un indice de fiabilité de la mesure est primordial pour permettre la reproductibilité et assurer l'utilité des résultats. De même, la procédure réelle d'examen peut produire une erreur si l'environnement altère la capacité de l'examinateur à utiliser correctement ses sens, si les interactions entre le patient et le clinicien sont interrompues ou si les outils de diagnostic sont imprécis ou incorrectement utilisés.

Étapes utilisées pour réduire les désaccords cliniques ou la variabilité

Les stratégies pour prévenir ou réduire les erreurs et les désaccords cliniques demandent du temps et des efforts. Pour les cliniciens, ces stratégies incluent mais ne sont pas limitées à : l'évaluation de l'historique du patient, l'examen physique, l'évaluation diagnostique qui détermine un diagnostic spécifique ou un pronostic ou une décision de gestion relative au coût du soin du patient pour des procédures usuelles ou personnalisées, ainsi que des procédures potentiellement iatrogènes.

Les étapes utilisées pour réduire les désaccords cliniques ou la variabilité comprennent la conduite de l'examen dans un environnement adéquat et la prise en compte des forces et faiblesses individuelles. Les évaluations en aveugle, spécialement celles relatives aux caractéristiques les plus subjectives, et la répétition des aspects les plus douteux d'un examen peuvent réduire l'impact d'une attente initiale et améliorer les caractéristiques d'un diagnostic clinique par la stratégie de confirmation. En utilisant des modèles de classification, l'examinateur doit avoir des guides opérationnels pour chaque classification, afin de minimiser l'ambiguïté. Tout équipement de diagnostic doit être régulièrement vérifié, les instruments doivent être calibrés et un professionnalisme dans l'utilisation des équipements est nécessaire, de façon à assurer des résultats relativement fiables [¹⁵].

Pour les chercheurs, afin d'améliorer la validité des mesures, le point le plus important doit être de s'assurer que les mesures sélectionnées sont des informations claires sur le patient ou les substituts qui ont été reconnus comme des indicateurs valables des résultats. Établir la validité nécessite la mesure de quantités connues, ou d'un gold standard, et d'évaluer si une nouvelle méthode mesure précisément ce qui est censé être mesuré. Cette forme de calibrage est différente de la simple utilisation d'une nouvelle méthode, à côté d'une méthode existante pour déterminer la concordance entre les méthodes [¹⁶]. La première forme compare une méthode par rapport à un standard établi pour la « calibrer » sur la « vérité », alors que la deuxième vérifie la fiabilité de la nouvelle technique par rapport à une technique existante, en absence de toute considération de la justesse des mesures. En recherche, Bland et Altman [¹⁶] suggèrent que l'étalonnage d'une technique de mesure ou de multiples examinateurs est une tentative de donner des mesures tendant vers le gold standard, contrairement à la recherche de la fiabilité qui tend simplement à donner une meilleure précision aux mesures, comme montré ci-dessus dans l'illustration des mesures répétées.

Les contrôles des erreurs systématiques et aléatoires devraient être explicitement décrits dans tout travail de recherche. Ceci apporte quelque assurance au lecteur que les mesures ont été déterminées avec précaution et ont les meilleures chances de fournir une estimation vraie de la réponse à la question. Établir qu'il n'apparaît aucune sur ou sous-estimation des mesures est crucial, que la mesure porte sur des radiogrammes orthodontiques [¹⁴], des mesures de poches parodontales [¹⁷], ou des distorsions courantes dans les procédures de prothèse indirecte [¹⁸].

Un moyen important pour aider à contrôler les erreurs systématiques est de randomiser l'ordre dans lequel les mesures ont été faites [¹⁴]. Les erreurs aléatoires sont importantes, car elles s'ajoutent à la variabilité naturelle de toute mesure et peuvent masquer toutes différences réelles entre les groupes mesurés. Les erreurs aléatoires peuvent être réduites en dupliquant les mesures et en faisant leur moyenne, tout en faisant attention à dupliquer le processus complet de la mesure. Il est important pour le lecteur d'avoir une estimation de l'erreur de mesure, qui est souvent indiquée par une déviation standard, obtenue par de multiples mesures du même spécimen ou objet. Dans une discussion sur les effets des erreurs dans l'interprétation de résultats de recherche, Houston [¹⁴] décrit que, si une étude montre qu'il y a une différence entre les moyennes du groupe qui est cliniquement importante mais statistiquement non significative, alors soit trop peu de cas ont été inclus pour montrer qu'il existe une réelle différence, soit les résultats étaient si variables qu'ils ne peuvent avoir qu'une faible incidence pratique sur un cas individuel.

Quand le point critique est l'accord interexaminateurs, l'objectif est d'avoir de multiples examinateurs fonctionnant comme un seul. Par exemple, pour l'accord concernant des observations sur la présence d'une maladie parodontale, une récession gingivale, une mobilité dentaire ou d'autres mesures parodontales, il est important de mesurer un accord qui soit plus qu'un accord dû au hasard uniquement. La statistique kappa [²⁰] est utilisée pour de telles mesures de corrélation. Il a été montré que, pour les échelles nominales de mesures parodontales, des améliorations du kappa étaient corrélées à l'amélioration de la concordance des examinateurs sur des critères concernant l'attribution à des catégories individuelles de variables [21].

Conclusion

La relation entre les observations cliniques et les mesures trouvées dans la littérature dentaire a été décrite, dans le contexte des principes de mesure, comme une méthode pour focaliser notre analyse critique sur les mesures importantes utilisées pour les décisions cliniques. Les résultats ont été discutés à partir du fait que les soins dentaires, qui sont très largement choisis, sont un effort important qui tend à satisfaire les attentes du patient et donc, qui nécessite de considérer les mesures qui ont un impact sur les dimensions du soin perçues par le patient.

Retour à notre scénario

À partir de l'article que vous avez étudié, vous avez obtenu une meilleure compréhension de la complexité et des raisons de la variabilité associée aux diagnostics de santé ainsi qu'aux décisions de traitement. Ceci vous donne une certaine confiance pour votre discussion avec le journal local au sujet des résultats donnés par le journal national. De plus, vous avez décidé que vous travailleriez avec votre hygiéniste de façon à protéger votre exercice des risques de surtraitement, qui pourraient venir de vous ou d'elle. Pour y parvenir, vous avez organisé un rendez-vous afin de revoir ensemble les informations décrivant l'espérance de vie des restaurations typiques que vous voyez chez vos patients. Vous et votre hygiéniste verrez ensemble les détériorations courantes des restaurations et les caries récurrentes, de façon à être plus en accord l'un avec l'autre, ainsi que les preuves actuelles décrivant ces points, et vous listerez les défauts typiques des restaurations que vous remplacez habituellement. Finalement, vous prévoyez de conduire cette étude et de suivre votre exercice durant les 6 prochains mois, afin de déterminer si des entretiens additionnels seront nécessaires pour améliorer votre accord.

Titre original : Measurement in dentistry. J Prosthet Dent 2000;83(3):266- 271. Traduit et reproduit avec l'aimable autorisation de Mosby. Merci de ne pas reproduire, quel qu'en soit le motif, sans l'autorisation de l'éditeur.

Bibliographie

1 Bader JD, Shugars DA. Variation, treatment out-comes, and practice guidelines in dental practice. J Dent Educ 1995;59:61-95.
2 Reddy MA. The use of periodontal probes and radiographs in clinical trials of diagnostic tests. Ann Periodontol 1997;2:113-122.
3 Pihlstrom BL. Measurement of attachment levels in clinical trials : probing methods. J Periodontol 1992;63:1072-1077.
4 Evidence Based Medicine Workgroup, Deparment of Clinical Epidemiology. Hamilton (On-tario, Canada) McMaster University. Workshop publication, 1992.
5 Carr AB, McGivney G. Users'guides to the dental literature. How to get started. J Prosthet Dent 2000;83:13-20.
6 Polson AM. The research team, calibration, and quality assurance in clinical trials in periodontics. Ann Periodontol 1997;2:75-82.
7 Fries JF. Toward an understanding of patient outcomes measurement. Arthritis Rheum 1983;26:697-704.
8 Hujoel PP, Leroux BG, DeRouen TA, Kiyak HA. Evaluating the validity of probing attachment loss as a surrogate for tooth morality in a clinical trial on the elderly. J Dent Res 1997;76:858-866.
9 Carlsson GE, Otterland A, Wennstrom A. Patient factors in appreciation of complete dentures. J Prosthet Dent 1967;17:322-328.
10 Bergman B, Carlsson GE. Clinical long-term study of complete denture wearers. Act Odontol Scand 1985;53:56-61.
11 Spilker B. Introduction. In : Spilker B, ed. Quality of life assessment in clinical trials. New York : Raven Press, 1993:3-9.
12 Carr AB. Successful long-term treatment out-comes in the field of osseointegrated implants : prosthodontic determinants. Int J Prosthodont 1998;11:502-512.
13 Brunette DM. Critical thinking. Understanding and evaluating dental research. Chicago : Quintessence, 1996:65.
14 Houston WJB. The analysis of errors in orthodonticc measurements. Ann J Orthod 1983;83:382-389.
15 Department of Clinical Epidemiology and Biostatistics. McMaster University. Clinical Disagreement I.How often it occurs and why. Can Med Assoc J 1980;123:499-504.
16 Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1986;2:307-310.
17 Hefti AF. Periodontal probing. Crit Rev Oral Biol Med 1997;8:336-356
18 Nicholls JI. The measurement of distortion : theoretical considerations. J Prosthet Dent 1977;37:578-586.
19 Cohen J. Weighted kappa : nominal scale agreement with provision for scaled disagreement or partial credit. Psychol Bull 1968;70:213-220.
20 Feiss JL, Chilton NW. The measurement of inter-examiner agreement on periodontal disease. J Periodont Res 1983;18:601-606.