Tests A/B de conversations en santé : micro‑expériences éthiques et mesure des effets (PDSA)

En bref : Cet article explique comment mener de petits tests A/B éthiques dans les échanges avec les patients en s’appuyant sur le cycle PDSA (planifier–faire–étudier–agir). Il s’agit d’ajuster des détails de langage ou l’ordre des informations, sans toucher au standard clinique, puis de mesurer simplement l’effet. Vous y trouverez des étapes prêtes à l’emploi, des scripts et des garde‑fous pour interrompre le test si quelque chose déraille.

Modifier un seul élément pendant une courte période.
Définir un objectif et une hypothèse comportementale.
Mesurer la paraphrase et le temps jusqu’à la compréhension.
Recueillir un jeu de données minimal issu des échanges.
Décider : adopter, adapter ou abandonner.

À retenir

De courtes micro-leçons permettent de garder un rythme de progression sans s’éloigner des tâches pendant de longues heures. Em analyse le style de chaque personne afin que la formation à la communication interne soit précisément adaptée à ses besoins. La coach virtuelle est disponible avant chaque rendez-vous difficile, sans attendre un créneau chez un mentor.

Voir la vidéo sur YouTube

De petits tests de conversation éthiques (PDSA) – l’essentiel

Un test A/B, ici, compare brièvement et en sécurité deux formulations pour voir laquelle aide mieux le patient à comprendre. Ce n’est pas une expérimentation médicale, mais un essai sur la manière de dire, dans le cadre des standards cliniques en vigueur. On ne change qu’un paramètre à la fois, sur une courte période et en conditions contrôlées, par exemple l’ordre des phrases ou la demande de paraphrase. Avant de commencer, on fixe un objectif clair en une phrase, par exemple : « Nous voulons qu’après la consultation le patient puisse redire les 3 consignes clés. » Si le test porte sur des informations thérapeutiques, le fond reste strictement conforme aux recommandations ; seule la forme varie. Cette approche permet d’améliorer les échanges par itérations plutôt que par une « grande réforme ». La sécurité reste prioritaire : le standard de soin ne change pas, et le test peut être interrompu à tout moment.

PLAN : objectif, hypothèse, critères de réussite et clause d’arrêt

Au moment de planifier, on choisit 3 à 5 mots‑clés et on formule une hypothèse comportementale, par exemple : « Si nous réduisons l’instruction à 3 étapes et demandons une restitution en propres mots (paraphrase), davantage de patients décriront correctement la posologie. » On définit un critère de succès simple : la part de patients capables de décrire avec leurs mots ce qu’ils feront chez eux, ainsi que le « temps jusqu’à compréhension » compté en tours d’explication. On précise les deux versions A et B, sans aucune modification clinique, par exemple A : « Prenez 2 comprimés le matin et 1 le soir, soit 2‑0‑1 » ; B : « Le matin, deux comprimés ; le soir, un. Pouvez‑vous me le redire avec vos mots ? ». La clause d’arrêt est essentielle : si l’anxiété des patients augmente, si la compréhension baisse ou si les malentendus se multiplient, on arrête immédiatement et on revient au standard. On fixe aussi à l’avance l’ampleur et la durée du test (par exemple un poste de garde, une consultation). Un bon plan protège à la fois le patient et l’équipe, tout en rendant l’évaluation lisible.

DO : petit échantillon, conditions stables, données minimales

On mène le test sur un petit échantillon homogène, dans des conditions aussi semblables que possible, pour éviter les effets de hasard. On note un jeu de données minimal et clair : contexte (consultation/équipe), version du message (A ou B), réactions du patient (questions, inquiétudes), résultat de la paraphrase (correcte/incomplète/incorrecte) et durée approximative de l’échange. On consigne aussi si une ronde d’explication supplémentaire a été nécessaire et pourquoi. On évalue systématiquement le contenu et le process, pas les personnes : ce sont les phrases qui sont testées, pas les professionnels. Si un « effet de nouveauté » apparaît, on planifie un deuxième cycle court une semaine plus tard, une fois retombées l’émotion et la curiosité de l’équipe. L’objectif est d’obtenir un signal reproductible, pas un « pic » isolé. Ainsi, les résultats sont fiables et exploitables pour décider.

STUDY : repérer les moments où ça coince

L’analyse ne se limite pas aux moyennes : on regarde aussi où le patient décroche ou où la tension monte. On identifie les mots ambigus, la compréhension des chiffres et le moment où surgissent les questions supplémentaires. Une visualisation simple aide : courbe chronologique (combien de paraphrases correctes au fil des cas) ou tableau « version A / version B / commentaires ». On complète par un court volet qualitatif : à la fin, demander « Qu’est‑ce qui a été le plus clair aujourd’hui, et le moins clair ? ». Cette seule question cible souvent un passage précis à améliorer au lieu d’une remarque générale. On examine aussi les distributions, pas seulement les moyennes, pour voir si le problème se concentre à un moment spécifique de l’échange. La conclusion de « STUDY » doit être une petite amélioration concrète prête pour le cycle suivant.

ACT : adopter, adapter ou abandonner, puis ancrer la pratique

Après l’analyse, on choisit : Adopt (déployer), Adapt (modifier) ou Abandon (laisser tomber). Chaque décision tient en une phrase opérationnelle, par exemple : « Adopt : nous terminons chaque échange sur les médicaments à risque élevé par une demande de paraphrase et un plan d’alerte. » Pour ancrer le résultat, on crée un mini‑gabarit dans la documentation (par exemple trois champs : « quoi, combien, quand »), une fiche avec une phrase type au poste de travail, ou une courte aide‑mémoire dans le système. On organise un briefing de deux minutes avec un exemple de « bonne phrase » et quand l’utiliser. Une semaine plus tard, on vérifie si l’habitude tient et, si besoin, on relance un petit test correctif. Sans dispositif d’ancrage, même une bonne amélioration s’efface vite. Le vrai livrable d’« ACT », c’est une habitude visible au quotidien, pas une note de service.

Que tester en premier, et quoi éviter

On commence par ce qui est peu coûteux à changer et cause le plus souvent des incompréhensions : l’ordre des informations, la longueur des phrases, l’usage des nombres plutôt que des adjectifs (« 2 comprimés le matin »), et une courte checklist des « signes d’alerte » avec un plan d’action clair. Remplacer des termes vagues comme « augmenter/diminuer » ou « souvent/rarement » par des valeurs concrètes améliore fréquemment la compréhension. On évite tout test susceptible d’influer sur une décision clinique ou de créer des inégalités d’accès à l’information ; en cas de doute, on soumet le plan à la personne en charge de la qualité ou de l’éthique. Une « bibliothèque de micro‑scripts » aide : 5 à 10 phrases pour des situations typiques, chacune en version « simple » et « plus détaillée ». L’équipe choisit selon le patient et le temps disponible, en demandant toujours une paraphrase. Cette bibliothèque accélère les tests suivants et raccourcit le temps jusqu’à l’habitude stable.

De petits tests A/B intégrés au cycle PDSA permettent d’améliorer la communication sans toucher au standard de soin. L’essentiel : un objectif clair, une hypothèse unique, un test court et une mesure simple : paraphrase et nombre de tours d’explication. Les données sont légères mais recueillies avec rigueur, et l’analyse se conclut par une question qualitative. La décision se formule de manière opérationnelle et l’on sécurise le maintien par des gabarits brefs et un briefing. Après 2 à 3 cycles, on rédige une page de « règles de conversation » et on forme les nouveaux avec des cas réels. Chaque semaine, on suit un indicateur de processus (par ex. paraphrase : oui/non) et un indicateur de résultat (par ex. moins d’appels sur la posologie). Ce rythme boucle l’apprentissage et apporte une amélioration sûre et continue.

Empatyzer dans les tests A/B de conversations et la boucle PDSA

L’assistant « Em » d’Empatyzer aide l’équipe à préparer rapidement deux versions d’une phrase clé et à choisir des mots plus simples pour de courts tests de conversation. Concrètement, il facilite aussi la sélection de 3 à 5 mots‑clés et des questions de paraphrase, pour que le plan soit prêt avant la garde. Après l’échange, Em aide à rédiger une courte note PDSA et à repérer l’instant où le patient a perdu le fil, ce qui permet d’entamer le cycle suivant avec une amélioration précise. L’équipe peut consulter dans Empatyzer des schémas de communication agrégés du service (sans données individuelles), ce qui facilite l’accord sur une bibliothèque commune de micro‑scripts. De brèves micro‑leçons deux fois par semaine renforcent l’habitude de demander une paraphrase et de conclure par un plan d’alerte. Empatyzer ne remplace ni la formation clinique ni les recommandations, mais réduit la friction du quotidien pour préparer et mener ces petits tests. En plus, la confidentialité intégrée dès la conception et un démarrage rapide sans intégrations lourdes permettent de lancer un pilote au niveau de l’unité dans des délais prévisibles.

Auteur: Empatyzer

Publié: 27.octobre (lundi), 2025 (écoulé: 18 semaines, 1 jour)

Mis à jour: 27.octobre (lundi), 2025 (écoulé: 18 semaines, 1 jour)