Pruebas A/B de conversación en salud: microexperimentos éticos y medición (PDSA)

En breve: Este artículo explica cómo realizar pequeñas y éticas pruebas A/B en conversaciones con pacientes siguiendo el ciclo PDSA (planificar–hacer–estudiar–actuar). Se trata de ajustar palabras y el orden de la información sin alterar el estándar clínico, y medir el efecto de forma sencilla. Incluye pasos listos para usar, guiones y criterios de seguridad para interrumpir el test si algo no va bien.

Cambia una sola cosa durante un periodo breve.
Define un objetivo y una hipótesis de comportamiento.
Mide la parafraseo y el tiempo hasta la comprensión.
Recoge un conjunto mínimo de datos de la conversación.
Decide: adoptar, adaptar o descartar.

Para recordar

Las microlecciones breves ayudan a mantener el ritmo de desarrollo sin apartarse de las tareas durante horas. Em analiza el estilo de cada persona para que la formación en comunicación interna se ajuste con precisión a sus necesidades. La entrenadora virtual está disponible antes de cada reunión difícil, eliminando la necesidad de esperar a un mentor.

Ver el video en YouTube

Pruebas pequeñas y éticas de conversación (PDSA): de qué van

En este contexto, una prueba A/B es una comparación breve y segura entre dos versiones de un mensaje para ver cuál favorece mejor la comprensión del paciente. No es un experimento médico sobre el paciente, sino una prueba de la forma de comunicar dentro de los estándares clínicos vigentes. Se cambia un solo elemento, por poco tiempo y en condiciones controladas, por ejemplo, el orden de las frases o solicitar una parafraseo. Antes de empezar, se fija un objetivo claro en una sola frase, p. ej.: “Queremos que, al terminar la consulta, el paciente pueda repetir las 3 indicaciones clave”. Si la prueba trata información sobre el tratamiento, el contenido debe respetar las guías y la información clínica; lo que cambia es solo la forma de transmitirlo. Este enfoque permite mejorar de manera iterativa, sin “grandes revoluciones”. La prioridad es la seguridad: el estándar asistencial no cambia y la prueba puede detenerse en cualquier momento.

PLAN: objetivo, hipótesis, criterios de éxito y condición de parada

En la fase de planificación elegimos 3–5 palabras clave y formulamos una hipótesis conductual, por ejemplo: “Si reducimos la instrucción a 3 pasos y pedimos que la repitan con sus propias palabras (parafraseo), más pacientes describirán correctamente la pauta”. Definimos un criterio de éxito simple: el porcentaje de pacientes que describen con sus palabras qué harán en casa y el “tiempo hasta la comprensión”, medido en rondas de explicación. Para mayor claridad, definimos dos versiones: A y B, sin cambios clínicos. Por ejemplo: A: “Tome 2 pastillas por la mañana y 1 por la noche, es decir, 2-0-1”; B: “Por la mañana, dos pastillas; por la noche, una. ¿Podría repetirlo con sus propias palabras?”. Es clave fijar una condición de parada: si aumenta la inquietud del paciente, disminuye la comprensión o aparecen malentendidos, se interrumpe de inmediato y se vuelve al estándar. Conviene acordar de antemano cuántos casos incluirá la prueba y en qué periodo (p. ej., un turno, una consulta). Un buen plan protege al paciente y al equipo, y facilita evaluar con claridad el resultado.

DO: muestra pequeña, condiciones estables y datos mínimos

La prueba se realiza con una muestra pequeña y homogénea, en condiciones lo más parecidas posible, para evitar resultados aleatorios. Para la trazabilidad registramos un conjunto mínimo de datos: contexto (consulta/turno), versión del mensaje (A o B), reacciones del paciente (preguntas, inquietudes), resultado del parafraseo (correcto/incompleto/incorrecto) y tiempo aproximado de la conversación. También anotamos si fue necesaria una ronda extra de explicación y qué la motivó. Evaluamos de forma consistente el contenido y el proceso, no a las personas: lo que se pone a prueba son las frases, no quien las dice. Si aparece un “efecto novedad”, planificamos un segundo ciclo breve a la semana siguiente, cuando se haya diluido la curiosidad del equipo. El objetivo es obtener una señal repetible, no un “pico” puntual. Así los resultados son fiables y útiles para decidir.

STUDY: identifica los momentos en que algo se descarrila

En el análisis no cuenta solo el promedio; importan también los puntos donde el paciente pierde el hilo o surge tensión. Observamos qué palabras generan dudas, si los números fueron claros y en qué momento aparecieron preguntas adicionales. Ayuda una visualización sencilla: un gráfico de evolución (parafraseos correctos caso a caso) o una tabla “versión A / versión B / comentarios”. Completamos con una pequeña muestra cualitativa: al final preguntamos “¿Qué fue lo más claro hoy y qué lo menos claro?”. Una sola pregunta suele señalar el fragmento concreto a mejorar, en lugar de una reflexión general. Conviene mirar las distribuciones, no solo las medias, para ver si el problema se concentra en un momento específico de la conversación. La salida de “STUDY” debe ser un ajuste pequeño y concreto listo para el siguiente ciclo.

ACT: adoptar, adaptar o descartar, y asegurar el mantenimiento

Tras el análisis, elegimos una de tres opciones: Adopt (implantar), Adapt (modificar) o Abandon (descartar). Cada decisión se formula en una frase operativa, p. ej.: “Adopt: en toda conversación sobre medicamentos de alto riesgo, cerramos pidiendo parafraseo y con un plan de contingencia”. Para sostener el cambio, creamos un mini-plantilla en la documentación (p. ej., tres campos: “qué, cuánto, cuándo”), una tarjeta con una frase modelo en el puesto o una chuleta breve en el sistema. Organizamos un briefing de dos minutos con un ejemplo de “buena frase” e indicaciones sobre cuándo usarla. A la semana comprobamos si el hábito se mantiene y, si hace falta, ejecutamos una microprueba de refuerzo. Sin soporte para el mantenimiento, incluso un buen cambio se diluye rápido. El resultado clave de “ACT” es un hábito visible en el día a día, no una decisión escrita.

Qué probar primero y qué no probar

Para empezar, conviene elegir elementos de bajo coste de cambio y con alto impacto en la comprensión: el orden de la información, la longitud de las frases, el uso de números en lugar de adjetivos (“2 pastillas por la mañana”) y una breve checklist de “síntomas de alarma” con un plan de contingencia claro. Sustituir términos como “aumentar/disminuir” o “a menudo/rara vez” por valores concretos suele mejorar el entendimiento. Evitamos pruebas que puedan alterar decisiones clínicas o generar desigualdad en el acceso a la información; ante la duda, se consulta con la persona responsable de calidad o ética. Ayuda contar con una “biblioteca de microguiones”: 5–10 frases para situaciones típicas, cada una en versión “simple” y “más detallada”. El equipo elige según el paciente y el tiempo, siempre pidiendo parafraseo. Esta biblioteca acelera las siguientes pruebas y acorta el camino hasta un hábito estable.

Las pruebas A/B pequeñas dentro del ciclo PDSA permiten mejorar la comunicación sin comprometer el estándar asistencial. La clave es un objetivo claro, una única hipótesis, una prueba breve y una medición simple: parafraseo y número de rondas de explicación. Recogemos datos de manera austera pero consistente y cerramos el análisis con una pregunta cualitativa. La decisión se formula de forma operativa y se blinda con mini-plantillas y un briefing. Tras 2–3 ciclos, redactamos en una página unas “reglas de conversación” y formamos a las nuevas personas con ejemplos reales. Cada semana se monitoriza un indicador de proceso (p. ej., parafraseo: sí/no) y uno de resultado (p. ej., menos llamadas sobre la pauta). Este ritmo cierra el bucle de aprendizaje y aporta mejoras seguras y sostenidas.

Empatyzer en las pruebas A/B de conversación y el cierre del ciclo PDSA

El asistente “Em” de Empatyzer ayuda al equipo a preparar con rapidez dos versiones de la frase clave y a simplificar el vocabulario para pruebas breves de conversación. En la práctica, también facilita definir las 3–5 palabras clave y las preguntas de parafraseo, de modo que el plan quede listo antes del turno. Tras la conversación, Em ayuda a registrar una nota PDSA concisa e identificar el momento en el que el paciente perdió el hilo, lo que permite arrancar el siguiente ciclo con un ajuste concreto. El equipo puede ver en Empatyzer patrones agregados de comunicación del servicio (sin datos individuales), lo que facilita acordar una biblioteca común de microguiones. Microlecciones de dos minutos, dos veces por semana, refuerzan el hábito de pedir parafraseo y cerrar con un plan de contingencia. Empatyzer no sustituye la formación clínica ni las guías, pero reduce la fricción en la preparación y ejecución de pequeñas pruebas cotidianas. Además, la privacidad desde el diseño y el arranque ágil sin integraciones pesadas permiten implantar un piloto a nivel de unidad en tiempos previsibles.

Autor: Empatyzer

Publicado: 27.octubre (lunes), 2025 (transcurrido: 18 semanas, 1 día)

Actualizado: 27.octubre (lunes), 2025 (transcurrido: 18 semanas, 1 día)