ARTICULO ORIGINAL


Algoritmo para identificación de consultas por infección respiratoria aguda baja en pediatría en registros clínicos electrónicos

An algorithm for identifying visits due to pediatric lower acute respiratory infections in electronic clinical records

Algoritmo para identificar infecções respiratórias agudas inferiores em consultas médicas por meio de prontuários eletrônicos

Paula González Pannia1, Manuel Rodriguez Tablado2, Santiago Esteban3, Rosana Abrutzky4, Fernando Adrian Torres5, Paula Dominguez6, Fabiana Ossorio7, Fernando Ferrero8

 

1- Médica especialista en pediatría (Sociedad Argentina de Pediatría y Ministerio de Salud). Médica de planta. Departamento de Medicina, Hospital General de Niños Pedro de Elizalde, Ciudad Autónoma de Buenos Aires. https://orcid.org/0000-0001-7006-3080 Mail de contacto: pau.gp17@gmail.com

2- Médico especialista en medicina familiar y comunitaria. Hospital Italiano, Ciudad Autónoma de Buenos Aires. https://orcid.org/0000-0002-4661-1312

3- Médico. Gerente de la Gerencia Operativa Gestión de Información y Estadísticas de Salud.

Salud, Ciudad Autónoma de Buenos Aires. https://orcid.org/0000-0001-6940-9734

4- Socióloga (Universidad de Buenos Aires), Magister en Gestión Ambiental. Universidad Nacional de San Martin. https://orcid.org/0000-0002-5580-0211

5- Médico especialista en pediatría (Sociedad Argentina de Pediatría y Ministerio de Salud). Médico de Planta Consultorios Externos. Médico staff Comité de Docencia e Investigación, Hospital General de Niños Pedro de Elizalde, Ciudad Autónoma de Buenos Aires. https://orcid.org/0000-0001-5694-7090

6- Médica Especialista en Pediatría (Sociedad Argentina de Pediatría y Ministerio de Salud). Médico staff Comité de Docencia e Investigación, Hospital General de Niños Pedro de Elizalde, Ciudad Autónoma de Buenos Aires.

7- Médico Especialista en Pediatría (Sociedad Argentina de Pediatría y Ministerio de Salud). Secretario de Comité de Docencia e Investigación, Hospital General de Niños Pedro de Elizalde, Ciudad Autónoma de Buenos Aires. https://orcid.org/00002350

8- Médico especialista en pediatría (Sociedad Argentina de Pediatría y Ministerio de Salud). Médico especialista en neumonologia (Sociedad Argentina de Pediatría). Jefe de Departamento de Medicina, Hospital de Niños Pedro de Elizalde, Ciudad Autónoma de Buenos Aires. https://orcid.org/0000-0001-6335-0102


Para conocer los diagnósticos de los pacientes y así poder generar políticas de salud, es importante que las consultas que se realizaron se registren en forma correcta. En pediatría, las consultas más frecuentes son por infecciones respiratorias agudas bajas (IRAB) pero pueden registrarse en la historia clínica con nomenclatura muy variada. Nuestro trabajo tiene como objetivo construir un algoritmo que permita identificar niños que hayan consultado por IRAB a partir de los datos de su historia clínica electrónica.


Conceptos claves:

A)Qué se sabe sobre el tema

Los registros médicos no siempre identifican con precisión la condición clínica de los pacientes, dificultando el diseño de algunas políticas de salud.

B) Qué aporta este trabajo

Desarrollamos una metodología que permite construir herramientas para identificar condiciones clínicas a partir de registros electrónicos de salud.

 

 

Resumen:

Introducción: Debido a ambigüedades en la nomenclatura, las infecciones respiratorias agudas bajas (IRAB) en la infancia frecuentemente no son debidamente registradas, especialmente durante las consultas ambulatorias. Contar con una herramienta que las identifique con precisión, permitirá evaluar el impacto en la salud respiratoria de noxas de alcance masivo y diseñar las políticas para prevenirlas o mitigar sus efectos. Nuestro objetivo fue construir un algoritmo que permita identificar niños con IRAB a partir de los datos de la historia clínica electrónica (HCE) del Gobierno de la Ciudad de Buenos Aires (GCBA).

Métodos: Utilizando la HCE-GCBA, se seleccionaron aleatoriamente 1000 consultas ambulatorias de pacientes menores de 2 años. Se buscaron términos que hicieran referencia a que la consulta era motivada por IRAB, con los que se desarrolló un algoritmo basado en reglas duras. Se utilizó otro set de datos de 800 consultas para ajustar el algoritmo y, finalmente, se validó su desempeño en un tercer set de 800 consultas correspondientes a todo el año 2018.

Resultados: En el set de validación, la herramienta desarrollada identificó IRAB con sensibilidad 88,24%, especificidad 97,5%, VPP 86,07% y VPN 97,93%.

Conclusión: El algoritmo de búsqueda desarrollado permite identificar con aceptable precisión las consultas ambulatorias relacionadas con IRAB en niños menores de 2 años.

PALABRAS CLAVE: infecciones del sistema respiratorio; registros electrónicos de salud; niño

Abstract:

Background: Due to ambiguities in terminology, acute lower respiratory infections (ALRI) in childhood are frequently not properly recorded, especially during outpatient visits. A tool that accurately identifies them, would assess the impact on respiratory health of massive harms, and design policies to prevent or mitigate their effects. We aimed to design an algorithm that allows identifying children with ALRI based on data from the electronic clinical record (ECR) of the Government of the City of Buenos Aires (GCBA).

Methodos: From the ECR-GCBA database, we randomly selected 1000 outpatient visits of patients aged under 2 years. Terms showing that the visit was due to LARI were searched using an algorithm based on hard rules. Another dataset including 800 visits was used to adjust the algorithm and, finally, its performance was tested in a third dataset of 800 queries corresponding to the entire year 2018.

Results: In the validation set, our tool identified LARI with sensitivity 88.24%, specificity 97.5%, PPV 86.07% and NPV 97.93%.

Conclusion: Our search algorithm allows us to identify with acceptable precision the outpatient visits related to LARI in children under 2 years of age from electronic clinical records.

KEYWORDS: acute respiratory infections; electronic health records; child

Resumo

INTRODUÇÃO: Devido à diferença de nomenclatura, as infecções respiratórias agudas inferiores não são registradas duante a infância, principalmente nas consultas ambulatoriais. Uma ferramenta que as identifica com precisão, permitirá avaliar impacto na saúde respiratória de grande alcance e projetar as politicas para prevenir ou mitigar os efeitos. Nosso objetivo é construir um algoritmo que faça possível a identificação de crianças com infecções respiratórias inferiores por meio dos dados do prontuário eletrônico do Governo da Cidade de Buenos Aires.

Métodos: Usando a ferramenta mencionada, será selecionado em aliatoria 1000 consultas ambulatoriais do pacientes menos de 2 anos de idade. Serão procurados termos que se referem à consulta gerada por infecções respiratórias inferiore, para isso um algoritmo baseado em regras rígidas foi desenvolvido. Então, o algoritmo foi ajustado usando outro conjunto do 800 consultas. E, finalmente, seu desempenho foi validado por um terceiro conjunto de 800 consultas em 2018.

Resultados: No conjunto de validação, a ferramenta desenvolvida detectou

infecções com sensibilidade 88.24%, especificidade 97,5%, VPP 86,07% e VPN 97,93%.

Conclusão: O algoritmo desenvolvido torna possivel identificar com precisão as consultas ambulatoriais do infecções respiratórias agudas inferiores no crianças menores do 2 anos de idade.

PALAVRA -CHAVE: infecções do sistema respiratório; registros eletrônicos de saúde; crianças

INTRODUCCIÓN

Las infecciones respiratorias agudas bajas (IRAB) constituyen una importante causa de morbimortalidad, fundamentalmente entre niños menores de cinco años. En el mundo, se estima que ocurren 120-156 millones de casos de IRAB1 y 1,4 millones de niños mueren cada año por esta causa2. En Argentina se reportan 250.000 casos de bronquiolitis anualmente3.

Aunque entre las IRAB se incluyen cuadros bien definidos, como bronquiolitis y neumonía, lo cierto es que muchas veces no son fáciles de clasificar4. Esto hace que sea difícil cuantificar las enfermedades respiratorias en la infancia, ya que frecuentemente no quedan debidamente registradas. Esta complicación es más manifiesta en los registros de consultas ambulatorias, que representan la mayoría de los casos de IRAB5.

El problema de la nomenclatura dificulta contar con datos fidedignos en el momento de diseñar políticas de salud. Esto es particularmente importante cuando se pretende evaluar el impacto en la salud respiratoria de noxas de alcance masivo (circulación epidémica de patógenos específicos, modificaciones en la dinámica social, contaminantes ambientales).

En los últimos años se ha extendido el uso de registros electrónicos de salud (RES), transformándose en una herramienta fundamental a la hora de valorar la salud de la población, por la cantidad de datos que aportan, su accesibilidad y las posibilidades de análisis que ofrece6.

La Ciudad Autónoma de Buenos Aires (CABA) incorporó el RES al sistema público de salud a partir de 20167. En el año 2018, ya todos los ámbitos de atención ambulatoria (centros de salud y acción comunitarios -Ce.S.A.C.- y consultorios externos de hospitales) contaban con RES.

Sin embargo, estos registros dependen de aquellos que cargan los datos y, particularmente en el caso de las IRAB en la infancia, cierta información puede haber sido incorporada de diferentes formas, dificultando su utilización.

Contar con una herramienta que identifique con precisión las consultas por IRAB en pediatría permitirá evaluar adecuadamente el impacto en la salud respiratoria de noxas de alcance masivo y diseñar las políticas para prevenirlas o mitigar sus efectos.

Nuestro objetivo fue construir una definición operativa sensible y específica para identificar pacientes pediátricos con infección respiratoria baja aguda a partir de los datos de la historia clínica electrónica del Gobierno de la Ciudad de Buenos Aires.

MATERIALES y MÉTODOS

Estudio descriptivo, de corte transversal realizado durante 19 meses Características de los RES: Se utilizó la historia clínica electrónica (HCE) de la CABA. En ella, cada consulta incluye un campo llamado “Problema” con una lista de posibles motivos de consulta de la cual seleccionar (con la posibilidad de incorporar nuevos sinónimos diagnósticos o abreviaturas), y un campo llamado “Evolución” para completar con texto libre. A los fines de este estudio la búsqueda se efectuó en ambos campos.

Construcción de la definición operativa: Utilizando como fuente de datos la HCE del GCBA, se seleccionaron aleatoriamente 1000 consultas (set de desarrollo) de pacientes menores de 2 años, acontecidas durante los meses de mayo, junio, julio y agosto (mayor prevalencia de enfermedad respiratoria) de 2018. Las HCE fueron revisadas una por una por un primer observador que identificó en el espacio de texto libre (“evolución”) o en el motivo de consulta (“problema”) términos que hicieran referencia a que la misma era motivada por infección respiratoria baja aguda (IRAB) (por ejemplo: bronquiolitis, sibilante recurrente, neumonía, neumonitis, salbutamol, tos, sibilancias, etc). El mismo observador, además, clasificó las consultas indicando cuales eran motivadas por IRAB y cuáles no. Utilizando 800 de dichas consultas ya clasificadas, se desarrolló un algoritmo basado en reglas duras9, cuya capacidad para identificar IRAB se evaluó en las 200 consultas restantes (set de inicial), calculando sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo. El algoritmo fue desarrollado en base a expresiones regulares que permitieran identificar los términos relacionados con IRAB junto con sus variantes léxicas, y que permitieran al mismo tiempo descartar aquellos términos que fuesen negados o hablasen de antecedentes personales o familiares (Fig 1).

En base a estas expresiones regulares, los “problemas” fueron asumidos como diagnósticos certeros. Por otro lado, las “evoluciones” fueron exploradas, utilizando un análisis de sintaxis (“parsing”), con sentencias en las que se combinaron estas expresiones regulares para poder identificar si se estaba hablando de esas entidades, si ellas estaban negadas o si se trataba de antecedentes.

Ajuste de la definición operativa: Se seleccionó aleatoriamente un segundo set de 800 consultas (set de ajuste) de pacientes menores de 2 años, acontecidas durante todo el año 2018 (enero a diciembre). Un segundo observador (asumido para este fin como estándar de oro), desconociendo los criterios utilizados por el primer observador, clasificó este segundo set de consultas indicando cuales, a su criterio, tenían motivo de consulta por IRAB y cuáles no. Para esta etapa se contempló consultas de un año calendario para evitar el riesgo de sesgo estacional debido a que algunas patologías respiratorias específicas se producen principalmente en los meses de otoño e invierno (virus sincicial respiratorio, influenza). Luego, se evaluó la capacidad del algoritmo para identificar IRAB en este set, calculando sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo. En base a los resultados de esta validación se efectuaron ajustes en el algoritmo.

Validación de la definición operativa: Se seleccionó aleatoriamente un tercer set de 800 consultas (set de validación) de pacientes menores de 2 años, acontecidas durante todo el año 2018 (enero a diciembre). En este set, el segundo evaluador identificó aquellas con IRAB y se procedió a evaluar la capacidad diagnóstica del algoritmo ajustado, calculando sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo.

Figura 1. Ejemplos de expresiones regulares consideradas en el algoritmo desarrollado

RESULTADOS

Al aplicar inicialmente el algoritmo construido (200 consultas) se verificó que identificaba una prevalencia de IRAB de 26% con una VPP de 98%.(Tabla 1)

Al aplicarlo en el set de ajuste (800 consultas) se observó que la prevalencia de IRAB disminuyó (14%), al igual que la capacidad diagnóstica del algoritmo. (Tabla 1)

Finalmente, tras el ajuste de la herramienta, su desempeño al aplicarlo al set de validación (800 consultas) mostró que la prevalencia 15,2% y mejora algo su capacidad diagnóstica. (Tabla 1)

Tabla 1. Desempeño de un algoritmo en la identificación de consultas por infección respiratoria aguda baja entre las consultas ambulatorias al sistema de salud pública del Gobierno de la Ciudad de Buenos Aires, en niños menores de 2 años de edad.

Consultas

Prevalencia

Sensibilidad

Especificidad

VPP

VPN

Set inicial

200

26 %

(23-29,2)

91,07

(86-94,5)

99,28

(96,5-99,9)

98,08

(94,7-99,4)

96,50

(92,6-98,5)

Set de ajuste

800

14,8 %

(12,4-17,5)

93,25

(91,2-94,8)

96,03

(94,7-99,4)

80,36

(77,4-83)

98,79

(97,7-99,4)

Set de validación

800

15,2 %

(12,8-17,9)

88,24

(85,8-90,3)

97,50

(96,1-98,4)

86,07

(83,4-86,4)

97,93

(96,6-98,8)

DISCUSIÓN

En este trabajo desarrollamos un algoritmo de búsqueda que, a partir de RES, permite identificar con aceptable precisión las consultas ambulatorias relacionadas con IRAB en niños menores de 2 años.

Otras iniciativas que buscan identificar condiciones de salud a partir de algoritmos de búsqueda en RES se basan en información codificada (por ejemplo, la clasificación internacional de enfermedades) o en datos administrativos10. Nuestro algoritmo se construyó en base a términos que un experto local identificó como relacionados con IRAB, por lo que puede pensarse que emula el criterio médico para la identificación de casos.

En los estudios ecológicos, la unidad de observación es una población dada, y son particularmente útiles cuando se explora el impacto en la salud respiratoria de noxas de alcance masivo (circulación epidémica de patógenos específicos, modificaciones en la dinámica social, contaminantes ambientales, variables climáticas)11. Si bien habitualmente es relativamente fácil medir los predictores en estudio (nivel de PM10, temperatura media anual, etc), este tipo de estudio suele requerir indicadores “duros” en los que el registro sea confiable (mortalidad, hospitalizaciones, consultas totales, etc). En muchas oportunidades, las consultas por causa específica son, sin lugar a dudas, un mejor indicador pero, por deficiencia en los sistemas de registro, es frecuente que no pueda utilizarse. Es allí donde los algoritmos de búsqueda que, como el nuestro, puedan identificar los pacientes a partir de los registros directos del personal de salud, son útiles.

Nuestro estudio tiene potenciales limitaciones que deben valorarse. Por un lado, la HCE electrónica permite el empleo de vocabulario no controlado, con los problemas que ello conlleva12. A ello hay que sumar la costumbre de muchos profesionales de usar jerga, abreviaturas y acrónimos13,14. Sin embargo, nuestro algoritmo se construyó en base a términos que un experto local identificó como relacionados con IRAB, por lo que es posible que haya identificado adecuadamente el diagnóstico a partir de los registros de sus colegas.

Por otro lado, la definición se construyó utilizando consultas de época invernal, donde la prevalencia de IRAB es mayor, pudiendo haber adjudicado una mayor precisión diagnóstica inicial. Es conocido el impacto que la prevalencia tiene en los valores predictivos de un test8, aumentando cuando aumenta la prevalencia. Sin embargo, los ajustes efectuados luego de evaluar el algoritmo en una muestra anual permitieron mejorar esa capacidad predictiva.

CONCLUSIONES

En conclusión, el algoritmo de búsqueda desarrollado permite identificar con aceptable precisión las consultas ambulatorias relacionadas con IRAB en niños menores de 2 años.

Limitaciones de responsabilidad

La responsabilidad del trabajo es exclusivamente de los autores.

Conflictos de interés

Ninguno

Fuentes de apoyo

El presente trabajo fue auspiciado parcialmente por una beca de investigación de la Sociedad Argentina de Pediatría.

Originalidad del trabajo

Este artículo es original y no ha sido enviado para su publicación a otro medio de difusión científica en forma completa ni parcialmente.

Cesión de derechos

Los participantes de este trabajo ceden el derecho de autor a la Universidad Nacional de Córdoba para publicar en la Revista de la Facultad de Ciencias Médicas y realizar las traducciones necesarias al idioma inglés.

Contribución de los autores

Todos los autores han participado en la concepción del diseño, recolección de la información y elaboración del manuscrito, haciéndose públicamente responsables de su contenido y aprobando su versión final.

BIBLIOGRAFÍA

1. Nair H, Simões EA, Rudan I, Gessner BD, Azziz-Baumgartner E, Zhang JSF, Feikin DR, Mackenzie GA, Moiïsi JC, Roca A, Baggett HC, Zaman SM, Singleton RJ, Lucero MG, Chandran A, Gentile A, Cohen C, Krishnan A, Bhutta ZA, Arguedas A, Clara AW, Andrade AL, Ope M, Ruvinsky RO, Hortal M, McCracken JP, Madhi SA, Bruce N, Qazi SA, Morris SS, El Arifeen S, Weber MW, Scott JAG, Brooks WA, Breiman RF, Campbell H; Severe Acute Lower Respiratory Infections Working Group. Global and regional burden of hospital admissions for severe acute lower respiratory infections in young children in 2010: a systematic analysis. Lancet. 2013 Apr 20;381(9875):1380-1390. doi: 10.1016/S0140-6736(12)61901-1.

2. Liu L, Johnson HL, Cousens S, Perin J, Scott S, Lawn JE, Rudan I, Campbell H, Cibulskis R, Li M, Mathers C, Black RE; Child Health Epidemiology Reference Group of WHO and UNICEF. Global, regional, and national causes of child mortality: an updated systematic analysis for 2010 with time trends since 2000. Lancet. 2012 Jun 9;379(9832):2151-61. doi:10.1016/S0140-6736(12)60560-1. Epub 2012 May 11. Erratum in: Lancet. 2012 Oct 13;380(9850):1308.

3. Ministerio de Salud, República Argentina. Boletín Integrado de Vigilancia. N° 479. Available: https://www.argentina.gob.ar/sites/default/files/biv_479.pdf.

4. Lanata CF, Rudan I, Boschi-Pinto C, Tomaskovic L, Cherian T, Weber M, Campbell H. Methodological and quality issues in epidemiological studies of acute lower respiratory infections in children in developing countries. Int J Epidemiol. 2004 Dec;33(6):1362-72. doi: 10.1093/ije/dyh229.

5. Fauroux B, Hascoët JM, Jarreau PH, Magny JF, Rozé JC, Saliba E, et al. Risk factors for bronchiolitis hospitalization in infants: A French nationwide retrospective cohort study over four consecutive seasons (2009-2013). PLoS One. 2020; 15(3):e0229766. https://doi.org/10.1371/journal.pone.0229766

6. Kukafka R, Ancker JS, Chan C, Chelico J, Khan S, Mortoti S, Natarajan K, Presley K, Stephens K. Redesigning electronic health record systems to support public health. J Biomed Inform. 2007 Aug;40(4):398-409. doi: 10.1016/j.jbi.2007.07.001.

7.Legislatura de la Ciudad Autónoma de Buenos Aires. Ley de historia clínica electrónica. Ley 5669. Buenos Aires, 27 de octubre de 2016.

8. Tenny S, Hoffman MR. Prevalence. [Updated 2021 May 30]. In: StatPearls [Internet]. Treasure Island (FL): StatPearls Publishing; 2021 Jan-. Available from: https://www.ncbi.nlm.nih.gov/books/NBK430867/

9. Esteban S, Rodríguez Tablado M, Ricci RI, Terrasa S, Kopitowski K. A rule-based electronic phenotyping algorithm for detecting clinically relevant cardiovascular disease cases. BMC Res Notes. 2017 Jul 14;10(1):281. doi: 10.1186/s13104-017-2600-2.

10. Kottke TE, Baechler CJ, Parker ED. Accuracy of heart disease prevalence estimated from claims data compared with an electronic health record. Prev Chronic Dis. 2012;9:E141. doi: 10.5888/pcd9.120009.

11. Borja-Aburto VH. Estudios ecológicos [Ecological studies]. Salud Publica Mex. 2000 Nov-Dec;42(6):533-8.

12. Cimino JJ. Desiderata for controlled medical vocabularies in the twenty-first century. Methods Inf Med. 1998 Nov;37(4-5):394-403.

13. Rees G. Staff use of acronyms in electronic care records. Mental Health Pract 2013; 16(10):28-31.

14. Walsh KE, Gurwitz JH. Medical abbreviations: writing little and communicating less. Arch Dis Child. 2008 Oct;93(10):816-7. doi: 10.1136/adc.2008.141473.

 

Recibido: 2020-08-31 Aceptado: 2021-08-24

DOI: 10.31053/1853.0605.v78.n3.30162

©Universidad Nacional de Córdoba