La científica española que está detrás de los datos mundiales del coronavirus
- Detrás del recuento de casos de la pandemia hay un equipo de apenas una decena de científicos, entre ellos Sara Bertrán de Lis
- Coronavirus: última hora en directo | Mapa de España | Evolución de la curva | Hospitales y UCI
- Vacunas en España | Guía de restricciones | Mapa mundial
Todo empezó en enero de 2020. Un estudiante chino que hacía el doctorado en la Universidad Johns Hopkins escuchó cómo sus familiares hablaban de un misterioso virus. Su director de tesis le recomendó empezar un recuento de los casos y plasmarlo en un mapa. Poco a poco ese mapa fue creciendo y ahora, poco más de un año después, se ha convertido en una de las referencias internacionalespara analizar el impacto de la pandemia de coronavirus.
Detrás del recuento de las escalofriantes cifras que arroja la pandemia un año después, como el hito de los 100 millones de casos alcanzado la pasada semana, hay un equipo de apenas una decena de científicos que trabajan en esta universidad estadounidense. Y detrás de este equipo está Sara Bertrán de Lis, una científica de datos española que se ha encargado de la visualización de una información de una magnitud abrumadora. Primero fueron los contagios y los fallecimientos, después las pruebas y, ahora, las vacunaciones.
"Esta pandemia marca un antes y un después en lo que significa la recopilación de datos. Hasta ahora los gobiernos han ido un paso por detrás, pero esta situación les ha forzado a tener que ser transparentes", cuenta Bertrán de Lis a RTVE.es desde Baltimore, en Estados Unidos. Esta astrofísica sabía muy poco de epidemiología cuando le llamaron desde la Johns Hopkins en marzo. "Me dijeron si me importaría hacer unas gráficas sobre el coronavirus y respondí que por supuesto", explica.
Los datos de las universidades se imponen a los de organismos oficiales
El recuento independiente que realiza esta universidad ha llegado a ser la referencia para medios de todo el mundo, más incluso que los datos de organismos oficiales como la OMS. Otro conteo independiente, el de Our World in Data, de la Universidad de Oxford, también se ha convertido en uno de los más consultados a nivel global, especialmente a la hora de seguir la vacunación mundial.
Para el científico responsable de los datos de este proyecto, el francés Edouard Mathieu, la crisis del coronavirus "habrá enseñado a algunos países cómo proporcionar datos accesibles y limpios". Desde París, donde se coordina con su equipo de una decena de investigadores y desarrolladores, advierte de la gran brecha en la difusión y tratamiento de los datos sobre la pandemia en diferentes países del mundo. "Muchos gobiernos no tienen recursos ni personal, no saben dónde publicar los datos", asegura.
El proyecto de Oxford, como el de la Johns Hopkins, basa gran parte de su éxito en ofrecer los datos de forma accesible y gratuita para todo el mundo. Según explica Bertrán de Lis, poner estos datos a disposición de todos los usuarios fue "una decisión consciente". "Es la política de la universidad de diseminar la información de forma que la gente pueda hacer estudios, utilizarla de forma diferente, etc.", explica.
¿De dónde sacan los datos?
Cuando la pandemia irrumpió en el mundo a principios del año pasado, pocos sabían cómo enfrentarse a ella, a nivel sanitario, político, o incluso desde el propio tratamiento de los datos que el virus dejaba. En un primer momento, los científicos de la Johns Hopkins empezaron a recoger los datos manualmente, siempre desde fuentes oficiales.
"Una persona cada día entra en una página web oficial, recoge el dato y lo guarda en una base", explica Bertrán de Lis. Más adelante se desarrollaba un código para recoger los datos de forma automatizada, aunque con cada nueva métrica analizada -pruebas, muertes o vacunas- el proceso empieza siendo manual de nuevo. De hecho, la recogida de los datos sobre la vacunación en Estados Unidos sigue siendo manual.
Algo parecido ocurre con el proyecto de Oxford, que toma de manera automática los datos de contagios y fallecidos de la universidad estadounidense. En cuanto a los test y las vacunas, sin embargo, esto no es tan fácil. "Para la mayoría de países no se puede automatizar: los números se publican en una rueda de prensa, en Twitter o en Facebook y el formato cambia cada día". En ese caso, los científicos deben hacer una búsqueda manual.
Para los recuentos, los científicos toman los datos de las fuentes oficiales de cada país. En el caso de que no coincidan, se aplica un control de calidad. "Estableces de qué fuente te fías más y contrastas dos fuentes", detalla Bertrán de Lis. "Cuantas más fuentes de la misma información tengas, mejor". En España, por ejemplo, estas dos fuentes serían el Ministerio de Sanidad y el Centro Europeo para la Prevención y Control de Enfermedades.
Tanto ella como Mathieu coinciden en la mayor dificultad a la que se enfrentan a la hora de gestionar los datos de la pandemia: la diferencia en la manera de medir. "La falta de estándares complica mucho que se puedan comparar los datos y la interpretación es muy complicada", comenta Bertrán. La científica advierte de lo delicado que es tomar medidas, "como el cierre de escuelas o las restricciones a los viajes" en función de unos datos que no son homogéneos por países.
Para la española, se ha vivido "el día de la marmota" en cuanto a la publicación y actualización de los datos oficiales. Cada vez que se añadía una métrica nueva, como las pruebas o las vacunas, empezaba de nuevo la descoordinación, la tardanza en la actualización y la diferencia de estándares.
Lo mismo afirma su homólogo en Oxford: "Después de los problemas con los datos de contagios, pensé que todo sería más limpio con los datos de vacunación". Pero se equivocó, cuenta Mathieu, que sigue observando problemas en el acceso a datos oficiales.
Los datos, "en el centro de la conversación" por primera vez
Entre otros innumerables cambios en nuestras vidas cotidianas, la pandemia puso los datos en el centro del debate público, tanto a nivel ciudadano como mediático o político. Todos empezamos a escuchar a diario términos como tendencias –ascendentes y descendentes-, curvas, o escalas lineales y logarítmicas.
"Por primera vez hemos visto declaraciones institucionales que hablaban de datos o gobiernos que dedicaban páginas web a la visualización de datos", señala Bertrán de Lis. "Los datos han estado en el centro de la conversación, es algo que nunca había pasado y que esperemos que siente precedente", confía.
El responsable del proyecto de Oxford advierte, sin embargo, del peligro contrario: "Los datos han tenido un papel demasiado importante en la pandemia", asegura. Según Mathieu, la presencia de ruedas de prensa diarias en las que se ofrecían los números de contagiados o fallecidos en las últimas 24 horas llevaba a la población a buscar tendencias o grandes cambios donde no los había.
"Como hay un número diario la gente empieza a crear historias para tener algo que decir. Solo porque los datos estén disponibles diariamente no tienes por qué pensar en ello diariamente", subraya. Según explica, suele ser mucho más ilustrativo observar tendencias en base a 7 o 15 días.
El dilema ante los datos sospechosos
¿Qué hacer a la hora de reportar los datos de países criticados por falta de transparencia, como China o Rusia? Tanto en la universidad británica como la estadounidense se limitan a publicar los datos que proporcionan las fuentes oficiales, sin cuestionar las posibles irregularidades que puedan existir.
"Somos científicos, no creemos que nuestro trabajo sea investigar y descubrir que los datos están mal. Si algún medio o algún periodista encuentran que son falsos sí que sería un problema", argumenta Mathieu, quien recuerda que "siempre hay gente que sospecha de los datos" de cualquier país, como España o Gran Bretaña.
Precisamente, algunos países europeos han estado en el punto de mira por infravalorar el número de muertos. Según la científica de la Johns Hopkins, esto ocurrió "en todo el mundo", y se debe sobre todo a la falta de infraestructura para hacer pruebas al inicio de la pandemia.
"La primera conclusión a la que llega la gente es que los gobiernos ocultan los datos, cuando eso es lo último que deberías pensar", afirma Mathieu. El científico francés recuerda, como Bertrán de Lis, la dificultad de hacer pruebas al principio de la crisis, y las diferentes formas de contar los fallecidos.
"Nunca sabremos el número real de muertos"
A pesar de que llevan un conteo actualizado de los fallecidos con coronavirus, los científicos de ambas universidades advierten de la dificultad de conocer la magnitud exacta de la pandemia, incluso dentro de años. "Nunca sabremos el número real de muertos. Lo mejor que tendremos serán investigaciones dentro de años o décadas que usarán grandes modelos y que cruzarán varios datos para decir un número, pero será estimado", dice Mathieu.
El mayor problema, recuerda, está en que en países poco desarrollados "no se hacía pruebas a nadie" en los primeros meses de la pandemia. Para Bertrán de Lis el número final "se podrá estimar por los excesos de muertes comparados con otros años", pero advierte de que esta métrica no es perfecta, ya que por ejemplo, los confinamientos reducen muertes por otras causas, como los accidentes de tráfico.
Mathieu confía en que la titánica tarea de reproducir en datos sencillos y accesibles una pandemia de estas características pueda ser útil cuando esta termine. Este trabajo "se debería expandir a otras áreas, como el cambio climático", propone. Su intención es que la gente pueda ser informarse de aquello que le afecta de cerca, ya sea un virus, la desigualdad o el calentamiento global.
La científica española destaca también que los datos que están recogiendo actualmente tendrán una gran importancia en el futuro, especialmente para saber "qué políticas han tenido más éxito para frenar esta pandemia" y así poder replicarlas en futuras crisis sanitarias.