Analizando Twitter para predecir la salud de los ciudadanos
- Analiza información de Twitter para detectar a individuos enfermos
- Según la ubicación geográfica de los individuos produce mapas de riesgo para la salud
- Es un prototipo y sería complementario a los métodos de seguimiento de salud tradicionales
Detectar el brote de una enfermedad contagiosa como la gripe, seguir su propagación y alertar sobre las zonas de riesgo y probabilidades de contagio. Este es el objetivo de la aplicación Fount.in que están desarrollando investigadores de la Universidad de Rochester en Nueva York.
Según afirman sus desarrolladores, en el futuro se podrá predecir la salud de los individuos con más de un 90% de fiabilidad complementando los estudios y modelos tradicionales con el análisis de la información individual que circula por Internet, por ejemplo a través de la red social Twitter.
Por ahora el sistema se está probando con dos ciudades de EE. UU., Boston y Nueva York, aunque la mecánica sería aplicable a cualquier lugar del mundo.
Twitter como fuente de información
Fount.in recurre a los tuits publicados para extraer los datos que procesa. De ellos obtiene dos tipos de información: la ubicación geográfica del autor del tuit y su estado de salud si lo está compartiendo. Por ejemplo, con un tuit que diga: "Hoy me duele la garganta".
El sistema filtra todos los tuits que recibe para quedarse con aquellos que hacen referencia a enfermedades o que dan a entender que su autor se encuentra enfermo.
En este sentido el mayor desafío del sistema es ser capaz de distinguir cuándo palabras como "malo", "mal" o "enfermo" se utilizan en sentido literal o figurado o con sus diferentes significados. Es decir, si alguien dice "me encuentro mal" o "estoy malo" se entiende que se encuentra físicamente enfermo; pero no se puede llegar a la misma conclusión si escribe "me pone malo leer esto".
Para esto el sistema tiene que ser capaz de distinguir el significado aplicable y el contexto en el que se utilizan las palabras relacionadas.
Además el sistema debe contemplar los distintos grados en el estado de salud de los individuos, todos los grados posibles entre estar muy enfermo y estar bien en relación a enfermedades contagiosas como la gripe.
Según explican sus autores en Modeling the Impact of Lifestyle on Health at Scale (inglés, formato PDF) también sucede que muchos usuarios no van a tuitear acerca de su estado de salud (los 'estoicos') mientras que otros pueden hablar de estar enfermos sin estarlo realmente (los hipocondríacos). Para reducir este sesgo, explican los investigadores, se establecen periodos de enfermedad para cada usuario, aunque admiten que "serán necesarias técnicas adicionales para controlar este efecto de forma más efectiva".
Mapas de riesgos de infección
Con esos datos Fount.in puede representar en un mapa la ubicación de aquellos usuarios que declaran estar enfermos junto con el grado de la enfermedad, representado con distintos colores.
Uno de los mapas resultantes indica el riesgo que supone para la salud estar en un lugar determinado en función de la presencia de otros individuos que han informado sobre su estado de salud. También quien se encuentre enfermo puede conocer el riesgo que supone para otras personas.
Además de la propagación de enfermedades contagiosas, el sistema permite determinar zonas de riesgo por el entorno, por ejemplo por encontrarse cerca de una planta industrial que emita agentes tóxicos o en zonas con alta concentración de contaminación.
El sistema padece los mismos problemas y sesgos que otros sistemas empleados con fines similares. Por ejemplo, los métodos tradicionales basados en estudios en consultas médicas y encuestas no pueden tener en cuenta a aquellas personas que no van al médico o que no responden a las encuestas.
Una limitación que también es aplicable al servicio Google Flu Trends, similar a Fount.in, que sigue la evolución de la gripe basándose en búsquedas relacionadas con esta enfermedad. Entre todas las búsquedas habrá gente que se encuentra mal y busca información al respecto, pero también habrá quien busque información sobre la gripe sin estar enferma. Y el sistema no puede contabilizar a quienes estando enfermos no realizan ninguna búsqueda al respecto.
El desarrollo de Fount.in puede servir como modelo complementario a los métodos tradicionales sobre el terreno para contrastar y afinar los datos e incluso aportar datos adicionales sin necesidad de que intervengan los usuarios y que de otro modo no se podría considerar.
Además, a la vez el desarrollo de sistemas de análisis para el 'entendimiento' del lenguaje humano por parte de las máquinas permitirá mejorar en el futuro el funcionamiento de ordenadores capaces de dialogar con las personas de forma natural. Algo parecido a lo que hacen actualmente, de una forma más o menos rudimentaria, los asistentes personales de Apple (Siri) o Google Now, por ejemplo.