Wikidata: un intento de mejorar la Wikipedia y la enorme cantidad de datos que contiene
- Gran parte de los datos son 'hechos' que podrían formar una base de datos
- Wikidata pretende crear una enorme base de datos con toda esa información
- Ayudará en las traducciones y a que la información sea más accesible
La Wikipedia es sin duda todo un momento al saber humano que con el paso de los años ha crecido hasta abarcar detalles impensables en el pasado y cuyo vasto contenido (más de 10 GB de textos, sin contar las imágenes) incluye prácticamente cualquier dato que alguien pueda querer consultar.
El proyecto ha progresado gracias a la colaboración de cientos de miles de voluntarios que han llegado, de forma más o menos razonable, a un consenso sobre cómo definir y explicar todo lo que nos rodea, al estilo enciclopédico.
La Wikipedia está traducida con más o menos completitud a más de 200 idiomas y, aunque las versiones locales son todas ligeramente distintas, cumplen con el objetivo básico.
Ahora la Fundación Wikimedia, responsable del proyecto, tiene previsto mejorarla con la ayuda de un nuevo proyecto que está poniendo en marcha gracias a la financiación de varias fundaciones y donaciones.
Entre los benefactores está Google y también Paul Allen y Gordon Moore, fundadores de Microsoft e Intel, respectivamente. El proyecto se llama Wikidata y consiste básicamente en adaptar la Wikipedia al formato de una gigantesca base de datos 'semántica'.
“Wikidata pretende adaptar la Wikipedia al formato de una gigantesca base de datos“
En ella, cada uno de los datos que se corresponden con 'hechos' de nuestro mundo se podría consultar o actualizar automáticamente, además de que todo el contenido sea fácilmente accesible no solo para los humanos sino también para los programas y 'robots' de Internet.
El mejor ejemplo son las fichas técnicas o infoboxes, como las llaman en la Wikipedia. Imaginemos cualquiera de ellas con las características de los aviones que guarda la Wikipedia.
La barrera del idioma
Cientos de aficionados y expertos las han completado con fotos e información precisa, cual base de datos: los nombres de los modelos de avión, su longitud, envergadura o cuál es la potencia de sus turbinas.
Esos datos son independientes de los idiomas, pero sin embargo actualmente algunas versiones de la Wikipedia tienen esa información y otras no: esto es debido a que un voluntario debe recorrer las páginas e irlas copiando y traduciendo manualmente.
¿Y que sucede con las entradas sobre temas relativamente recientes o que cambian con el tiempo? Si hay unas elecciones vvarían los nombres de los presidentes de los países, y no solo en el artículo principal, sino en cientos de otros artículos que hacen referencia al primero.
Si surge un nuevo país, cambian los mapas y las listas de países de la región, por no hablar de que las cifras de población aumentan anualmente, las monedas locales desaparecen o a veces se aceptan nuevos idiomas oficiales.
Todo lo anterior se refiera a datos en cierto modo objetivos e indiscutibles, pero todavía no está claro qué sucederá con las entradas sobre artículos más 'conflictivos', de los que hay unos cuantos en la enciclopedia.
“No está claro qué sucederá con las entradas sobre artículos 'conflictivos'“
¿El dato sobre la población de Israel incluirá a la gente que vive en los territorios de Palestina? ¿Será la superficie de China más grande que la de Estados Unidos, o al revés?
(En la wikipedia China ambos están igualados en los puestos 3 y 4. En inglés en cambio se afirma que Estados Unidos es más grande que China -depende de cuántas islas se contabilicen).
Incluso datos históricos que ya deberían estar resueltos son controvertidos. ¿Cuándo acabó la Guerra de Corea? Según algunas Wikipedias, nunca terminó y Corea del Norte todavía está en guerra oficialmente con muchos países.
A veces el problema llega al absurdo, pues es de pura definición: ¿Cuántos continentes hay? Depende de a qué se llame 'continente': puede haber 4, 5, 6 o 7.
¿Y países en Europa? Casi el todo el mundo dice que 50, pero en la Wikipedia en español solo se habla de 44. Los franceses dicen que 51 y otros simplemente 'no se mojan'.
Un proyecto revolucionario
La revolución que promete Wikidata se enfrentará a un montón de retos, pero también puede traer grandes ventajas.
Por un lado, las versiones internacionales de la enciclopedia libre podrían actualizarse automáticamente de forma mucho más sencilla. Un mayor número de infoboxes junto a cada artículo facilitaría su lectura.
Y el hecho de que los contenidos de la enorme base de datos de 'hechos' sea público y accesible en formatos adaptados semánticamente para los 'robots' es más que positivo: miles de desarrolladores podrán utilizar esta información e incluso alimentarla de forma automática a partir de fuentes fiables.
Sus creadores ya han avisado de que esta iniciativa no pretende una automatización total ni una Wikipedia robotizada o que 'se escriba a sí misma'. Gran parte de estas labores requerirán de la intervención o supervisión humana, como hasta ahora.
En cierto modo la forma de trabajar con la Wikipedia será mejor, pero algunas cosas continuarán como hasta ahora: con el criterio humano necesario para separar el grano de la paja y la información fiable de la irrelevante, en un consenso fruto del trabajo colaborativo.