Los repositorios de tesis doctorales y el acceso al conocimiento: ¿hacemos bien las cosas?

Este año he asistido a varias defensas de tesis de compañeros de universidad y en algunos casos he tenido acceso privilegiado a los textos. Siempre que se ha suscitado el tema, he animado a que la copia digital se publicase tan pronto fuera posible (en el repositorio correspondiente), no solo para que el resto de investigadores tengan acceso, sino sobre todo para poder citar la nueva fuente e incrementar su divulgación e impacto científico.

Sin embargo, pese a que la Web cumple ya dos décadas, los procedimientos de publicación de tesis doctorales no están todavía resueltos (como han apuntado entre otros Rodríguez-Yunta 2010), aunque hay avances significativos. En España existe una base de datos del Ministerio, Teseo, que almacena la información documental de todas las tesis que se defienden en el país. Pero las copias digitales no cuelgan de este servicio, sino que, en su caso, hay que buscarlas en los repositorios de las respectivas universidades y a veces Teseo omite el enlace a la universidad (como se ve en 2):

  1. Tomás Faci, Guillermo(2013). LA ORGANIZACIÓN DEL TERRITORIO Y LAS DINÁMICAS SOCIALES EN RIBAGORZA DURANTE LA GRAN EXPANSIÓN MEDIEVAL (1000-1300)
  2. Gómez Seibane, Sara (2008). CONCORDANCIAS DE GÉNERO EN DOCUMENTACIÓN VIZCAÍNA. SIGLOS XV-XVI

Las cosas están evolucionando con rapidez y así por ejemplo en Cataluña hay una iniciativa de tesis doctorales en xarxa (TDX) que trasciende ya el propio ámbito político y lingüístico catalán, sumando otras universidades como las de Cantabria, Oviedo, o Murcia (véase también el reconocimiento internacional de Díaz Rodríguez y Sánchez Tarragó, 2010). Una propiedad destacable de TDX es que el catálogo se nutre directa y automáticamente de los repositorios de las universidades participantes.  A su vez TDX nutre a otros repositorios más generales, entre los que destaca el repositorio europeo de tesis doctorales DART. Veamos un ejemplo:

Es muy interesante analizar la estructura de datos del registro TDX, algo distinta a la de Teseo, y dotada de quince campos: Title, Author, Director, Department, Abstract (en tres idiomas), Date of defense, Copyright deposit, ISBN, Keywords, Subjects, Knowledge area, Rights, Share, Download, Files (faltan dos campos de Teseo, Tribunal y Mención a doctor europeo). En todo caso, el modelo de registro de TDX es en conjunto mucho más completo que Teseo y lo supera en especial en el apartado de interoperabilidad. El campo Download de TDX soporta ocho formatos: DIDLMARCMARC_CCUCMETSOAI_DCOREQDCRDF, lo que lo convierte en un repositorio altamente interoperable, es decir, que sus contenidos podrán ser recolectados (replicados, exportados) a un gran número de proveedores de servicios bibliográficos.

En nuestra universidad se están haciendo importantes esfuerzos para mejorar la difusión y acceso al “conocimiento” y en esta dirección se encamina el Deusto Knowledge Hub (DKH): http://dkh.deusto.es/en/community/thesis/tesis. A lo largo de 2013 se han introducido 606 registros de las tesis doctorales defendidas en la universidad desde 2004.  Si nos fijamos en el registro antes consultado en Teseo, vemos que ahora se podría añadir el localizador a DKH (aunque todavía Teseo no lo ha incorporado):

En la versión actual, DKH reproduce los contenidos de Teseo. Pero los datos deberían fluir en el sentido opuesto, sacando partido de los formatos interoperables y protocolos de recolección; y en este terreno DKH (que solo soporta RSS y RDF) tendrá que dotarse de mayor funcionalidad (vg. METSOAI_DCORE), permitendo, por ejemplo, que sus datos sean recolectados por el repositorio europeo DART (siguiendo el  modelo TDX, que suponemos pronto adoptará también Teseo).

Referencias

Activando el Periodismo de datos en Euskadi

En paralelo con la celebración de las I Jornadas de Periodismo de Datos que tendrán lugar entre los días 24 y 26 de mayo en Barcelona, Madrid, Sevilla y otras ciudades españolas, la Facultad de Ciencias Sociales y Humanas de la Universidad de Duesto ha organizado el taller:
Lee el resto de esta entrada »

Más Artículos

¿Cómo encontrar el quartile de una revista?

Canonical knowledge (derived from Wikipedia)

A ciencia abierta: iniciativas internacionales que catapultan el conocimiento

El traductor del Gobierno Vasco

How to write quality blog-posts? (for WCT, but not only)

Identidad y reputación digitales frente al derecho a la privacidad de los estudiantes

Textos cautivos, contenidos perdidos

Extracción de información (el caso DBpedia)