Category Archives: Research

Los repositorios de tesis doctorales y el acceso al conocimiento: ¿hacemos bien las cosas?

Este año he asistido a varias defensas de tesis de compañeros de universidad y en algunos casos he tenido acceso privilegiado a los textos. Siempre que se ha suscitado el tema, he animado a que la copia digital se publicase tan pronto fuera posible (en el repositorio correspondiente), no solo para que el resto de investigadores tengan acceso, sino sobre todo para poder citar la nueva fuente e incrementar su divulgación e impacto científico.

Sin embargo, pese a que la Web cumple ya dos décadas, los procedimientos de publicación de tesis doctorales no están todavía resueltos (como han apuntado entre otros Rodríguez-Yunta 2010), aunque hay avances significativos. En España existe una base de datos del Ministerio, Teseo, que almacena la información documental de todas las tesis que se defienden en el país. Pero las copias digitales no cuelgan de este servicio, sino que, en su caso, hay que buscarlas en los repositorios de las respectivas universidades y a veces Teseo omite el enlace a la universidad (como se ve en 2):

  1. Tomás Faci, Guillermo(2013). LA ORGANIZACIÓN DEL TERRITORIO Y LAS DINÁMICAS SOCIALES EN RIBAGORZA DURANTE LA GRAN EXPANSIÓN MEDIEVAL (1000-1300)
  2. Gómez Seibane, Sara (2008). CONCORDANCIAS DE GÉNERO EN DOCUMENTACIÓN VIZCAÍNA. SIGLOS XV-XVI

Las cosas están evolucionando con rapidez y así por ejemplo en Cataluña hay una iniciativa de tesis doctorales en xarxa (TDX) que trasciende ya el propio ámbito político y lingüístico catalán, sumando otras universidades como las de Cantabria, Oviedo, o Murcia (véase también el reconocimiento internacional de Díaz Rodríguez y Sánchez Tarragó, 2010). Una propiedad destacable de TDX es que el catálogo se nutre directa y automáticamente de los repositorios de las universidades participantes.  A su vez TDX nutre a otros repositorios más generales, entre los que destaca el repositorio europeo de tesis doctorales DART. Veamos un ejemplo:

Es muy interesante analizar la estructura de datos del registro TDX, algo distinta a la de Teseo, y dotada de quince campos: Title, Author, Director, Department, Abstract (en tres idiomas), Date of defense, Copyright deposit, ISBN, Keywords, Subjects, Knowledge area, Rights, Share, Download, Files (faltan dos campos de Teseo, Tribunal y Mención a doctor europeo). En todo caso, el modelo de registro de TDX es en conjunto mucho más completo que Teseo y lo supera en especial en el apartado de interoperabilidad. El campo Download de TDX soporta ocho formatos: DIDLMARCMARC_CCUCMETSOAI_DCOREQDCRDF, lo que lo convierte en un repositorio altamente interoperable, es decir, que sus contenidos podrán ser recolectados (replicados, exportados) a un gran número de proveedores de servicios bibliográficos.

En nuestra universidad se están haciendo importantes esfuerzos para mejorar la difusión y acceso al “conocimiento” y en esta dirección se encamina el Deusto Knowledge Hub (DKH): http://dkh.deusto.es/en/community/thesis/tesis. A lo largo de 2013 se han introducido 606 registros de las tesis doctorales defendidas en la universidad desde 2004.  Si nos fijamos en el registro antes consultado en Teseo, vemos que ahora se podría añadir el localizador a DKH (aunque todavía Teseo no lo ha incorporado):

En la versión actual, DKH reproduce los contenidos de Teseo. Pero los datos deberían fluir en el sentido opuesto, sacando partido de los formatos interoperables y protocolos de recolección; y en este terreno DKH (que solo soporta RSS y RDF) tendrá que dotarse de mayor funcionalidad (vg. METSOAI_DCORE), permitendo, por ejemplo, que sus datos sean recolectados por el repositorio europeo DART (siguiendo el  modelo TDX, que suponemos pronto adoptará también Teseo).

Referencias

¿Cómo encontrar el quartile de una revista?

Hoy tenía que enviar una ficha con el número de publicaciones que nuestro grupo espera producir este año. En el apartado de artículos la ficha demanda:

“Artículos en revista ISI (indicar cuartil)”

 

ISI Web of knowledge¿Y eso cómo se hacía? (No me refiero a publicar en Q1 sino simplemente a obtener el dato para la ficha.) He realizado el ejercicio (guiado de la mano de mi colega y amigo Josuka) y lo apuno, ya que volveré a tener que repetirlo cualquier día de estos (solo preguntando a Google no había llegado muy lejos). Siguiendo estos pasos averiguaremos si la revista que buscamos está en el índice JCR y el cuartil que tiene asignado: Continue reading

Canonical knowledge (derived from Wikipedia)

‘Canonical knowledge’ it is not a canonical concept so far, or at least there is not enough scholarly production that can be put forward to support it. Therefore, it could not be a DBpedia entity, since it cannot be the topic of a Wikipedia article (which are the source of DBpedia entities). The picture below represents the LOD cloud, that is, a collection of linked and open datasets hosted at Comprehensive Knowledge Archive Network (CKAN). In the very center of the cloud is DBpedia’s dataset.

 

Open data cloud

LOD cloud diagram

As an interpretation of this diagram, I will claim that data contained in the cloud are becoming canonical data, just because they occupy the place they occupy, i.e. just because they are hosted at the DataHub from the Open Knowledge Foundation. I will also allege that a correct combination of such canonical data becomes canonical knowledge, as it may be illustrated by this example of data mashup made by SIG.MA. Continue reading

A ciencia abierta: iniciativas internacionales que catapultan el conocimiento

“La universidad más rica del mundo no puede afrontar el elevado coste de las revistas científicas de su biblioteca” escribía el 24 abril de 2012 Robert T. Gonzalez para la publicación electrónica io9. Pocos días antes el consejo académico de la Universidad de Harvard había emitido un comunicado en el que acusaba a las editoriales de estar haciendo de la comunicación académica un medio insostenible y elitista. Con un presupuesto anual de 3,7 millones de dólares para el conjunto de las suscripciones y costes superiores a 40.000 dólares por año de algunas cabeceras, denunciaba asimismo que el acceso por web se hubiera incrementado en un 145% en los últimos seis años. El comunicado concluía que “es insostenible mantener la suscripción de las principales revistas y, en particular, de sus ediciones electrónicas”. Consecuentemente, Harvard recomendaba a sus investigadores que enviaran sus trabajos a revistas de acceso abierto y renunciaran a formar parte de los comités científicos de las revistas que no permitieran el acceso abierto.

OpenSciencePSB

Continue reading

El traductor del Gobierno Vasco

El martes 28 de febrero de 2012 por fin se presentó el traductor automático del Gobierno Vasco y como era de esperar se han suscitado multitud de comentarios, en general negativos. En mi calidad de participante en el desarrollo y estudioso de la disciplina, deseo aportar información acerca de tres aspectos fundamentales: la calidad, la oportunidad y la propiedad. Empezaré por el tercero, que considero el más relevante. Continue reading

Textos cautivos, contenidos perdidos

Libros en la bibliotecaSiento lástima por los textos cautivos. Trato de rescatarlos del olvido siempre que puedo. Lo intento por lo menos con los que considero más útiles o me resultan más necesarios, y lamentablemente son muy muy pocos. Ni de lejos llego a abarcar una mínima parte de los que quisera retener. Se trata de un proceso laborioso y sujeto a múltiples cortapisas. Continue reading

Cuanto más uso Facebook, más valoro Delicious

Cuento más tiempo pierdo (o gano, no estoy seguro) en Facebook, más echo de menos funciones de otras herramientas 2.0, en paticular de Delicious, GoogleReader y FriendFeed.

De estas tres herramientas (Delicious, GoogleReader y FriendFeed) la que menos se ha visto afectada por mi nueva adicción ha sido sin duda Delicious, que sigue siendo el principal apoyo documental de mi actividad en la red. (Por este motivo insisto tanto a mis alumnos—con resultados desiguales— que deben adquirir el hábito de usar Delicious).

Continue reading

Open Data: ocasión piripintada para la innovación vasca

El viernes 19 de febrero, con motivo de la jornada Bazkaria 2010, en un taller sobre open data y reutilización, el director de Atención Ciudadana del Gobierno Vasco, Alberto Ortíz de Zárate (@alorza), explicó en tres palabras el proyecto de apertura de datos de la administración vasca.

Continue reading

University library 3.0

We will be celebrating in two weeks time (January 27)  the first anniversary of our new University library. It is a good occasion for a quick evaluation of the impact in the university life and I’m going to do so with a vision of future online access to scholarly content. In particular, I will mention the efforts that are being carried out in order to make the new library a true library 2.0, but I will also suggest how to go beyond the 2.0 model so as to approach a much more effective 3.0 model.

Library 3.0

Continue reading

Indización semántica de textos

Mi compañera de Departamento, Carmen Isasi, me ha propuesto esta mañana un “desafío intelectual” 😉 que encaja directamente con un tema que me tiene ocupado desde hace un tiempo. Ella lo plantea como una tarea dentro de un proyecto de edición digital, relacionada con la indización de textos de un corpus anotado. Continue reading