Author Archives: Joseba Abaitua

Los repositorios de tesis doctorales y el acceso al conocimiento: ¿hacemos bien las cosas?

Este año he asistido a varias defensas de tesis de compañeros de universidad y en algunos casos he tenido acceso privilegiado a los textos. Siempre que se ha suscitado el tema, he animado a que la copia digital se publicase tan pronto fuera posible (en el repositorio correspondiente), no solo para que el resto de investigadores tengan acceso, sino sobre todo para poder citar la nueva fuente e incrementar su divulgación e impacto científico.

Sin embargo, pese a que la Web cumple ya dos décadas, los procedimientos de publicación de tesis doctorales no están todavía resueltos (como han apuntado entre otros Rodríguez-Yunta 2010), aunque hay avances significativos. En España existe una base de datos del Ministerio, Teseo, que almacena la información documental de todas las tesis que se defienden en el país. Pero las copias digitales no cuelgan de este servicio, sino que, en su caso, hay que buscarlas en los repositorios de las respectivas universidades y a veces Teseo omite el enlace a la universidad (como se ve en 2):

  1. Tomás Faci, Guillermo(2013). LA ORGANIZACIÓN DEL TERRITORIO Y LAS DINÁMICAS SOCIALES EN RIBAGORZA DURANTE LA GRAN EXPANSIÓN MEDIEVAL (1000-1300)
  2. Gómez Seibane, Sara (2008). CONCORDANCIAS DE GÉNERO EN DOCUMENTACIÓN VIZCAÍNA. SIGLOS XV-XVI

Las cosas están evolucionando con rapidez y así por ejemplo en Cataluña hay una iniciativa de tesis doctorales en xarxa (TDX) que trasciende ya el propio ámbito político y lingüístico catalán, sumando otras universidades como las de Cantabria, Oviedo, o Murcia (véase también el reconocimiento internacional de Díaz Rodríguez y Sánchez Tarragó, 2010). Una propiedad destacable de TDX es que el catálogo se nutre directa y automáticamente de los repositorios de las universidades participantes.  A su vez TDX nutre a otros repositorios más generales, entre los que destaca el repositorio europeo de tesis doctorales DART. Veamos un ejemplo:

Es muy interesante analizar la estructura de datos del registro TDX, algo distinta a la de Teseo, y dotada de quince campos: Title, Author, Director, Department, Abstract (en tres idiomas), Date of defense, Copyright deposit, ISBN, Keywords, Subjects, Knowledge area, Rights, Share, Download, Files (faltan dos campos de Teseo, Tribunal y Mención a doctor europeo). En todo caso, el modelo de registro de TDX es en conjunto mucho más completo que Teseo y lo supera en especial en el apartado de interoperabilidad. El campo Download de TDX soporta ocho formatos: DIDLMARCMARC_CCUCMETSOAI_DCOREQDCRDF, lo que lo convierte en un repositorio altamente interoperable, es decir, que sus contenidos podrán ser recolectados (replicados, exportados) a un gran número de proveedores de servicios bibliográficos.

En nuestra universidad se están haciendo importantes esfuerzos para mejorar la difusión y acceso al “conocimiento” y en esta dirección se encamina el Deusto Knowledge Hub (DKH): http://dkh.deusto.es/en/community/thesis/tesis. A lo largo de 2013 se han introducido 606 registros de las tesis doctorales defendidas en la universidad desde 2004.  Si nos fijamos en el registro antes consultado en Teseo, vemos que ahora se podría añadir el localizador a DKH (aunque todavía Teseo no lo ha incorporado):

En la versión actual, DKH reproduce los contenidos de Teseo. Pero los datos deberían fluir en el sentido opuesto, sacando partido de los formatos interoperables y protocolos de recolección; y en este terreno DKH (que solo soporta RSS y RDF) tendrá que dotarse de mayor funcionalidad (vg. METSOAI_DCORE), permitendo, por ejemplo, que sus datos sean recolectados por el repositorio europeo DART (siguiendo el  modelo TDX, que suponemos pronto adoptará también Teseo).

Referencias

¿Cómo encontrar el quartile de una revista?

Hoy tenía que enviar una ficha con el número de publicaciones que nuestro grupo espera producir este año. En el apartado de artículos la ficha demanda:

“Artículos en revista ISI (indicar cuartil)”

 

ISI Web of knowledge¿Y eso cómo se hacía? (No me refiero a publicar en Q1 sino simplemente a obtener el dato para la ficha.) He realizado el ejercicio (guiado de la mano de mi colega y amigo Josuka) y lo apuno, ya que volveré a tener que repetirlo cualquier día de estos (solo preguntando a Google no había llegado muy lejos). Siguiendo estos pasos averiguaremos si la revista que buscamos está en el índice JCR y el cuartil que tiene asignado: Continue reading

Canonical knowledge (derived from Wikipedia)

‘Canonical knowledge’ it is not a canonical concept so far, or at least there is not enough scholarly production that can be put forward to support it. Therefore, it could not be a DBpedia entity, since it cannot be the topic of a Wikipedia article (which are the source of DBpedia entities). The picture below represents the LOD cloud, that is, a collection of linked and open datasets hosted at Comprehensive Knowledge Archive Network (CKAN). In the very center of the cloud is DBpedia’s dataset.

 

Open data cloud

LOD cloud diagram

As an interpretation of this diagram, I will claim that data contained in the cloud are becoming canonical data, just because they occupy the place they occupy, i.e. just because they are hosted at the DataHub from the Open Knowledge Foundation. I will also allege that a correct combination of such canonical data becomes canonical knowledge, as it may be illustrated by this example of data mashup made by SIG.MA. Continue reading

A ciencia abierta: iniciativas internacionales que catapultan el conocimiento

“La universidad más rica del mundo no puede afrontar el elevado coste de las revistas científicas de su biblioteca” escribía el 24 abril de 2012 Robert T. Gonzalez para la publicación electrónica io9. Pocos días antes el consejo académico de la Universidad de Harvard había emitido un comunicado en el que acusaba a las editoriales de estar haciendo de la comunicación académica un medio insostenible y elitista. Con un presupuesto anual de 3,7 millones de dólares para el conjunto de las suscripciones y costes superiores a 40.000 dólares por año de algunas cabeceras, denunciaba asimismo que el acceso por web se hubiera incrementado en un 145% en los últimos seis años. El comunicado concluía que “es insostenible mantener la suscripción de las principales revistas y, en particular, de sus ediciones electrónicas”. Consecuentemente, Harvard recomendaba a sus investigadores que enviaran sus trabajos a revistas de acceso abierto y renunciaran a formar parte de los comités científicos de las revistas que no permitieran el acceso abierto.

OpenSciencePSB

Continue reading

El traductor del Gobierno Vasco

El martes 28 de febrero de 2012 por fin se presentó el traductor automático del Gobierno Vasco y como era de esperar se han suscitado multitud de comentarios, en general negativos. En mi calidad de participante en el desarrollo y estudioso de la disciplina, deseo aportar información acerca de tres aspectos fundamentales: la calidad, la oportunidad y la propiedad. Empezaré por el tercero, que considero el más relevante. Continue reading

How to write quality blog-posts? (for WCT, but not only)

My students have to write blog-posts that fulfill  the following quality requirements: focus, relevance, documentation and correctness. These four elements have to be understood in the context of a university course and are therefor influenced by general academic standards, particularly the last two (and are not usually considered by other blogging advisers such as Darren Rowse or  2008). Nevertheless, my recommendations may prove useful to any kind of blogger: Continue reading

Identidad y reputación digitales frente al derecho a la privacidad de los estudiantes

Estudiar en DeustoLa Universidad de Deusto ha aprobado recientemente una norma oficial para la protección de datos de los estudiantes que todavía no conozco en todos sus detalles.

El caso es que este curso varios de mis alumnos han expresado inquietud y disconformidad con el uso de espacios públicos para el desarrollo de sus actividades académicas. A algunos no les gusta que sus trabajos de clase estén públicamente expuestos en internet.

El problema es que la asignatura en cuestión trata precisamente de eso: Sistemas de comunicación Web y abarca cuatro apartados: Continue reading

Textos cautivos, contenidos perdidos

Libros en la bibliotecaSiento lástima por los textos cautivos. Trato de rescatarlos del olvido siempre que puedo. Lo intento por lo menos con los que considero más útiles o me resultan más necesarios, y lamentablemente son muy muy pocos. Ni de lejos llego a abarcar una mínima parte de los que quisera retener. Se trata de un proceso laborioso y sujeto a múltiples cortapisas. Continue reading

Extracción de información (el caso DBpedia)

Esta semana arranca una nueva asignatura con un sugerente título, Information Management. En julio preparé la guía y ahora la estoy adaptando para las clases recogiendo la experiencia del semestre pasado (Web Communication) e introduciendo ideas que me han venido a la cabeza en las últimas semanas.Mapa conceptual

Continue reading