Author Archives: Joseba Abaitua

Los repositorios de tesis doctorales y el acceso al conocimiento: ¬Ņhacemos bien las cosas?

Este a√Īo he asistido a varias defensas de tesis de compa√Īeros de universidad y en algunos casos he tenido acceso privilegiado a los textos. Siempre que se ha suscitado el tema, he animado a que la copia digital se publicase tan pronto fuera posible (en el repositorio correspondiente), no solo para que el resto de investigadores tengan acceso, sino sobre todo para poder citar la nueva fuente e incrementar su divulgaci√≥n e impacto cient√≠fico.

Sin embargo, pese a que la Web cumple ya dos d√©cadas, los procedimientos de publicaci√≥n de tesis doctorales no est√°n todav√≠a resueltos (como han apuntado entre otros Rodr√≠guez-Yunta 2010), aunque hay avances significativos.¬†En Espa√Īa existe una base de datos del Ministerio, Teseo, que almacena la informaci√≥n documental de todas las tesis que se defienden en el pa√≠s. Pero las copias digitales no cuelgan de este servicio, sino que, en su caso, hay que buscarlas en los repositorios de las respectivas universidades y a veces Teseo omite el enlace a la universidad (como se ve en 2):

  1. Tom√°s Faci, Guillermo(2013).¬†LA ORGANIZACI√ďN DEL TERRITORIO Y LAS DIN√ĀMICAS SOCIALES EN RIBAGORZA DURANTE LA GRAN EXPANSI√ďN MEDIEVAL (1000-1300)
  2. G√≥mez Seibane, Sara (2008).¬†CONCORDANCIAS DE G√ČNERO EN DOCUMENTACI√ďN VIZCA√ćNA. SIGLOS XV-XVI

Las cosas est√°n evolucionando con rapidez y as√≠ por ejemplo en Catalu√Īa hay una iniciativa de tesis doctorales en xarxa (TDX)¬†que trasciende ya el propio √°mbito pol√≠tico y ling√ľ√≠stico catal√°n, sumando otras universidades como las de Cantabria, Oviedo, o Murcia¬†(v√©ase tambi√©n el reconocimiento internacional de¬†D√≠az Rodr√≠guez y S√°nchez Tarrag√≥, 2010). Una propiedad destacable de TDX es que el cat√°logo se nutre directa y autom√°ticamente de los repositorios de las universidades participantes. ¬†A su vez TDX nutre a otros repositorios m√°s generales, entre los que destaca el repositorio europeo de tesis doctorales DART. Veamos un ejemplo:

Es muy interesante analizar la estructura de datos del registro TDX, algo distinta a la de Teseo, y dotada de quince campos: Title, Author, Director, Department, Abstract (en tres idiomas), Date of defense, Copyright deposit, ISBN, Keywords, Subjects, Knowledge area, Rights, Share, Download, Files¬†(faltan dos campos de Teseo,¬†Tribunal y Menci√≥n a doctor europeo). En todo caso, el modelo de registro de TDX es en conjunto mucho m√°s completo que Teseo y lo supera en especial en el apartado de interoperabilidad. El campo¬†Download de TDX¬†soporta ocho formatos: DIDL,¬†MARC,¬†MARC_CCUC,¬†METS,¬†OAI_DC,¬†ORE,¬†QDC,¬†RDF, lo que lo convierte en un repositorio altamente interoperable, es decir, que sus contenidos podr√°n ser recolectados (replicados, exportados) a un gran n√ļmero de proveedores de servicios bibliogr√°ficos.

En nuestra universidad se est√°n haciendo importantes esfuerzos para mejorar la difusi√≥n y acceso al “conocimiento” y en esta direcci√≥n se encamina el Deusto Knowledge Hub (DKH):¬†http://dkh.deusto.es/en/community/thesis/tesis. A lo largo de 2013 se han introducido 606 registros de las tesis doctorales defendidas en la universidad desde 2004. ¬†Si nos fijamos en el registro antes consultado en Teseo, vemos que ahora se podr√≠a a√Īadir el localizador a DKH (aunque todav√≠a Teseo no lo ha incorporado):

En la versión actual, DKH reproduce los contenidos de Teseo. Pero los datos deberían fluir en el sentido opuesto, sacando partido de los formatos interoperables y protocolos de recolección; y en este terreno DKH (que solo soporta RSS y RDF) tendrá que dotarse de mayor funcionalidad (vg. METS, OAI_DC, ORE), permitendo, por ejemplo, que sus datos sean recolectados por el repositorio europeo DART (siguiendo el  modelo TDX, que suponemos pronto adoptará también Teseo).

Referencias

¬ŅC√≥mo encontrar el quartile de una revista?

Hoy ten√≠a que enviar una ficha con el n√ļmero de publicaciones que nuestro grupo espera producir este a√Īo. En el apartado de art√≠culos la ficha demanda:

“Art√≠culos en revista ISI (indicar cuartil)”

 

ISI Web of knowledge¬ŅY eso c√≥mo se hac√≠a? (No me refiero a publicar en Q1 sino simplemente a obtener el dato para la ficha.) He realizado el ejercicio (guiado de la mano de mi colega y amigo Josuka) y lo apuno, ya que volver√© a tener que repetirlo cualquier d√≠a de estos (solo¬†preguntando a Google no hab√≠a llegado muy lejos). Siguiendo estos pasos averiguaremos si la revista que buscamos est√° en el √≠ndice JCR y el cuartil que tiene asignado: Continue reading

Canonical knowledge (derived from Wikipedia)

‘Canonical knowledge’ it is not a canonical concept so far, or at least there is not enough scholarly production that can be put forward to support it.¬†Therefore, it could not be a DBpedia entity, since¬†it cannot be the topic of a¬†Wikipedia article¬†(which are the source of DBpedia entities). The picture below represents the LOD cloud, that is, a collection of linked and open¬†datasets hosted at¬†Comprehensive Knowledge Archive Network¬†(CKAN). In the very center of the cloud is DBpedia’s dataset.

 

Open data cloud

LOD cloud diagram

As an interpretation of this diagram, I will claim that data contained in the cloud are becoming canonical data, just because they occupy the place they occupy, i.e. just because they are hosted at the DataHub from the Open Knowledge Foundation. I will also allege that a correct combination of such canonical data becomes canonical knowledge, as it may be illustrated by this example of data mashup made by SIG.MA. Continue reading

A ciencia abierta: iniciativas internacionales que catapultan el conocimiento

“La universidad m√°s rica del mundo no puede afrontar el elevado coste de las revistas cient√≠ficas de su biblioteca” escrib√≠a el 24 abril de 2012¬†Robert T. Gonzalez¬†para la publicaci√≥n electr√≥nica¬†io9. Pocos d√≠as antes el consejo acad√©mico de la Universidad de Harvard hab√≠a emitido un comunicado en el que acusaba a las editoriales de estar haciendo de la comunicaci√≥n acad√©mica un medio insostenible y elitista. Con un presupuesto anual de 3,7 millones de d√≥lares para el conjunto de las suscripciones y costes superiores a 40.000 d√≥lares por a√Īo de algunas cabeceras, denunciaba asimismo que el acceso por web se hubiera incrementado en un 145% en los √ļltimos seis a√Īos. El comunicado conclu√≠a que “es insostenible mantener la suscripci√≥n de las principales revistas y, en particular, de sus ediciones electr√≥nicas”. Consecuentemente, Harvard recomendaba a sus investigadores que enviaran sus trabajos a revistas de acceso abierto y renunciaran a formar parte de los comit√©s cient√≠ficos de las revistas que no permitieran el acceso abierto.

OpenSciencePSB

Continue reading

El traductor del Gobierno Vasco

El martes 28 de febrero de 2012 por fin se presentó el traductor automático del Gobierno Vasco y como era de esperar se han suscitado multitud de comentarios, en general negativos. En mi calidad de participante en el desarrollo y estudioso de la disciplina, deseo aportar información acerca de tres aspectos fundamentales: la calidad, la oportunidad y la propiedad. Empezaré por el tercero, que considero el más relevante. Continue reading

How to write quality blog-posts? (for WCT, but not only)

My students have to write blog-posts that fulfill  the following quality requirements: focus, relevance, documentation and correctness. These four elements have to be understood in the context of a university course and are therefor influenced by general academic standards, particularly the last two (and are not usually considered by other blogging advisers such as Darren Rowse or  2008). Nevertheless, my recommendations may prove useful to any kind of blogger: Continue reading

Identidad y reputación digitales frente al derecho a la privacidad de los estudiantes

Estudiar en DeustoLa Universidad de Deusto ha aprobado recientemente una norma oficial para la protección de datos de los estudiantes que todavía no conozco en todos sus detalles.

El caso es que este curso varios de mis alumnos han expresado inquietud y disconformidad con el uso de espacios p√ļblicos para el desarrollo de sus actividades acad√©micas. A algunos no les gusta que sus trabajos de clase est√©n p√ļblicamente expuestos en internet.

El problema es que la asignatura en cuestión trata precisamente de eso: Sistemas de comunicación Web y abarca cuatro apartados: Continue reading

Textos cautivos, contenidos perdidos

Libros en la bibliotecaSiento l√°stima por los textos cautivos. Trato de rescatarlos del olvido siempre que puedo. Lo intento por lo menos con los que considero m√°s √ļtiles o me resultan m√°s necesarios, y lamentablemente son muy muy pocos. Ni de lejos llego a abarcar una m√≠nima parte de los que quisera retener. Se trata de un proceso laborioso y sujeto a m√ļltiples cortapisas. Continue reading

Extracción de información (el caso DBpedia)

Esta semana arranca una nueva asignatura con un sugerente t√≠tulo, Information Management. En julio prepar√© la gu√≠a y ahora la estoy adaptando para las clases recogiendo la experiencia del semestre pasado (Web Communication) e¬†introduciendo ideas que me han venido a la cabeza en las √ļltimas semanas.Mapa conceptual

Continue reading