« Older Home
Loading Newer »

Language Resources 2009-10 best contributions

Since I will not take this (or previous experiences) to any venue on Innovation in Education (eg. ICERI2010 or the like), this post will include some of the best materials students have produced this year in Language Resources (09-10), for people that may benefit from them.

lr0910post

[slideshare id=4043934&doc=presentacininfor-100510190806-phpapp02]

Best slides presentations (15% of grade):

Best Twitter #lr0910 particitaption (15% of grade):

Best bookmark collection at Delicious (30% of  grade):

Best reviews (40% of grade):

There are more very good contributions. This is just a small selection. Congratulations to all of them.

http://wiki.littera.deusto.es/en/index.php/User:2aicaban

tag Tags: , ,

Cuanto más uso Facebook, más valoro Delicious

Cuento más tiempo pierdo (o gano, no estoy seguro) en Facebook, más echo de menos funciones de otras herramientas 2.0, en paticular de Delicious, GoogleReader y FriendFeed.

De estas tres herramientas (Delicious, GoogleReader y FriendFeed) la que menos se ha visto afectada por mi nueva adicción ha sido sin duda Delicious, que sigue siendo el principal apoyo documental de mi actividad en la red. (Por este motivo insisto tanto a mis alumnos—con resultados desiguales— que deben adquirir el hábito de usar Delicious).

Continuar leyendo ‘Cuanto más uso Facebook, más valoro Delicious’

tag Tags: , , , , , ,

Interoperabilidad, reputación y superabundancia

Tengo la primera versión de mi curriculum 2.0.

Lo estoy preparando porque de web 2.0 y redes sociales sé bastante (y no sólo por experiencia, también por investigación) y me he enterado de que buscan a gente como yo.

No es un curriculum completo; sólo hablo de mi experiencia en este campo. Compruebo además que he hablado poco de ello (en foros académicos o científicos), así que aprovecho la ocasión para hacer una prueba.

Habría elaborado el texto usando mi herramienta favorita (MediaWiki), pero esta vez he usado Google Docs, porque en Deusto podemos compartir documentos con Google Apss y se prestaba mejor para la ocasión.

Lo más interesante del texto son las conclusiones: interoperabilidad, reputación y superabundancia. Lo explico en el extracto que copio y pego:

Continuar leyendo ‘Interoperabilidad, reputación y superabundancia’

tag Tags: , , , , , , , , ,

Open Data: ocasión piripintada para la innovación vasca

El viernes 19 de febrero, con motivo de la jornada Bazkaria 2010, en un taller sobre open data y reutilización, el director de Atención Ciudadana del Gobierno Vasco, Alberto Ortíz de Zárate (@alorza), explicó en tres palabras el proyecto de apertura de datos de la administración vasca.

Fue una suerte asistir al taller, que voy a resumir con las siguientes valoraciones:

  1. La iniciativa crea una excelente oportunidad para que pymes (y no pymes) especializadas en desarrollo de software, así como centros de investigación y formación de Euskadi aprovechen los datos liberados para innovar (vg. desafío @AbreDatos): dotando de contenidos a sus aplicaciones o construyendo nuevas basadas en ellos (mashups). El caso de Parlio (de LinkingPaths) es paradigmático, como el propio Ortiz de Zárate hizo notar; pero un rápido repaso a las empresas participantes en Bazkaria da idea del gran revulsivo que la iniciativa puede generar en el sector, sobre todo en la parte especializada en turismo y servicios ciudadanos (ver más abajo la lista de datos que se van a liberar próximamente).
  2. En el taller quedó muy clara la diferencia entre dato y documento, así como la modernidad del primero y la creciente vetustez del segundo (en lo que a la gestión del conocimiento se refiere). Ortiz de Zárate puso como ejemplo las dificultades iniciales que la interpretación de la Ley 37/2007 en la que se basa el acuerdo del Consejo de Gobierno del 29 de diciembre de 2009 provocaron, porque dicha ley se refiere en todo momento a la “accesibilidad y reutilización de documentos públicos”, y no a los datos. Hay que decir que el acuerdo del Gobierno Vasco en este punto es clarividente: “Actualmente la práctica totalidad de la información pública está en formato electrónico, por lo que ofrecer directamente los datos, en lugar de elaborar documentos, es la opción más abierta y más eficiente. En un esquema así la Administración no es responsable de generar costosos documentos personalizados para cada solicitud de un ciudadano, sino que se hace responsable de filtrar los datos sometidos a protección, garantizar la calidad y vecidad de los datos facilitados, almacenarlos y suministrarlos de forma ágil, y disponer de sistemas que permitan que otros sistemas los reutilicen.”
  3. Entre las dos opciones de si liberar los datos con o sin semántica (tal como Ortiz de Zárate plantea en su blog Administraciones en red),  me decanto por la primera: liberar los datos tan pronto estén disponibles, aunque con un matiz. La Administración debería premiar a los usuarios que tras procesar los datos los ofrezcan a su vez en formatos interoperables (XML, RDF, RDFa, etc.). Asimismo, en las convocatorias de fomento a la investigación o innovación, debería discriminar positivamente entre los proyectos que tengan como objetivo añadir semántica a los datos, o que aporten medios para vincularlos. La Administración no debe ella misma embarcarse en semejantes tareas, ni el valor añadido de la semántica justifica demoras en la liberación. Los desarrolladores saben perfectamente cómo aprovechar la semántica implícita de los datos, aunque estos se liberen en formatos simples, pero no menos eficaces e interoperables, como CSV.
  4. Un cuarto punto del taller fue el debate sobre el tipo de licencia. Ortiz de Zárate explicó la decisión de liberar los datos bajo licencia CC-BY. Los componentes del taller peguntamos por qué no se había incluido la condición SA (share alike), que hace vírica la licencia, al obligar a que los datos derivados sean asimismo libres. Pero la administración vasca no quiere poner ningún tipo de cortapisas al uso de los datos liberados. Por mi parte no hay mucho que objetar; además estoy convencido de que las prácticas abiertas a la larga triunfan sobre las restrictivas.
  5. En quinto y último lugar también se discutió los límites legales del acuerdo marcados por las leyes de Protección de datos (15/1999) y de Propiedad intelectual (1/1996). El acuerdo resuelve estas limitaciones con una escueta fórmula: “El Gobierno se compromete a una efectiva apertura de los datos públicos que obran en su poder, entendiendo como tales todos aquellos no sujetos a restricciones de privacidad, seguridad o propiedad.”

El compromiso es liberar cinco tipos de datos antes de abril 2010:

  • Empresariales y mercantiles (patentes y marcas, concursos públicos…)
  • Geográficos (fotos aéreas, redes de geodesía, datos hidrográficos…). GeoEuskadi ya ofrece ortofotos, modelos digitales del terreno y cartografía.
  • Metereológicos
  • De transporte (congestiónes de tráfico, vías en obras, transporte público, registro de vehículos)
  • Legales (resoluciones de tribunales, legislación nacional, tratados)
  • Sociales (estadísticas varias)

Como aportación personal a esta excelente iniciativa, me gustaría añadir:

  • Urge liberar asimismo datos culturales públicos (lingüísticos, documentales, educativos e incluso literarios), como se ha expuesto ya en algunos foros (Askatu Datuak, CVI).
  • Corresponde también extender la iniciativa a otros ámbitos, concretamente a los resultados del trabajo académico y de la investigación, en un porcentaje muy elevado sufragado con fondos públicos pero que son cautivos de la industria editorial. Cabe mencionar en este sentido la iniciativa Open Access.

Alberto Ortiz de Zárate (23 de enero 2010). Proyecto apertura de los datos públicos | open data euskadi. Administraciones en red. Consultado el 23 de febrero de 2010 en http://eadminblog.net/post/2010/01/23/proyecto-apertura-de-los-datos-publicos-open-data-euskadi

Open Data. (2010, February 21). In Wikipedia, The Free Encyclopedia. Retrieved 10:43, February 24, 2010, from http://en.wikipedia.org/w/index.php?title=Open_Data&oldid=345483294

Open access (publishing). (2010, February 20). In Wikipedia, The Free Encyclopedia. Retrieved 10:43, February 24, 2010, from http://en.wikipedia.org/w/index.php?title=Open_access_(publishing)&oldid=345272148

tag Tags: , , , , , , , , ,

University library 3.0

We will be celebrating in two weeks time (January 27)  the first anniversary of our new University library. It is a good occasion for a quick evaluation of the impact in the university life and I’m going to do so with a vision of future online access to scholarly content. In particular, I will mention the efforts that are being carried out in order to make the new library a true library 2.0, but I will also suggest how to go beyond the 2.0 model so as to approach a much more effective 3.0 model.

Library 3.0

Actions taken to become 2.0 fall under the scope of a consultancy firm, that cooperates with the University’s own computing service. My proposals to approach a 3.0 model would need partnership with research teams (inside or outside the Univeristy) specialized on knowledge extraction and language engineering.

Beyond library 2.0

Last year I discussed library 2.0 in three venues (see posts  Deusto’s new Library 2.0 and My beautiful library V):

My colleague Lorena Fernández (who is the person in charge of the project, from the University’s computing office) assisted to the third, but missed the first. Shame! She has written a couple of posts on the topic: Catálogos caseros en la nube (2010.01.03) and Día de la Biblioteca (2009.10.24). In the former she reviews aNobii and LibraryThing, two well known social bookmarking tools for books. This shows she is looking at common 2.0 facilities, which is great. But I need to express my own wishes beyond 2.0:

  1. Digitalization of the library’s exclusive book collection and UD journals: yes, why not?, in cooperation with GoogleBooks. Deusto already has a corporative license to use Google apps, so why not extend that agreement further?
  2. Rendering of digitalized text into XML/TEI and RDF. This will need some explanation, but basically it means that the digitalized text goes beyond mere plain ASCII text
  3. Named entity and specialized term extraction
  4. Mapping of those terms into folksonomies and taxonomies (i.e. catalogs)
  5. Mapping of taxonomies into relevant ontologies, eg. DBpedia
  6. Automatic reference extraction (eg. into BibTeX format, as GoogleScholar does)
  7. Automatic cross-reference, as CiteSeer, DBLP, WoK, and others do
  8. Croos-reference extraction from those services
  9. Integration into local reference management software (eg. ZOTERO), or user’s own online services (Citeulike, Bibsonomy, Connotea)
  10. Integration of GoogleScholar
  11. Development of a scholarly knowledge fragmentation tool
  12. Scientific conversation on the cloud

I’m going to explain now briefly what I mean for the scholarly or scientific knowledge fragmentation tool.

The Twitter lesson

We have learned from Twitter many things recently, but to me one of the most relevant things is that short texts are more efficient on the web than longer ones: shorter is better on the web.

Now there is a growing family of new short texts genres on the web including:

These are particularly well suited for the Linking Data project, which is very interesting. But I’m going to talk about their effect on a new trend of scientific conversation, which is in debt with Twitter.

Dynamic scientific discourse

What we are about to see in the near future is a new form of scientific discourse emerging from scientific snippets or tweets, much as there emerge conversations on the twittersphere.

In order to achieve such a conversation we will need to fragment scholarly papers and articles into more suitable knowledge pieces or atoms. Such atoms should include not only the content (sentences would be candidates for such atomic units) but also contextual metadata (author, title, date, publication, eg. as in Dublin Core) as well as cross-references (who quotes who, why and how, as in CiteSeer).

After fragmentation, we would  just let them fly and reach the conceptual cloud, a global cloud of knowledge tweets in which a global scientific conversation will take place.


tag Tags: , , , , , , , , , , ,

Amma Darko con Letras africanas en Deusto

De la mano de Casa África, dentro del programa Letras africanas, el viernes 18 de diciembre la escritora ghanesa Amma Darko mantuvo una animada charla con alumnos de grado y posgrado de la Facultad de Ciencias Sociales y Humanas de la Universidad de Deusto.

Continuar leyendo ‘Amma Darko con Letras africanas en Deusto’

tag Tags: , , ,

Indización semántica de textos

Mi compañera de Departamento, Carmen Isasi, me ha propuesto esta mañana un “desafío intelectual” ;-) que encaja directamente con un tema que me tiene ocupado desde hace un tiempo. Ella lo plantea como una tarea dentro de un proyecto de edición digital, relacionada con la indización de textos de un corpus anotado. Continuar leyendo ‘Indización semántica de textos’

tag Tags: , , , ,

The 7th International Conference on Language Resources and Evaluation

Nicoletta Calzolari (@dblp) has invited me again to serve on the scientific committee for the 7th International Conference on Language Resources and Evaluation in 2010. Continuar leyendo ‘The 7th International Conference on Language Resources and Evaluation’

tag Tags: , , , ,

Linking data in the Twittsphere

For  a couple of weeks I’ve been twitting (and tweeting) more than usual, because

  1. I’m helping in both Transket‘s and Natouring‘s communication campaigns
  2. I’m trying to understand better when (and how) to use Facebook,  FriendFeed, Delicious, Yammer or Twitter (I also blog and wiki, but these I know when and how).
  3. I’m introducing my students into Twitter, after having introduced them into CiteULike, Delicious; before we go into FriendFeed and GoogleReader. (I’m sorry I’ve given up Twine and Gnoss for the moment; interesting but not fluent). Continuar leyendo ‘Linking data in the Twittsphere’

tag Tags: , , , , , , , , , , , , , , , ,

Hashtags y thought-streaming en tiempo real sobre la Web

Durante la clase del viernes voy a exponer los conceptos hashtag y thought-streaming que podríamos traducir de la siguiente forma:

tag Tags: , , , , ,


RSS delicious/tag/translation

Nube de tags