{"id":365,"date":"2016-07-06T05:26:42","date_gmt":"2016-07-06T03:26:42","guid":{"rendered":"https:\/\/preblogs.deusto.es\/bigdata\/?p=365"},"modified":"2016-07-06T05:26:42","modified_gmt":"2016-07-06T03:26:42","slug":"el-big-data-en-los-papeles-de-panama-con-mar-cabra","status":"publish","type":"post","link":"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/","title":{"rendered":"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra)"},"content":{"rendered":"<p style=\"text-align: justify;\">Nada m\u00e1s hacerse p\u00fablico el caso de los <strong>Papeles de Panam\u00e1<\/strong>, escribimos <a href=\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama\/\" target=\"_blank\">un art\u00edculo<\/a> en este blog para describir c\u00f3mo\u00a0el paradigma del Big Data (con sus m\u00e9todo de trabajo del dato, sus tecnolog\u00edas,\u00a0su aproximaci\u00f3n al dato, etc.) hab\u00eda jugado un papel fundamental para ser clave y posibilitar el procesamiento de la mayor filtraci\u00f3n de la historia del periodismo (2.6 terabytes, y 11,5 millones de documentos\u00a0-Wikileaks, para que se hagan a la idea, fueron 1,7 GB \u201csolo\u201d-).<\/p>\n<p style=\"text-align: justify;\">Dado que hemos empezado ya nuestra actividad para el <a href=\"http:\/\/ingenieria.deusto.es\/cs\/Satellite\/ingenieria\/es\/facultad-ingenieria\/estudios-0\/estudios-ingenieria-formacion-continua\/programa-en-big-data-y-business-intelligence-0\/programa\" target=\"_blank\">pr\u00f3ximo lanzamiento en Oto\u00f1o de nuestro Programa de Big Data y Business Intelligence en nuestra sede de Donostia &#8211; San Sebasti\u00e1n<\/a>, quisimos organizar una jornada en la que pudi\u00e9ramos contar con una de las principales protagonistas de dicha investigaci\u00f3n. <a href=\"http:\/\/www.linkedin.com\/in\/mar-cabra-8b9bb821\" target=\"_blank\">Mar Cabra<\/a>, que ha desarrollado su carrera alrededor del periodismo de datos y la transparencia, y que ha formado parte del <a href=\"https:\/\/www.icij.org\/\" target=\"_blank\">International Consortium of Investigative Journalists<\/a> que ha estado detr\u00e1s de la investigaci\u00f3n sobre este esc\u00e1ndalo social y moral.<\/p>\n<p style=\"text-align: justify;\">Os dejo, lo primero, <a href=\"https:\/\/docs.google.com\/presentation\/d\/1IcUkUS9imMLqo_yKq-JPPtZiKH9KFw4_jQLWED4xPPs\/edit?usp=sharing\" target=\"_blank\">su presentaci\u00f3n<\/a>, que resumo a continuaci\u00f3n:<\/p>\n<p><iframe src=\"https:\/\/docs.google.com\/presentation\/d\/1IcUkUS9imMLqo_yKq-JPPtZiKH9KFw4_jQLWED4xPPs\/embed?start=false&amp;loop=false&amp;delayms=3000\" width=\"480\" height=\"299\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p style=\"text-align: justify;\">La verdad es que Mar se\u00f1al\u00f3 muchos de los puntos cr\u00edticos que trabajamos en <a href=\"http:\/\/ingenieria.deusto.es\/cs\/Satellite\/ingenieria\/es\/big-data-0\" target=\"_blank\">nuestros Programas de Big Data y Business Intelligence<\/a>:<\/p>\n<ul>\n<li style=\"text-align: justify;\">Tuvieron <strong>muchos problemas con la calidad de los datos<\/strong>. Estaban muy \u00absucios\u00bb, y dedicaron gran cantidad del tiempo a ponerlos limpios y eficientes para su procesamiento.<\/li>\n<li style=\"text-align: justify;\">Nos introdujo las tecnolog\u00edas que han estado detr\u00e1s de la investigaci\u00f3n y c\u00f3mo han jugado un papel totalmente determinante para que fuera un \u00e9xito el proyecto. En esta entrada ya detallamos todas las tecnolog\u00edas, pero por resumir las m\u00e1s determinantes, Mar nos habl\u00f3 de\u00a0<a href=\"https:\/\/www.talend.com\/\" target=\"_blank\">Talend <\/a>como ETL, <a href=\"http:\/\/neo4j.com\/\" target=\"_blank\">NEO4J\u00a0<\/a>para almacenamiento y <a href=\"http:\/\/linkurio.us\/\" target=\"_blank\">Linkurious <\/a>para la representaci\u00f3n visual. Su expresividad y\u00a0las facilidades para el descubrimiento de conocimiento, fueron aspectos cr\u00edticos.<\/li>\n<li style=\"text-align: justify;\">Entre los 11,5 millones de documentos de la filtraci\u00f3n, pr\u00e1cticamente <strong>5 millones eran emails, 3 millones formatos de bases de datos, 2.1 millones PDFs, 1.1 millones eran im\u00e1genes y el resto, otro tipo de documentos<\/strong>. Como vemos, el grado de no-estructuraci\u00f3n de la informaci\u00f3n y los datos era tan alto, que la importancia de las tecnolog\u00edas que facilitan el procesamiento de datos no estructurados, ha sido de vital importancia.<\/li>\n<li style=\"text-align: justify;\">Nos habl\u00f3 mucho sobre c\u00f3mo la <strong>visualizaci\u00f3n resulta cr\u00edtica<\/strong> para que la gente luego entienda el conocimiento hallado de una manera bastante resumida y \u00e1gil. En la visualizaci\u00f3n que han realizado en colaboraci\u00f3n con The Guardian, destac\u00f3\u00a0The Power Players, que pod\u00e9is <a href=\"http:\/\/panamapapers.icij.org\/the_power_players\/\" target=\"_blank\">consultar aqu\u00ed<\/a>.<\/li>\n<li style=\"text-align: justify;\">No solo se trata de la mayor filtraci\u00f3n de la historia del periodismo, sino tambi\u00e9n de <strong>la mayor colaboraci\u00f3n de la historia del periodismo<\/strong>. La importancia que ha tenido el haber compartido datos dentro del marco de un consorcio, trabajando con una tecnolog\u00eda de red social abierta, ha sido cr\u00edtica. Se han evitado los silos de datos, clave para que se pudieran compartir los documentos del despacho Mossack Fonseca.<\/li>\n<li style=\"text-align: justify;\">Las tecnolog\u00edas de bases de datos de grafos les han permitido una navegaci\u00f3n por la informaci\u00f3n tan\u00a0eficiente, que han sido capaces de procesar en meses lo que de otra manera les hubiera llevado a\u00f1os. De esto ya hablamos en<a href=\"https:\/\/blogs.deusto.es\/bigdata\/bases-de-datos-nosql-de-grafos-mejor-rendimiento-para-grandes-volumenes-de-datos\/\" target=\"_blank\"> una entrada anterior<\/a>. Ella lo llam\u00f3 \u00abmagia\u00bb destacando lo siguiente (literal):\n<ul>\n<li style=\"text-align: justify;\"><em>Hago clicks en \u201cpuntos\u201d y encuentro historias!<\/em><\/li>\n<li style=\"text-align: justify;\"><em>Descubro nuevos nombres con las b\u00fasquedas fuzzy<\/em><\/li>\n<li style=\"text-align: justify;\"><em>Encuentra el camino m\u00e1s corto (shortest path)<\/em><\/li>\n<\/ul>\n<\/li>\n<li style=\"text-align: justify;\">Si a alguien le interesa, y quiere adentrarse en la base de datos de grafos generada y estructurada para modelizar los Papeles de Panam\u00e1, puede acceder <a href=\"https:\/\/offshoreleaks.icij.org\/pages\/database\" target=\"_blank\">aqu\u00ed<\/a>. Un ejercicio de transparencia y colaboraci\u00f3n al que Mar no paraba de invitarnos.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Para terminar, os dejo los v\u00eddeos de su intervenci\u00f3n completa, as\u00ed como la entrevista que la hicimos (que resume los puntos comentados anteriormente). Un caso, como ven, el de los Papeles de Panam\u00e1, en el que <strong>el Big Data ha aportado a la sociedad mucho<\/strong>.<\/p>\n<p><iframe src=\"https:\/\/www.youtube.com\/embed\/K4gmv1YI2yI\" width=\"560\" height=\"315\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><br \/>\n<iframe src=\"https:\/\/www.youtube.com\/embed\/AXvrQvuf5uw\" width=\"560\" height=\"315\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nada m\u00e1s hacerse p\u00fablico el caso de los Papeles de Panam\u00e1, escribimos un art\u00edculo en este blog para describir c\u00f3mo\u00a0el paradigma del Big Data (con sus m\u00e9todo de trabajo del dato, sus tecnolog\u00edas,\u00a0su aproximaci\u00f3n al dato, etc.) hab\u00eda jugado un papel fundamental para ser clave y posibilitar el procesamiento de la mayor filtraci\u00f3n de la &hellip; <a href=\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\" class=\"more-link\">Seguir leyendo <span class=\"screen-reader-text\">El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra)<\/span> <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":136,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[1],"tags":[2,3,205,263,58,198,264,4,64],"class_list":["post-365","post","type-post","status-publish","format-standard","hentry","category-sin-categoria","tag-big-data","tag-deusto","tag-linkurious","tag-mar-cabra","tag-neo4j","tag-papeles-de-panama","tag-periodismo","tag-programa-big-data","tag-talend"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.4 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data<\/title>\n<meta name=\"description\" content=\"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data\" \/>\n<meta property=\"og:description\" content=\"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\" \/>\n<meta property=\"og:site_name\" content=\"Deusto Data\" \/>\n<meta property=\"article:published_time\" content=\"2016-07-06T03:26:42+00:00\" \/>\n<meta name=\"author\" content=\"\u00c1lex Ray\u00f3n\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"\u00c1lex Ray\u00f3n\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\",\"url\":\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\",\"name\":\"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data\",\"isPartOf\":{\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/#website\"},\"datePublished\":\"2016-07-06T03:26:42+00:00\",\"author\":{\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a\"},\"description\":\"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.\",\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/\"]}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/#website\",\"url\":\"https:\/\/blogs.deusto.es\/bigdata\/\",\"name\":\"Deusto Data\",\"description\":\"Los datos de tu organizaci\u00f3n en valor\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/blogs.deusto.es\/bigdata\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a\",\"name\":\"\u00c1lex Ray\u00f3n\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"caption\":\"\u00c1lex Ray\u00f3n\"},\"url\":\"https:\/\/blogs.deusto.es\/bigdata\/author\/alex-rayon\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data","description":"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/","og_locale":"es_ES","og_type":"article","og_title":"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data","og_description":"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.","og_url":"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/","og_site_name":"Deusto Data","article_published_time":"2016-07-06T03:26:42+00:00","author":"\u00c1lex Ray\u00f3n","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"\u00c1lex Ray\u00f3n","Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/","url":"https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/","name":"El Big Data en los Papeles de Panam\u00e1 (con Mar Cabra) - Deusto Data","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#website"},"datePublished":"2016-07-06T03:26:42+00:00","author":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"description":"Un caso, como ven, el de los Papeles de Panam\u00e1, en el que el Big Data ha aportado a la sociedad mucho.","inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blogs.deusto.es\/bigdata\/el-big-data-en-los-papeles-de-panama-con-mar-cabra\/"]}]},{"@type":"WebSite","@id":"https:\/\/blogs.deusto.es\/bigdata\/#website","url":"https:\/\/blogs.deusto.es\/bigdata\/","name":"Deusto Data","description":"Los datos de tu organizaci\u00f3n en valor","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blogs.deusto.es\/bigdata\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a","name":"\u00c1lex Ray\u00f3n","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","caption":"\u00c1lex Ray\u00f3n"},"url":"https:\/\/blogs.deusto.es\/bigdata\/author\/alex-rayon\/"}]}},"_links":{"self":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/365","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/users\/136"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/comments?post=365"}],"version-history":[{"count":4,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/365\/revisions"}],"predecessor-version":[{"id":369,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/365\/revisions\/369"}],"wp:attachment":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/media?parent=365"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/categories?post=365"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/tags?post=365"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}