{"id":433,"date":"2016-09-02T08:19:50","date_gmt":"2016-09-02T06:19:50","guid":{"rendered":"https:\/\/preblogs.deusto.es\/bigdata\/?p=433"},"modified":"2016-09-02T08:19:50","modified_gmt":"2016-09-02T06:19:50","slug":"paradigma-batch-para-sistemas-big-data-i","status":"publish","type":"post","link":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/","title":{"rendered":"Paradigma batch para sistemas Big Data (I)"},"content":{"rendered":"<p style=\"text-align: justify;\">(venimos de <a href=\"https:\/\/blogs.deusto.es\/bigdata\/procesando-big-data-paradigmas-batch-tiempo-real-y-lambda\/\" target=\"_blank\">un art\u00edculo<\/a> introductorio a los tres paradigmas)<\/p>\n<p style=\"text-align: justify;\">Cuando hablamos del verdadero momento en el que <a href=\"https:\/\/blogs.deusto.es\/bigdata\/cuando-empieza-esta-era-del-big-data-mapreduce\/\" target=\"_blank\">podemos considerar nace\u00a0esta \u00abera del Big Data\u00bb<\/a>, comentamos que se puede considerar el desarrollo de MapReduce y Hadoop como las primeras \u00abtecnolog\u00edas Big Data\u00bb.\u00a0Estas tecnolog\u00edas se centraban en un enfoque de Batch Processing. Es decir, el objetivo era acumular todos los datos que se pudieran, procesarlos y producir resultados que se \u00abempaquetaban\u00bb por lotes.<\/p>\n<p style=\"text-align: justify;\">Con este enfoque, <strong>Hadoop<\/strong> ha sido la <strong>herramienta<\/strong> m\u00e1s empleada. Es una herramienta realmente buena para almacenar enormes cantidades de datos y luego poder <strong>escalarlos<\/strong> horizontalmente mientras vamos\u00a0a\u00f1adiendo nodos en nuestro cl\u00faster de m\u00e1quinas.<\/p>\n<figure id=\"attachment_462\" aria-describedby=\"caption-attachment-462\" style=\"width: 542px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-462\" src=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png\" alt=\"Big Data Batch Processing (Fuente: http:\/\/www.datasciencecentral.com\/profiles\/blogs\/batch-vs-real-time-data-processing)\" width=\"542\" height=\"206\" srcset=\"https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png 542w, https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/08\/67678-300x114.png 300w\" sizes=\"(max-width: 542px) 100vw, 542px\" \/><\/a><figcaption id=\"caption-attachment-462\" class=\"wp-caption-text\">Big Data Batch Processing (Fuente: http:\/\/www.datasciencecentral.com\/profiles\/blogs\/batch-vs-real-time-data-processing)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Como se puede apreciar en la imagen, el \u00abproblema\u00bb que aparece en este enfoque es que el <strong>retraso<\/strong> en tiempo que introduce disponer de un ETL que carga los datos para su procesamiento, no ser\u00e1 tan \u00e1gil como hacerlo de manera continua con un enfoque de tiempo real.\u00a0El <strong>procesamiento en trabajos batch de Hadoop MapReduce es el que domina en este enfoque<\/strong>. Y lo hace, apoy\u00e1ndose en todo momento de un <a href=\"https:\/\/blogs.deusto.es\/bigdata\/herramientas-etl-y-su-relevancia-en-la-cadena-de-valor-del-dato\/\" target=\"_blank\">ETL, de los que ya hablamos en este blog<\/a>.<\/p>\n<p style=\"text-align: justify;\">Hasta la fecha la gran mayor\u00eda de las organizaciones\u00a0han empleado este paradigma \u00abBatch\u00bb. No era necesaria mayor sofisticaci\u00f3n. Sin embargo, como ya comentamos anteriormente, existen\u00a0exigencias mayores. Los datos, en muchas ocasiones, deben ser procesados en tiempo real, permitiendo as\u00ed a la organizaci\u00f3n tomar decisiones inmediatamente. Esas organizaciones en las que la diferencia entre segundos y minutos s\u00ed es cr\u00edtica.<\/p>\n<p style=\"text-align: justify;\">Hadoop, en los \u00faltimos tiempos, es consciente de \u00ab<em>esta econom\u00eda de tiempo real<\/em>\u00bb en la que nos hemos instalado. Por ello, <strong>ha mejorado bastante su capacidad de gesti\u00f3n<\/strong>. Sin embargo, todav\u00eda es considerado por muchos una soluci\u00f3n demasiado r\u00edgida para algunas funciones. Por ello, hoy en d\u00eda, <strong>\u00absolo\u00bb es considerado el ideal en casos como<\/strong>:<\/p>\n<ul>\n<li style=\"text-align: justify;\">No necesita un c\u00e1lculo con una periodicidad alta (una vez al d\u00eda, una vez al de X horas, etc.)<\/li>\n<li style=\"text-align: justify;\">C\u00e1lculos que se deban ejecutar solo a final de mes (facturas de una gran organizaci\u00f3n, asientos contables, arqueos de caja, etc.)<\/li>\n<li style=\"text-align: justify;\">Generaci\u00f3n de informes con una periodicidad baja.<\/li>\n<li style=\"text-align: justify;\">etc.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Como el tema no es tan sencillo como en un art\u00edculo de este tipo podamos describir, en los \u00faltimos a\u00f1os han nacido una serie de <strong>herramientas y tecnolog\u00edas alrededor de Hadoop<\/strong> para ayudar en esa tarea de analizar grandes cantidades de datos. Para analizar las mismas -a pesar de que cada una de ellas da para un art\u00edculo por s\u00ed sola-, lo descomponemos en las cuatro etapas de la cadena de valor de un proyecto de Big Data:<\/p>\n<p style=\"text-align: justify;\"><strong>1) Ingesta de datos<\/strong><\/p>\n<p style=\"text-align: justify;\">Destacan tecnolog\u00edas como:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/flume.apache.org\/\" target=\"_blank\">Flume<\/a><\/strong>:\u00a0recolectar, agregar y mover grandes cantidades de datos desde diferentes fuentes a un data store centralizado.<\/li>\n<li style=\"text-align: justify;\"><strong>Comandos HDFS<\/strong>: utilizar los comandos propios de HDFS para trabajar con los datos gestionados en el ecosistema de Hadoop.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/sqoop.apache.org\/\" target=\"_blank\">Sqoop<\/a><\/strong>:\u00a0permitir la transferencia de informaci\u00f3n entre Hadoop y los grandes almacenes de datos estructurados (MySQL, PostgreSQL, Oracle, SQL Server,\u00a0DB2, etc.)<\/li>\n<\/ul>\n<p style=\"text-align: justify;\"><strong>2) Procesamiento de datos\u00a0<\/strong><\/p>\n<p style=\"text-align: justify;\">Destacan tecnolog\u00edas como:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong>MapReduce<\/strong>: del que ya hablamos, as\u00ed que no me extiendo.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/hive.apache.org\/\" target=\"_blank\">Hive<\/a><\/strong>: framework creado originalmente por Facebook para trabajar con el sistemas de ficheros distribuidos de Hadoop (HDFS). El objetivo no era otro que facilitar el trabajo, dado que a trav\u00e9s de sus querys SQL (HiveQL) podemos lanzar consultas que luego se traducen a trabajos MapReduce. Dado que trabajar con este \u00faltimo resultaba laborioso, surgi\u00f3 como una forma de facilitar dicha labor.<\/li>\n<li style=\"text-align: justify;\"><a href=\"https:\/\/pig.apache.org\/\"><strong>Pig<\/strong><\/a>: herramienta que facilta el an\u00e1lisis de grandes vol\u00famenes de datos a trav\u00e9s de un lenguaje de alto nivel. Su estructura permite la paralelizaci\u00f3n, que hace a\u00fan m\u00e1s eficiente el procesamiento de vol\u00famenes de datos, as\u00ed como la infraestructura necesaria para ello.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/www.cascading.org\/\" target=\"_blank\">Cascading<\/a><\/strong>:\u00a0crear y ejecutar\u00a0flujos de trabajo de procesamiento de datos en cl\u00fasteres Hadoop usando cualquier lenguaje basado en JVM (la m\u00e1quina virtual de Java). De nuevo, el objetivo es quitar la complejidad de trabajar con MapReduce y sus trabajos. Es muy empleado en entornos complejos como la bioinform\u00e1tica, algoritmos de Machine Learning, an\u00e1lisis predictivo, Web Mining y herramientas\u00a0ETL.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/spark.apache.org\/\" target=\"_blank\">Spark<\/a><\/strong>: facilita enormemente el desarrollo de programas de uso masivo de datos.\u00a0Creado en la Universidad de Berkeley, ha sido considerado el primer software de c\u00f3digo abierto que hace la programaci\u00f3n distribuida\u00a0accesible y m\u00e1s f\u00e1cil para \u00abm\u00e1s p\u00fablicos\u00bb que los muy especializados. De nuevo, aporta facilidad frente a MapReduce.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\"><strong>3) Almacenamiento de datos<\/strong><\/p>\n<p style=\"text-align: justify;\">Destacan tecnolog\u00edas como:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/hadoop.apache.org\/docs\/r1.2.1\/hdfs_design.html\" target=\"_blank\">HDFS<\/a><\/strong>: sistema de archivos de un cluster Hadoop que funciona de manera m\u00e1s eficiente\u00a0con\u00a0un\u00a0n\u00famero reducido de archivos de datos\u00a0de gran volumen, que con una cantidad superior de archivos de datos m\u00e1s peque\u00f1os.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/hbase.apache.org\/\" target=\"_blank\">HBase<\/a><\/strong>:\u00a0permite\u00a0manejar todos los\u00a0datos y tenerlos distribuidos a trav\u00e9s de lo que denominan regiones, una partici\u00f3n tipo Nodo de Hadoop que se guarda en un servidor. La regi\u00f3n aleatoria en la que se guardan los datos de una tabla es decidida,\u00a0d\u00e1ndole un tama\u00f1o fijo a partir del cual la tabla debe distribuirse a trav\u00e9s de las regiones. Aporta, as\u00ed, eficiencia en el trabajo de almacenamiento de datos.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\"><strong>4) Servicio de datos<\/strong><\/p>\n<p style=\"text-align: justify;\">En esta \u00faltima etapa, en realidad, no es que destaque una tecnolog\u00eda o herramienta, sino que destacar\u00eda el \u00abpara qu\u00e9\u00bb se ha hecho todo lo anterior. Es decir, qu\u00e9 podemos ofrecer\/servir una vez que los datos han sido procesados y puestos a disposici\u00f3n del proyecto de Big Data.<\/p>\n<p style=\"text-align: justify;\">Seguiremos esta serie hablando del enfoque de \u00abtiempo real\u00bb, y haciendo una comparaci\u00f3n con los resultados que ofrece este paradigma \u00abbatch\u00bb.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>(venimos de un art\u00edculo introductorio a los tres paradigmas) Cuando hablamos del verdadero momento en el que podemos considerar nace\u00a0esta \u00abera del Big Data\u00bb, comentamos que se puede considerar el desarrollo de MapReduce y Hadoop como las primeras \u00abtecnolog\u00edas Big Data\u00bb.\u00a0Estas tecnolog\u00edas se centraban en un enfoque de Batch Processing. Es decir, el objetivo era &hellip; <a href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/\" class=\"more-link\">Seguir leyendo <span class=\"screen-reader-text\">Paradigma batch para sistemas Big Data (I)<\/span> <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":136,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[1],"tags":[202,294,2,302,3,25,259,290,47,283,46,4,296],"class_list":["post-433","post","type-post","status-publish","format-standard","hentry","category-sin-categoria","tag-apache","tag-batch","tag-big-data","tag-cascading","tag-deusto","tag-hadoop","tag-hbase","tag-hdfs","tag-hive","tag-mapreduce","tag-pig","tag-programa-big-data","tag-spark"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Paradigma batch para sistemas Big Data (I) - Deusto Data<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Paradigma batch para sistemas Big Data (I) - Deusto Data\" \/>\n<meta property=\"og:description\" content=\"(venimos de un art\u00edculo introductorio a los tres paradigmas) Cuando hablamos del verdadero momento en el que podemos considerar nace\u00a0esta \u00abera del Big Data\u00bb, comentamos que se puede considerar el desarrollo de MapReduce y Hadoop como las primeras \u00abtecnolog\u00edas Big Data\u00bb.\u00a0Estas tecnolog\u00edas se centraban en un enfoque de Batch Processing. Es decir, el objetivo era &hellip; Seguir leyendo Paradigma batch para sistemas Big Data (I) &rarr;\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/\" \/>\n<meta property=\"og:site_name\" content=\"Deusto Data\" \/>\n<meta property=\"article:published_time\" content=\"2016-09-02T06:19:50+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png\" \/>\n<meta name=\"author\" content=\"\u00c1lex Ray\u00f3n\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"\u00c1lex Ray\u00f3n\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/\"},\"author\":{\"name\":\"\u00c1lex Ray\u00f3n\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"headline\":\"Paradigma batch para sistemas Big Data (I)\",\"datePublished\":\"2016-09-02T06:19:50+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/\"},\"wordCount\":998,\"commentCount\":4,\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2016\\\/08\\\/67678.png\",\"keywords\":[\"apache\",\"batch\",\"big data\",\"cascading\",\"deusto\",\"hadoop\",\"hbase\",\"hdfs\",\"hive\",\"mapreduce\",\"pig\",\"programa big data\",\"spark\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/\",\"name\":\"Paradigma batch para sistemas Big Data (I) - Deusto Data\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2016\\\/08\\\/67678.png\",\"datePublished\":\"2016-09-02T06:19:50+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-batch-para-sistemas-big-data-i\\\/#primaryimage\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2016\\\/08\\\/67678.png\",\"contentUrl\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2016\\\/08\\\/67678.png\"},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/\",\"name\":\"Deusto Data\",\"description\":\"Los datos de tu organizaci\u00f3n en valor\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\",\"name\":\"\u00c1lex Ray\u00f3n\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"caption\":\"\u00c1lex Ray\u00f3n\"},\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/author\\\/alex-rayon\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Paradigma batch para sistemas Big Data (I) - Deusto Data","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/","og_locale":"es_ES","og_type":"article","og_title":"Paradigma batch para sistemas Big Data (I) - Deusto Data","og_description":"(venimos de un art\u00edculo introductorio a los tres paradigmas) Cuando hablamos del verdadero momento en el que podemos considerar nace\u00a0esta \u00abera del Big Data\u00bb, comentamos que se puede considerar el desarrollo de MapReduce y Hadoop como las primeras \u00abtecnolog\u00edas Big Data\u00bb.\u00a0Estas tecnolog\u00edas se centraban en un enfoque de Batch Processing. Es decir, el objetivo era &hellip; Seguir leyendo Paradigma batch para sistemas Big Data (I) &rarr;","og_url":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/","og_site_name":"Deusto Data","article_published_time":"2016-09-02T06:19:50+00:00","og_image":[{"url":"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png","type":"","width":"","height":""}],"author":"\u00c1lex Ray\u00f3n","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"\u00c1lex Ray\u00f3n","Tiempo de lectura":"5 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#article","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/"},"author":{"name":"\u00c1lex Ray\u00f3n","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"headline":"Paradigma batch para sistemas Big Data (I)","datePublished":"2016-09-02T06:19:50+00:00","mainEntityOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/"},"wordCount":998,"commentCount":4,"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#primaryimage"},"thumbnailUrl":"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png","keywords":["apache","batch","big data","cascading","deusto","hadoop","hbase","hdfs","hive","mapreduce","pig","programa big data","spark"],"inLanguage":"es","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/","url":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/","name":"Paradigma batch para sistemas Big Data (I) - Deusto Data","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#primaryimage"},"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#primaryimage"},"thumbnailUrl":"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png","datePublished":"2016-09-02T06:19:50+00:00","author":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/#primaryimage","url":"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png","contentUrl":"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/67678.png"},{"@type":"WebSite","@id":"https:\/\/blogs.deusto.es\/bigdata\/#website","url":"https:\/\/blogs.deusto.es\/bigdata\/","name":"Deusto Data","description":"Los datos de tu organizaci\u00f3n en valor","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blogs.deusto.es\/bigdata\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a","name":"\u00c1lex Ray\u00f3n","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","caption":"\u00c1lex Ray\u00f3n"},"url":"https:\/\/blogs.deusto.es\/bigdata\/author\/alex-rayon\/"}]}},"_links":{"self":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/433","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/users\/136"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/comments?post=433"}],"version-history":[{"count":6,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/433\/revisions"}],"predecessor-version":[{"id":474,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/433\/revisions\/474"}],"wp:attachment":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/media?parent=433"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/categories?post=433"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/tags?post=433"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}