{"id":434,"date":"2016-09-12T05:50:37","date_gmt":"2016-09-12T03:50:37","guid":{"rendered":"https:\/\/preblogs.deusto.es\/bigdata\/?p=434"},"modified":"2016-09-12T05:50:37","modified_gmt":"2016-09-12T03:50:37","slug":"paradigma-tiempo-real-para-sistemas-big-data-ii","status":"publish","type":"post","link":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/","title":{"rendered":"Paradigma tiempo real para sistemas Big Data (II)"},"content":{"rendered":"<p style=\"text-align: justify;\">(venimos de una serie de un art\u00edculo introductorio a los <a href=\"https:\/\/blogs.deusto.es\/bigdata\/procesando-big-data-paradigmas-batch-tiempo-real-y-lambda\/\" target=\"_blank\">tres paradigmas<\/a>, y de uno anterior hablando del <a href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-batch-para-sistemas-big-data-i\/\" target=\"_blank\">paradigma batch<\/a>)<\/p>\n<p style=\"text-align: justify;\">Dec\u00edamos en el art\u00edculo anterior, que a la hora de procesar grandes vol\u00famenes de datos existen <strong>dos principales enfoques<\/strong>: procesar una gran cantidad de datos por lotes o bien hacerlo, en peque\u00f1os fragmentos, y en \u00abtiempo real\u00bb. Parece, as\u00ed, bastante intuitivo pensar cu\u00e1l es la idea del paradigma en tiempo real que trataremos en este art\u00edculo.<\/p>\n<p style=\"text-align: justify;\">Este enfoque de procesamiento y an\u00e1lisis de datos se asienta sobre la idea de <strong>implementar un modelo de flujo de datos<\/strong> en el que los datos fluyen constantemente a trav\u00e9s de una<strong> serie de componentes<\/strong> que integran el sistema de Big Data que se est\u00e9 implatando. Por ello, se le como como procesamiento <strong>\u00abstreaming\u00bb o de flujo<\/strong>. As\u00ed, en tiempos muy peque\u00f1os, procesamos de <strong>manera anal\u00edtica<\/strong> parte de la totalidad de los datos. Y, con estas caracter\u00edsticas,\u00a0se superan muchas de las limitaciones del modelo batch.<\/p>\n<p style=\"text-align: justify;\">Por estas caracter\u00edsticas, es importante que no entendamos este paradigma como la soluci\u00f3n para\u00a0analizar un conjunto de grandes datos. Por ello, no presentan esa capacidad, salvo excepciones. Por otro lado,\u00a0una cosa es denominarlo \u00abtiempo real\u00bb y otra es realmente pensar que esto se va a producir en veradero tiempo tiempo.\u00a0Las limitaciones\u00a0aparecen por:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong>Se debe disponer de suficiente memoria\u00a0<\/strong> para almacenar entradas de datos en cola. F\u00edjense en la diferencia con el paradigma batch, donde\u00a0los procesos de Map y Reduce podr\u00edan\u00a0ser algo lentos, dado que escrib\u00edan\u00a0en disco entre las \u00a0diferentes fases.<\/li>\n<\/ul>\n<ul>\n<li style=\"text-align: justify;\">La <strong>tasa de productividad<\/strong> del sistema deber\u00eda ser igual o m\u00e1s r\u00e1pida a la tasa de entrada de datos. Es decir, que la capacidad de procesamiento del sistema sea m\u00e1s \u00e1gil y eficiente que la propia ingesta de datos. Esto, de nuevo, limita bastante la capacidad de dotar de \u00abinstantaneidad al sistema\u00bb.<\/li>\n<\/ul>\n<figure style=\"width: 475px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\"><img fetchpriority=\"high\" decoding=\"async\" class=\"\" src=\"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\" alt=\"Plataforma de anal\u00edtica Big Data en tiempo real (Fuente: https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png)\" width=\"475\" height=\"262\" \/><\/a><figcaption class=\"wp-caption-text\">Plataforma de anal\u00edtica Big Data en tiempo real (Fuente: https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Uno de los principales objetivos de esta nueva arquitectura es desacoplar el <a href=\"https:\/\/blogs.deusto.es\/bigdata\/cuando-empieza-esta-era-del-big-data-mapreduce\/\" target=\"_blank\">uso que se hac\u00eda de Hadoop MapReduce<\/a> para dar cabida a otros modelos de computaci\u00f3n en paralelo como pueden ser:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><em><strong><a href=\"https:\/\/en.wikipedia.org\/wiki\/Message_Passing_Interface\" target=\"_blank\">MPI (Message Passing Interface)<\/a><\/strong><\/em>:\u00a0est\u00e1ndar\u00a0empleado en la programaci\u00f3n concurrente para la sincronizaci\u00f3n de procesos ante la existencia de m\u00faltiples procesadores.<\/li>\n<li style=\"text-align: justify;\"><em><strong><a href=\"http:\/\/spark.apache.org\/\" target=\"_blank\">Spark<\/a><\/strong><\/em>:\u00a0plataforma desarrollada en Scala para el an\u00e1lisis avanzado y eficiente frente a las limitaciones de Hadoop. Tiene la habilidad de mantener todo en memoria, lo que le da ratios de hasta 100 veces mayor rapidez frente a MapReduce.\u00a0Tiene un framework integrado para implementar an\u00e1lisis avanzados. Tanto Cloudera, como Hortonworks, lo utilizan.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Y, con estos nuevos modelos, como hemos visto a lo largo de esta <a href=\"https:\/\/blogs.deusto.es\/bigdata\/cuando-empieza-esta-era-del-big-data-mapreduce\/\" target=\"_blank\">corta pero intensa historia del Big Data<\/a>, aparecen una serie de tecnolog\u00edas y herramientas que permiten implementar y dar sentido a todo este funcionamiento:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/flume.apache.org\/\" target=\"_blank\">Flume<\/a><\/strong>: herramienta para la ingesta de datos en entornos de tiempo real. Tiene tres componentes principales: <em>Source<\/em> (fuente de datos), <em>Channel<\/em> (el canal por el que se tratar\u00e1n los datos) y <em>Sink<\/em> (persistencia de los datos). Para entornos de exigencias en t\u00e9rminos de velocidad de respuesta, es una muy buena alternativa a herramientas ETL tradicionales.<\/li>\n<\/ul>\n<figure style=\"width: 546px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/blog.cloudera.com\/wp-content\/uploads\/sites\/8\/2012\/10\/fig.png\"><img decoding=\"async\" class=\"\" src=\"http:\/\/blog.cloudera.com\/wp-content\/uploads\/sites\/8\/2012\/10\/fig.png\" alt=\"Flume (Fuente: http:\/\/blog.cloudera.com\/wp-content\/uploads\/sites\/8\/2012\/10\/fig.png)\" width=\"546\" height=\"273\" \/><\/a><figcaption class=\"wp-caption-text\">Flume (Fuente: http:\/\/blog.cloudera.com\/wp-content\/uploads\/sites\/8\/2012\/10\/fig.png)<\/figcaption><\/figure>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/kafka.apache.org\/\" target=\"_blank\">Kafka<\/a><\/strong>: sistema de almacenamiento distribuido y replicado. Muy r\u00e1pido y \u00e1gil en lecturas y escrituras. Funciona como un servicio de mensajer\u00eda y fue creado por Linkedin para responder a sus necesidades (por eso insisto tanto en que nunca estar\u00edamos hablando de \u00abBig Data\u00bb sin las herramientas que Internet y sus grandes plataformas ha tra\u00eddo). Unifica procesamiento OFF\u00a0y ON, por lo que suma las ventajas de ambos sistemas (batch y real time). Funciona como si fuera un cluster.<\/li>\n<\/ul>\n<figure style=\"width: 255px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/unpocodejava.files.wordpress.com\/2012\/12\/image0019.jpg?w=780\"><img decoding=\"async\" class=\"\" src=\"https:\/\/unpocodejava.files.wordpress.com\/2012\/12\/image0019.jpg?w=780\" alt=\"Apache Kafka (Fuente: https:\/\/unpocodejava.files.wordpress.com\/2012\/12\/image0019.jpg?w=780)\" width=\"255\" height=\"196\" \/><\/a><figcaption class=\"wp-caption-text\">Apache Kafka (Fuente: https:\/\/unpocodejava.files.wordpress.com\/2012\/12\/image0019.jpg?w=780)<\/figcaption><\/figure>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/storm.apache.org\/\" target=\"_blank\">Storm<\/a><\/strong>: \u00a0sistema de computaci\u00f3n distribuido, por lo que se emplea en la etapa de an\u00e1lisis de datos (de la cadena de valor de un proyecto de Big Data). Se define como un sistema de procesamiento de eventos complejos (<a href=\"https:\/\/en.wikipedia.org\/wiki\/Complex_event_processing\" target=\"_blank\">Complex Event Processing, <\/a>CEP), lo que le hace ideal para responder a sistemas en los que los datos llegan de manera repentina pero continua. Por ejemplo, en herramientas tan habituales para nosotros como WhatsApp, Facebook o Twitter, as\u00ed como herramientas como sensores (ante la ocurrencia de un evento) o un servicio\u00a0financiero que podamos ejecutar en cualquier momento.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Vistas estas tres tecnolog\u00edas, queda claro que la arquitectura resultante de un proyecto de tiempo real quedar\u00eda compuesto por\u00a0<strong>Flume<\/strong> (ingesta de datos de diversas fuentes) &#8211;&gt;\u00a0<strong>Kafka<\/strong> (encolamos y almacenamos) &#8211;&gt; <strong>Storm<\/strong> (analizamos).<\/p>\n<figure id=\"attachment_468\" aria-describedby=\"caption-attachment-468\" style=\"width: 623px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/888888.png\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-468\" src=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/08\/888888.png\" alt=\"Fuente: http:\/\/www.slideshare.net\/Datadopter\/the-three-generations-of-big-data-processing\" width=\"623\" height=\"300\" srcset=\"https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/08\/888888.png 623w, https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/08\/888888-300x144.png 300w\" sizes=\"(max-width: 623px) 100vw, 623px\" \/><\/a><figcaption id=\"caption-attachment-468\" class=\"wp-caption-text\">Fuente: http:\/\/www.slideshare.net\/Datadopter\/the-three-generations-of-big-data-processing<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Vistas todas estas caracter\u00edsticas, podemos concluir que para proyectos <strong>donde el \u00abtama\u00f1o\u00bb sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno<\/strong>. Cuando el <strong>\u00abproblema\u00bb sea la velocidad, el enfoque en tiempo real<\/strong>, es la soluci\u00f3n a adoptar.<\/p>\n<p style=\"text-align: justify;\">(continuar\u00e1)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>(venimos de una serie de un art\u00edculo introductorio a los tres paradigmas, y de uno anterior hablando del paradigma batch) Dec\u00edamos en el art\u00edculo anterior, que a la hora de procesar grandes vol\u00famenes de datos existen dos principales enfoques: procesar una gran cantidad de datos por lotes o bien hacerlo, en peque\u00f1os fragmentos, y en &hellip; <a href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/\" class=\"more-link\">Seguir leyendo <span class=\"screen-reader-text\">Paradigma tiempo real para sistemas Big Data (II)<\/span> <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":136,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[1],"tags":[202,2,3,306,305,4,296,295,298],"class_list":["post-434","post","type-post","status-publish","format-standard","hentry","category-sin-categoria","tag-apache","tag-big-data","tag-deusto","tag-flume","tag-kafka","tag-programa-big-data","tag-spark","tag-storm","tag-tiempo-real"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Paradigma tiempo real para sistemas Big Data (II) - Deusto Data<\/title>\n<meta name=\"description\" content=\"para proyectos donde el &quot;tama\u00f1o&quot; sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el &quot;problema&quot; sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Paradigma tiempo real para sistemas Big Data (II) - Deusto Data\" \/>\n<meta property=\"og:description\" content=\"para proyectos donde el &quot;tama\u00f1o&quot; sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el &quot;problema&quot; sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/\" \/>\n<meta property=\"og:site_name\" content=\"Deusto Data\" \/>\n<meta property=\"article:published_time\" content=\"2016-09-12T03:50:37+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\" \/>\n<meta name=\"author\" content=\"\u00c1lex Ray\u00f3n\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"\u00c1lex Ray\u00f3n\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/\"},\"author\":{\"name\":\"\u00c1lex Ray\u00f3n\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"headline\":\"Paradigma tiempo real para sistemas Big Data (II)\",\"datePublished\":\"2016-09-12T03:50:37+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/\"},\"wordCount\":881,\"commentCount\":1,\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/infocus.emc.com\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2013\\\/02\\\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\",\"keywords\":[\"apache\",\"big data\",\"deusto\",\"flume\",\"kafka\",\"programa big data\",\"spark\",\"storm\",\"tiempo real\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/\",\"name\":\"Paradigma tiempo real para sistemas Big Data (II) - Deusto Data\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/infocus.emc.com\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2013\\\/02\\\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\",\"datePublished\":\"2016-09-12T03:50:37+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"description\":\"para proyectos donde el \\\"tama\u00f1o\\\" sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el \\\"problema\\\" sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.\",\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/paradigma-tiempo-real-para-sistemas-big-data-ii\\\/#primaryimage\",\"url\":\"https:\\\/\\\/infocus.emc.com\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2013\\\/02\\\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\",\"contentUrl\":\"https:\\\/\\\/infocus.emc.com\\\/wp-content\\\/uploads\\\/sites\\\/8\\\/2013\\\/02\\\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png\"},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/\",\"name\":\"Deusto Data\",\"description\":\"Los datos de tu organizaci\u00f3n en valor\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\",\"name\":\"\u00c1lex Ray\u00f3n\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"caption\":\"\u00c1lex Ray\u00f3n\"},\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/author\\\/alex-rayon\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Paradigma tiempo real para sistemas Big Data (II) - Deusto Data","description":"para proyectos donde el \"tama\u00f1o\" sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el \"problema\" sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/","og_locale":"es_ES","og_type":"article","og_title":"Paradigma tiempo real para sistemas Big Data (II) - Deusto Data","og_description":"para proyectos donde el \"tama\u00f1o\" sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el \"problema\" sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.","og_url":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/","og_site_name":"Deusto Data","article_published_time":"2016-09-12T03:50:37+00:00","og_image":[{"url":"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png","type":"","width":"","height":""}],"author":"\u00c1lex Ray\u00f3n","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"\u00c1lex Ray\u00f3n","Tiempo de lectura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#article","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/"},"author":{"name":"\u00c1lex Ray\u00f3n","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"headline":"Paradigma tiempo real para sistemas Big Data (II)","datePublished":"2016-09-12T03:50:37+00:00","mainEntityOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/"},"wordCount":881,"commentCount":1,"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#primaryimage"},"thumbnailUrl":"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png","keywords":["apache","big data","deusto","flume","kafka","programa big data","spark","storm","tiempo real"],"inLanguage":"es","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/","url":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/","name":"Paradigma tiempo real para sistemas Big Data (II) - Deusto Data","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#primaryimage"},"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#primaryimage"},"thumbnailUrl":"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png","datePublished":"2016-09-12T03:50:37+00:00","author":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"description":"para proyectos donde el \"tama\u00f1o\" sea el *verdadero* problema, el enfoque Batch ser\u00e1 el bueno. Cuando el \"problema\" sea la velocidad, el enfoque en tiempo real, es la soluci\u00f3n a adoptar.","inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/#primaryimage","url":"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png","contentUrl":"https:\/\/infocus.emc.com\/wp-content\/uploads\/sites\/8\/2013\/02\/Real-time-Analytic-Platforms-Enable-New-Value-Creation-Opportunities.png"},{"@type":"WebSite","@id":"https:\/\/blogs.deusto.es\/bigdata\/#website","url":"https:\/\/blogs.deusto.es\/bigdata\/","name":"Deusto Data","description":"Los datos de tu organizaci\u00f3n en valor","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blogs.deusto.es\/bigdata\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a","name":"\u00c1lex Ray\u00f3n","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","caption":"\u00c1lex Ray\u00f3n"},"url":"https:\/\/blogs.deusto.es\/bigdata\/author\/alex-rayon\/"}]}},"_links":{"self":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/434","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/users\/136"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/comments?post=434"}],"version-history":[{"count":6,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/434\/revisions"}],"predecessor-version":[{"id":481,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/434\/revisions\/481"}],"wp:attachment":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/media?parent=434"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/categories?post=434"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/tags?post=434"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}