{"id":446,"date":"2016-12-18T07:36:44","date_gmt":"2016-12-18T06:36:44","guid":{"rendered":"https:\/\/preblogs.deusto.es\/bigdata\/?p=446"},"modified":"2016-12-18T07:37:08","modified_gmt":"2016-12-18T06:37:08","slug":"tecnologias-de-ingesta-de-datos-en-proyectos-big-data","status":"publish","type":"post","link":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/","title":{"rendered":"Tecnolog\u00edas de ingesta de datos en proyectos \u00abBig Data\u00bb en tiempo real"},"content":{"rendered":"<p style=\"text-align: justify;\">Cuando hablamos de las etapas que compon\u00edan un proyecto de Big Data, y sus <a href=\"https:\/\/blogs.deusto.es\/bigdata\/procesando-big-data-paradigmas-batch-tiempo-real-y-lambda\/\" target=\"_blank\">diferentes paradigmas para afrontarlo<\/a>, una cuesti\u00f3n que cit\u00e9 fue la siguiente:<\/p>\n<blockquote>\n<p style=\"text-align: justify;\">Si antes dec\u00edamos que un proyecto \u201cBig Data\u201d consta de cuatro etapas \u2013<em>(1) Ingesti\u00f3n; (2) Procesamiento; (3) Almacenamiento y (4) Servicio<\/em>-, con este enfoque, <strong>nada m\u00e1s ser \u201cingestados\u201d, son transferidos a su procesamiento<\/strong>. Esto, adem\u00e1s, se hace de manera continua. En lugar de tener que procesar \u201cgrandes cantidades\u201d, son, en todo momento, procesadas \u201cpeque\u00f1as cantidades\u201d.<\/p>\n<\/blockquote>\n<p style=\"text-align: justify;\">Hadoop, que marc\u00f3\u00a0un hito para procesar datos en batch, dejaba paso a Spark, como plataforma de referencia para el an\u00e1lisis de grandes cantidades de datos en tiempo real. Y para que Spark\u00a0traiga las ventajas que solemos citar (100 vez m\u00e1s r\u00e1pido\u00a0en memoria y hasta 10 veces m\u00e1s en disco que <a href=\"https:\/\/blogs.deusto.es\/bigdata\/cuando-empieza-esta-era-del-big-data-mapreduce\/\" target=\"_blank\">Hadoop y su paradigma MapReduce<\/a>), necesitamos sistemas \u00e1giles de \u00abalimentaci\u00f3n de datos\u00bb. Es decir, de ingesta de datos.<\/p>\n<p style=\"text-align: justify;\">Es el proceso por el cual los datos\u00a0que se obtienen en tiempo real van siendo capturados\u00a0temporalmente para un posterior procesamiento. Ese momento \u00abposterior\u00bb es pr\u00e1cticamente instant\u00e1neo a efectos de escala temporal.\u00a0Esto se est\u00e1 produciendo mucho, por ejemplo, en el mundo de los sensores y el\u00a0 IoT (Internet of Things). No podemos lanzar alarmas en tiempo real si no contamos con una arquitectura como esta. Muchos sectores son ya los que est\u00e1n migrando a estas arquitecturas de ingesta de datos en un mundo en tiempo real.<\/p>\n<p style=\"text-align: justify;\">Y es que el \u00abtiempo real\u00bb, el <em>streaming<\/em>, comienza ya desde la etapa de ingesti\u00f3n de datos. Tenemos que conectarnos a fuentes de datos en tiempo real, como dec\u00edamos, para permitir su procesamiento instant\u00e9ano.\u00a0En la era del Business Intelligence, e incluso en la era del\u00a0\u00abBig Data batch\u00bb, los ETL eran los que permit\u00edan hacer estas cosas. <a href=\"https:\/\/blogs.deusto.es\/bigdata\/herramientas-etl-y-su-relevancia-en-la-cadena-de-valor-del-dato\/\" target=\"_blank\">Hemos\u00a0hablado ya de su importancia<\/a>. Sin embargo, son herramientas que en tiempo real, no ofrecen el rendimiento esperado, por lo que necesitamos alternativas.<\/p>\n<figure style=\"width: 638px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\"><img fetchpriority=\"high\" decoding=\"async\" class=\"\" src=\"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\" alt=\"ETL vs Spark (fuente: http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488)\" width=\"638\" height=\"360\" \/><\/a><figcaption class=\"wp-caption-text\">ETL vs Spark (fuente: http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Estas son el tipo de cosas que permiten hacer\u00a0Spark y Storm, cuyo <a href=\"https:\/\/blogs.deusto.es\/bigdata\/paradigma-tiempo-real-para-sistemas-big-data-ii\/\" target=\"_blank\">paradigma en tiempo real ya comentamos en su d\u00eda<\/a>. Aparecen, junto a ellos, una serie de tecnolog\u00edas y herramientas que permiten implementar y dar sentido a todo este funcionamiento:<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong><a href=\"https:\/\/flume.apache.org\/\" target=\"_blank\">Flume<\/a><\/strong>: herramienta para la ingesta de datos en entornos de tiempo real. Tiene tres componentes principales: <em>Source<\/em> (fuente de datos), <em>Channel<\/em> (el canal por el que se tratar\u00e1n los datos) y <em>Sink<\/em> (persistencia de los datos). Para entornos de exigencias en t\u00e9rminos de velocidad de respuesta, es una muy buena alternativa a herramientas ETL tradicionales.<\/li>\n<li style=\"text-align: justify;\"><strong><a href=\"http:\/\/kafka.apache.org\/\" target=\"_blank\">Kafka<\/a><\/strong>: sistema de almacenamiento distribuido y replicado. Muy r\u00e1pido y \u00e1gil en lecturas y escrituras. Funciona como un servicio de mensajer\u00eda y fue creado por Linkedin para responder a sus necesidades (por eso insisto tanto en que nunca estar\u00edamos hablando de \u201cBig Data\u201d sin las herramientas que Internet y sus grandes plataformas ha tra\u00eddo). Unifica procesamiento OFF\u00a0y ON, por lo que suma las ventajas de ambos sistemas (batch y real time). Es un\u00a0s<strong>istema distribuido de colas,\u00a0e<\/strong>l m\u00e1s conocido actualmente, pero existen otros como\u00a0<a href=\"https:\/\/www.rabbitmq.com\/\">RabbitMQ<\/a>, y soluciones en la cloud como <a href=\"https:\/\/aws.amazon.com\/es\/kinesis\/\">AWS Kinesis<\/a>.<\/li>\n<li style=\"text-align: justify;\"><strong>Sistemas de procesamiento de logs,\u00a0d<\/strong>onde podemos encontrar tecnolog\u00edas como <a href=\"http:\/\/logging.apache.org\/\">LogStash<\/a>, <a href=\"http:\/\/chukwa.apache.org\/\" target=\"_blank\">Chukwa <\/a>y <a href=\"http:\/\/www.fluentd.org\/\">Fluentd<\/a>.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Con estas principales tecnolog\u00edas en el men\u00fa, LogStash y Flume, se han convertido en las dos principales soluciones Open Source para\u00a0lo que podr\u00edamos bautizar como \u00abETL en tiempo real\u00bb. Es decir, para la necesidad de recoger datos en tiempo real. La ingesta de datos como etapa de un proyecto de Big Data.<\/p>\n<p style=\"text-align: justify;\">Y, de este modo, nacen \u00abpacks tecnol\u00f3gicos\u00bb alternativos al ETL como es <a href=\"https:\/\/www.meetup.com\/es-ES\/Madrid-ElasticSearch-Meetup\/events\/215350012\/\" target=\"_blank\">EFK<\/a>, acr\u00f3nimo de <strong>Elastic Search + Flume + Kibana<\/strong>. Se trata de una plataforma para procesar datos en tiempo real, tanto estructurados como no estructurados. Todo ello, con tecnolog\u00edas Open Source, lo que podr\u00eda venir a animar a \u00a0muchas empresas que lean esta noticia, y entiendan el valor que tiene esto para sus seguras necesidades (cada vez m\u00e1s) en tiempo real.<\/p>\n<ul>\n<li style=\"text-align: justify;\"><strong>Elastic Search<\/strong>:\u00a0motor de b\u00fasqueda, orientado a documentos, basado en <a href=\"http:\/\/lucene.apache.org\/core\/\" target=\"_blank\">Apache Lucene<\/a>.<\/li>\n<li style=\"text-align: justify;\"><strong>Flume<\/strong>: ejcuci\u00f3n de procesos de extracci\u00f3n, transformaci\u00f3n y carga de datos de manera eficiente.<\/li>\n<li style=\"text-align: justify;\"><strong>Kibana<\/strong>: dashboards en tiempo real, procesando y aprovechando los datos en tiempo real indexados v\u00eda Elastich Search.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Con todo esto, quedar\u00edan esquemas tecnol\u00f3gicamente muy enriquecidos y \u00fatiles para necesidades de negocio como el que se presenta a continuaci\u00f3n:<\/p>\n<figure id=\"attachment_543\" aria-describedby=\"caption-attachment-543\" style=\"width: 675px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/12\/34.png\"><img decoding=\"async\" class=\"size-full wp-image-543\" src=\"https:\/\/blogs.deusto.es\/bigdata\/wp-content\/uploads\/sites\/8\/2016\/12\/34.png\" alt=\"Proyectos Big Data en tiempo real (Fuente: http:\/\/www.slideshare.net\/Stratio\/meetup-es-efk)\" width=\"675\" height=\"355\" srcset=\"https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/12\/34.png 675w, https:\/\/blogs.deusto.es\/wp-content\/uploads\/sites\/8\/2016\/12\/34-300x158.png 300w\" sizes=\"(max-width: 675px) 100vw, 675px\" \/><\/a><figcaption id=\"caption-attachment-543\" class=\"wp-caption-text\">Proyectos Big Data en tiempo real (Fuente: http:\/\/www.slideshare.net\/Stratio\/meetup-es-efk)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Como pod\u00e9is apreciar, en estos ecosistemas, los ETL ya no cumplen la funci\u00f3n que han venido desempe\u00f1ando hist\u00f3ricamente. Su rendimiento en tiempo real es realmente bajo. Por lo que tenemos que dar un paso m\u00e1s all\u00e1. E\u00a0introducir nuevas tecnolog\u00edas de ingesti\u00f3n de datos. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas. Si tu empresa est\u00e1 empezando a tener problemas con el datamart tradicional, o si la base de datos ya no da mucho m\u00e1s de s\u00ed, quiz\u00e1s en este ecosistema tecnol\u00f3gico tengamos la soluci\u00f3n.<\/p>\n<p style=\"text-align: justify;\">Nosotros, en nuestro <a href=\"http:\/\/bigdata.deusto.es\" target=\"_blank\">Programa de Big Data<\/a>, todo esto lo vemos durante 25 horas, montando una arquitectura en tiempo real que d\u00e9 respuesta a las necesidades de empresas que cada vez necesitan m\u00e1s esto. Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cuando hablamos de las etapas que compon\u00edan un proyecto de Big Data, y sus diferentes paradigmas para afrontarlo, una cuesti\u00f3n que cit\u00e9 fue la siguiente: Si antes dec\u00edamos que un proyecto \u201cBig Data\u201d consta de cuatro etapas \u2013(1) Ingesti\u00f3n; (2) Procesamiento; (3) Almacenamiento y (4) Servicio-, con este enfoque, nada m\u00e1s ser \u201cingestados\u201d, son transferidos &hellip; <a href=\"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/\" class=\"more-link\">Seguir leyendo <span class=\"screen-reader-text\">Tecnolog\u00edas de ingesta de datos en proyectos \u00abBig Data\u00bb en tiempo real<\/span> <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":136,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[1],"tags":[294,363,61,306,25,364,305,4,362,296,295,298],"class_list":["post-446","post","type-post","status-publish","format-standard","hentry","category-sin-categoria","tag-batch","tag-elastic-search","tag-etl","tag-flume","tag-hadoop","tag-ingesta-de-datos","tag-kafka","tag-programa-big-data","tag-real-time","tag-spark","tag-storm","tag-tiempo-real"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Tecnolog\u00edas de ingesta de datos en proyectos &quot;Big Data&quot; en tiempo real - Deusto Data<\/title>\n<meta name=\"description\" content=\"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Tecnolog\u00edas de ingesta de datos en proyectos &quot;Big Data&quot; en tiempo real - Deusto Data\" \/>\n<meta property=\"og:description\" content=\"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/\" \/>\n<meta property=\"og:site_name\" content=\"Deusto Data\" \/>\n<meta property=\"article:published_time\" content=\"2016-12-18T06:36:44+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2016-12-18T06:37:08+00:00\" \/>\n<meta property=\"og:image\" content=\"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\" \/>\n<meta name=\"author\" content=\"\u00c1lex Ray\u00f3n\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"\u00c1lex Ray\u00f3n\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/\"},\"author\":{\"name\":\"\u00c1lex Ray\u00f3n\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"headline\":\"Tecnolog\u00edas de ingesta de datos en proyectos \u00abBig Data\u00bb en tiempo real\",\"datePublished\":\"2016-12-18T06:36:44+00:00\",\"dateModified\":\"2016-12-18T06:37:08+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/\"},\"wordCount\":957,\"commentCount\":12,\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#primaryimage\"},\"thumbnailUrl\":\"http:\\\/\\\/image.slidesharecdn.com\\\/k2ionstoica-151028153637-lva1-app6892\\\/95\\\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\",\"keywords\":[\"batch\",\"elastic search\",\"etl\",\"flume\",\"hadoop\",\"ingesta de datos\",\"kafka\",\"programa big data\",\"real time\",\"spark\",\"storm\",\"tiempo real\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/\",\"name\":\"Tecnolog\u00edas de ingesta de datos en proyectos \\\"Big Data\\\" en tiempo real - Deusto Data\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#primaryimage\"},\"thumbnailUrl\":\"http:\\\/\\\/image.slidesharecdn.com\\\/k2ionstoica-151028153637-lva1-app6892\\\/95\\\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\",\"datePublished\":\"2016-12-18T06:36:44+00:00\",\"dateModified\":\"2016-12-18T06:37:08+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\"},\"description\":\"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.\",\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\\\/#primaryimage\",\"url\":\"http:\\\/\\\/image.slidesharecdn.com\\\/k2ionstoica-151028153637-lva1-app6892\\\/95\\\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\",\"contentUrl\":\"http:\\\/\\\/image.slidesharecdn.com\\\/k2ionstoica-151028153637-lva1-app6892\\\/95\\\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488\"},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#website\",\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/\",\"name\":\"Deusto Data\",\"description\":\"Los datos de tu organizaci\u00f3n en valor\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/#\\\/schema\\\/person\\\/649d200baab3dd91bf5a5c547cefd90a\",\"name\":\"\u00c1lex Ray\u00f3n\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g\",\"caption\":\"\u00c1lex Ray\u00f3n\"},\"url\":\"https:\\\/\\\/blogs.deusto.es\\\/bigdata\\\/author\\\/alex-rayon\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Tecnolog\u00edas de ingesta de datos en proyectos \"Big Data\" en tiempo real - Deusto Data","description":"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/","og_locale":"es_ES","og_type":"article","og_title":"Tecnolog\u00edas de ingesta de datos en proyectos \"Big Data\" en tiempo real - Deusto Data","og_description":"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.","og_url":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/","og_site_name":"Deusto Data","article_published_time":"2016-12-18T06:36:44+00:00","article_modified_time":"2016-12-18T06:37:08+00:00","og_image":[{"url":"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488","type":"","width":"","height":""}],"author":"\u00c1lex Ray\u00f3n","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"\u00c1lex Ray\u00f3n","Tiempo de lectura":"5 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#article","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/"},"author":{"name":"\u00c1lex Ray\u00f3n","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"headline":"Tecnolog\u00edas de ingesta de datos en proyectos \u00abBig Data\u00bb en tiempo real","datePublished":"2016-12-18T06:36:44+00:00","dateModified":"2016-12-18T06:37:08+00:00","mainEntityOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/"},"wordCount":957,"commentCount":12,"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#primaryimage"},"thumbnailUrl":"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488","keywords":["batch","elastic search","etl","flume","hadoop","ingesta de datos","kafka","programa big data","real time","spark","storm","tiempo real"],"inLanguage":"es","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/","url":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/","name":"Tecnolog\u00edas de ingesta de datos en proyectos \"Big Data\" en tiempo real - Deusto Data","isPartOf":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#primaryimage"},"image":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#primaryimage"},"thumbnailUrl":"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488","datePublished":"2016-12-18T06:36:44+00:00","dateModified":"2016-12-18T06:37:08+00:00","author":{"@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a"},"description":"Las tecnolog\u00edas de ingesta de datos al servicio de las necesidades de negocios en tiempo real. Kakfa, Flume, Elastic Search, etc., son esas tecnolog\u00edas.","inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/blogs.deusto.es\/bigdata\/tecnologias-de-ingesta-de-datos-en-proyectos-big-data\/#primaryimage","url":"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488","contentUrl":"http:\/\/image.slidesharecdn.com\/k2ionstoica-151028153637-lva1-app6892\/95\/spark-summit-eu-2015-revolutionizing-big-data-in-the-enterprise-with-spark-10-638.jpg?cb=1469144488"},{"@type":"WebSite","@id":"https:\/\/blogs.deusto.es\/bigdata\/#website","url":"https:\/\/blogs.deusto.es\/bigdata\/","name":"Deusto Data","description":"Los datos de tu organizaci\u00f3n en valor","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blogs.deusto.es\/bigdata\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/blogs.deusto.es\/bigdata\/#\/schema\/person\/649d200baab3dd91bf5a5c547cefd90a","name":"\u00c1lex Ray\u00f3n","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/edd2de8114be43b38592bbb35415b024c6b89ca81c89897ecb032a13975d64f1?s=96&d=mm&r=g","caption":"\u00c1lex Ray\u00f3n"},"url":"https:\/\/blogs.deusto.es\/bigdata\/author\/alex-rayon\/"}]}},"_links":{"self":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/446","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/users\/136"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/comments?post=446"}],"version-history":[{"count":5,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/446\/revisions"}],"predecessor-version":[{"id":545,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/posts\/446\/revisions\/545"}],"wp:attachment":[{"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/media?parent=446"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/categories?post=446"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.deusto.es\/bigdata\/wp-json\/wp\/v2\/tags?post=446"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}