Con este último artículo llegamos a la conclusión de la serie de posts que hemos estado realizando durante prácticamente los últimos dos meses. Por esa misma razón, qué mejor oportunidad que esta para echar un vistazo a lo que nos depara el mundo de los sistemas de control industriales en los siguientes años. [Leer más…]
Big Data: Conclusiones y Green tendency
El comienzo de este post consistirá en desarrollar una conclusión válida para los tres primeros posts, a la vez que sirve como cierre para el post 4, que quedó lleno de controles, sin una clara explicación final que los acompañase.
Como hemos ido viendo a lo largo de este análisis que hemos hecho en torno al Big Data, se podría argumentar que no es solo una herramienta, ya que su utilización trae consigo un cambio en las empresas, creando una disciplina en la que prima la mejora de la toma de decisiones, basada en la gran cantidad de datos y en los análisis avanzados que esta permite.
El continuo crecimiento en el volumen de datos que se generan traerá consigo grandes cambios que se asentarán en torno al Big Data. Los avances sucederán cada vez más rápido, y las empresas podrán contar con una mejor rentabilidad y mayor éxito en su área, siempre y cuando, como hemos ido comentando, sean capaces de amoldarse a los cambios y nuevos retos que trae consigo.
Los principales retos son, de hecho, los que hemos ido comentando a lo largo de estos posts, los relacionados con los riesgos que presentan a una empresa, la capacidad de establecer unas medidas de seguridad acordes a lo requerido y la habilidad de desarrollar controles que verifiquen que todo se está haciendo como se debería.
Unido a este último párrafo, me gustaría hacer referencia a un artículo [1] que habla de la importancia de forjar una ventaja en un ambiente de continuo desafío. Este se centra en la industria manufacturera, sin embargo, habla de ideas que se podrían extrapolar al área que nos interesa. La idea principal con la que me gustaría que nos quedásemos, y utilizándola como frase para el cierre de esta pequeña conclusión, explica cómo las organizaciones han entendido que, en los tiempos más difíciles, la innovación es primordial para mantenerse competitivo. Y remarca, que hoy en día, ese factor diferencial que actualmente está proporcionando una ventaja a las empresas que son capaces de aplicarla correctamente, es la analítica aplicada al Big Data. Sin embargo, nos obliga a mantener los pies en el suelo, recordando que un error en la implementación de su estrategia supone un gran riesgo para el desempeño financiero.
Green tendency
Dando fin a esta serie de posts acerca del Big Data, me gustaría acabar comentando este artículo [2] sobre el Big Data y el movimiento hacia el cuidado del medio ambiente que estamos experimentando estos últimos años.
Como ya hemos visto, el Big Data es uno de los grandes movimientos que está experimentando la sociedad en lo que al ámbito empresarial se refiere, y esta tendencia verde es un movimiento que cada vez está calando más en la gente de a pie. A continuación, comentaré los aspectos más destacados de este artículo, como son los principales objetivos en los que nos podríamos beneficiar de la unión de estas dos tendencias y los principales retos que se tendrían que superar para que esto suceda.
Es obvio que las tecnologías causan daños en el medioambiente, a través de la contaminación, desechos, agotamiento de recursos o la alteración ecológica. Sin embargo, la buena utilización del Big Data, puede dar la vuelta a esta tendencia y empezar a generar beneficios más que destrozos. A continuación, listaremos una serie de problemas medioambientales que podrían mitigarse con la ayuda del Big Data.
- Contaminación: la excesiva e innecesaria utilización y producción de aparatos tecnológicos causa contaminaciones sonoras, electromagnéticas, aéreas y acuosas.
- Clima: existen estudios que sostienen que la ayuda del Big Data podría ayudar a detectar los principales causantes de este cambio climático que sufrimos, y así hacerle frente de manera más directa.
- Degradación: uno de los principales problemas ecológicos surge con la extracción y agotamiento del carbón de los bosques. La universidad de Maryland y Google y desarrollaron una solución que permite medir de manera aproximada los impactos de la deforestación y calcular la cantidad de carbón restante en estas áreas vegetales.
- Desperdicios: todos hemos oído la cantidad de comida, entre otras cosas, que se desperdician al año. El análisis de estos datos puede mejorar considerablemente la situación actual.
- Recursos: la utilización de recursos renovables por encima de los no renovables es otro de los movimientos a los que cada vez más gente se está uniendo. Este artículo explica como los análisis de los datos que generan la utilización de estos recursos puede disminuir el desgaste de los recursos no renovables y potenciar y optimizar los que sí lo son.
A lo largo de todo el documento se proponen diferentes ideas para ayudar a encontrar una solución a los problemas que acabamos de nombrar. Sin embargo, antes de acabar con este post, me gustaría remarcar los tres retos o problemas que siguen abiertos con el fin de concienciarnos y darnos cuenta de que el Big Data puede ser de gran ayuda para impulsar esta tendencia green.
- Medioambiente: ya hemos comentado como hay un gran margen de mejora en este aspecto, y como la recogida masiva de datos puede ayudarnos a detectar los puntos en los que deberíamos centrarnos para hacer frente a este gran problema presente en la actualidad.
- Eficiencia energética: uno de los principales objetivos consiste en analizar la utilización de la energía, de manera que se pueda prever la cantidad que se va a necesitar, evitando así la innecesaria generación de energía que conlleva al desperdicio de esta.
- Sostenibilidad: este es un aspecto que engloba muchísimas áreas, por no decir todas, desde el reciclaje hasta la disminución o optimización del transporte. Acorde a lo que hemos comentado antes, la reducción de desperdicios es una de las bases para aumentar esa sostenibilidad que buscamos, y el análisis de los datos que continuamente generamos juega un papel primordial en encontrar una solución. Analizar los patrones de movimiento podría ser una estrategia viable también para reducir el impacto que genera el transporte hoy en día.
Con esto doy por acabada esta reflexión sobre el impacto que puede tener la correcta aplicación del Big Data en algo tan importante para nuestro futuro y que nos incumbe a todos. Y como podréis imaginar, esto se puede extrapolar a muchos de los problemas que afrontamos hoy en día como sociedad.
Fin
Espero que estos cinco posts sobre el Big Data hayan ayudado a mejorar la visión que teníamos sobre ella y hayan aportado información y nuevos conocimientos. Personalmente, he aprendido muchas cosas y me he dado cuenta del impacto que próximamente seguiremos viendo gracias a esta tecnología, por lo que me doy por satisfecho con la investigación que he hecho durante estas semanas.
Referencias
[1] «Big Data Adoption in Manufacturing: Forging an Edge in a Challenging Environment», KnowledgeLeader. https://www.knowledgeleader.com/knowledgeleader/content.nsf/web+content/articlebigdataadoptioninmanufacturing
[2] «Big Data Meet Green Challenges: Big Data Toward Green Applications», Océano.
https://oceano.biblioteca.deusto.es/primo-explore/fulldisplay?docid=TN_cdi_proquest_journals_1814237070&context=PC&vid=deusto&lang=en_US&search_scope=default_scope&adaptor=primo_central_multiple_fe&tab=default_tab&query=any,contains,big%20data&offset=0
Seguridad y Controles en Big Data
En el post anterior vimos los riesgos más relevantes asociados al Big Data, siguiendo esa línea, en este veremos cuales son los controles a realizar y las medidas de seguridad a tener en cuenta para mantener a raya esos riesgos.
Para refrescar lo que vimos en el anterior post, empezaremos listando los que son los principales riesgos a los que se enfrenta la industria del Big Data:
- Como debe ser gestionada la estrategia y los recursos entorno al Big Data
- Desarrollo e implementación en proyectos de Big Data
- Privacidad y seguridad de los datos
- Utilización de tecnologías open source y cloud
- Computación segura en marcos de programación distribuida
- Mejores prácticas en base de datos no relacionales
- Registro de Transacciones y almacén de datos seguros
- Monitoreo de la seguridad en tiempo real
- Control de acceso criptográfico
Para poder alcanzar las necesidades de los objetivos de negocio, es necesario atacar estos riesgos y mejorar la habilidad con la que se hace uso del Big Data. Con intención de mejorar esto, ISACA estableció los ocho pasos o controles que describiremos a continuación.
- Establecer prioridades con los datos: todos los datos no tienen la misma importancia dentro de un negocio, por lo que es imprescindible detectar cuales son los procesos críticos y asegurarse de que estos tienen preferencia.
- Entender qué sucede con los datos: es fundamental monitorear todos los datos de la compañía, para analizar y tomar decisiones basadas en los resultados.
- Los datos son preciados, deberían ser asegurados de esa forma: se debe tener un apropiado conocimiento de la performance de los procesos de manejo de datos.
- Proveer guías claras de seguridad: se deben considerar todas las fuentes de información de las que se están obteniendo los análisis y evaluar las vulnerabilidades de cada una.
- Asegurar futuros sistemas de prueba: las compañías deberían invertir en herramientas que ayuden a asegurar que sus datos sean acertados, actualizados y limpios a medida que el Big Data crece.
- Tomar la nube en consideración: Los controles apropiados deben ser puestos en su lugar para confiar en el proveedor de servicios en la nube con los datos sensibles.
- Encontrar un director de datos.
- Finalmente, asegurar conformidad con las relevantes regulaciones y leyes actuales: Controles de seguridad lógicos y físicos de acceso son necesarios para prevenir acceso sin autorización a los datos sensibles y valiosos. Es importante, mantenerse informado acerca de propuestas legislativas y usar la oportunidad de emplear las mejores prácticas en cuanto al ciclo de vida de los datos.
Haciendo énfasis en este último consejo de ISACA, veremos las cláusulas recogidas de la ISO 27002 relacionadas con el Big data en lo referente a la seguridad física y lógica.

Seguridad física
Cláusula | Descripción |
11.1.1 Perímetro de seguridad física | Se deben definir perímetros de seguridad que sean usados para proteger las áreas que contengan tanto información crítica como sensible, así como las instalaciones donde se procesa. |
11.1.2 Controles Físicos de entrada | Se deben proteger las áreas que se consideren necesarias por controles apropiados de entrada que garanticen que sólo el personal autorizado tiene acceso. |
11.1.4 Protección contra amenazas externas y medioambientales | Se deben aplicar procedimientos contra desastres naturales o ataques intencionados como inundaciones, fuegos o explosiones. |
11.2.1 Protección y emplazamiento físico del equipo | El lugar de trabajo debe reducir los riesgos provenientes de amenazas medioambientales y peligros provocados por accesos no autorizados. |
11.2.2 Utilidades de apoyo | El equipamiento debe estar protegido ante fallos eléctricos y otras interrupciones causadas por fallos en otros sistemas de apoyo. |
11.2.3 Seguridad en el cableado | Los cables de alimentación y telecomunicaciones que transporten datos o servicios de información de apoyo deben estar protegidos contra toda interferencia o daño. |
11.2.4 Mantenimiento del equipo | El equipo debe ser correctamente mantenido de acuerdo con las recomendaciones y especificaciones del fabricante para asegurar su continuidad, disponibilidad e integridad. |
11.2.5 Eliminación de activos | El equipo, información, o software no debe ser sacado de su emplazamiento físico o lógico sin una autorización previa. |
Seguridad lógica
6.1.5 Seguridad de la información en la administración de proyectos | La seguridad de la información debe abordarse en la gestión del proyecto, independientemente del tipo de proyecto, y debería estar integrada en los métodos de administración de proyectos de la organización, para asegurar que los riesgos de la seguridad de la información son identificados y dirigidos como parte íntegra del mismo |
8.2.1 Clasificación de la información | La información debe ser clasificada en función de sus requisitos legales, valor, criticidad y sensibilidad. |
8.3.2 Eliminación de medios | Los dispositivos deben ser borrados de manera segura cuando ya no sean necesario usando procedimientos formales. |
9.2.5 Repaso de los derechos de acceso de los usuarios | Se debe revisar de manera frecuente el acceso de los usuarios sobre todo después de ascensos, degradaciones, despidos o cualquier otro cambio significativo. |
10.1.1 Política en el uso de controles criptográficos | Se debe desarrollar e implementar una política de uso de controles criptográficos para la protección de la información. |
12.2.1 Controles contra el malware | Se deben implementar controles de detección, prevención y recuperación que garanticen la protección contra el malware, así como concienciar a los trabajadores. |
12.3.1 Información de respaldo | Se debe establecer una política de respaldo que defina y establezca los requisitos de la empresa en cuanto a respaldo de la información, del software y de los sistemas. |
13.1.1 Controles de Red | Las redes deben ser controladas y gestionadas para proteger la información de los sistemas y aplicaciones. Se deben implementar controles que garanticen la seguridad de la información en red y la protección de los servicios conectados desde accesos no autorizados. |
14.2.8 Pruebas de Seguridad del Sistema | Se deben realizar pruebas de seguridad, tanto para los sistemas nuevos como para los actualizados, durante el periodo de desarrollo. |
16.1.2 Reportar eventos de seguridad de la información | Los eventos de seguridad de la información deben ser comunicados por los canales administrativos apropiados tan rápido como sea posible. |
16.1.3 Informar sobre las debilidades en la seguridad de la información | Los empleados y contratistas que usen los sistemas de información de la organización están obligados a reportar cualquier debilidad detectada. |
16.1.6 Aprendiendo de los incidentes de seguridad de la información | La información obtenida de los análisis de incidentes debe usarse para reducir el impacto de futuros sucesos |
18.1.3 Protección de archivos | Se debe tener en cuenta la forma en la que la organización clasifica sus archivos y el período de tiempo durante el que los almacena a la hora de seleccionar el medio en el que va a guardar la información para protegerla de accesos no autorizados o descargas ilegales. |
Ahora que ya conocemos diferentes controles que debemos llevar a cabo relacionados con el Big Data y debido a la longitud del post, lo daré por acabado aquí, dejando como tarea para el próximo y último post una pequeña reflexión sobre los controles nombrados a lo largo de este documento.
Referencias
[1] «Seguridad y Control en Big Data», Academia.
https://www.academia.edu/28496329/Seguridad_y_Control_en_Big_Data
[2] «Auditoría de Proyectos Big Data, Cloud Computing y Open Data», Universidad Complutense de Madrid.
https://eprints.ucm.es/50039/1/TFG%20BertaMontes.pdf
[3] «Controles ISO 27002-2013», ISO 27000.
https://www.iso27000.es/assets/files/ControlesISO27002-2013.pdf
Riesgos
A pesar del gran potencial que tiene el Big Data y su relevancia en la industria actual, es clave saber identificar y poder hacer frente a los riesgos que conlleva este análisis masivo de los datos. Uno de los papeles más importantes que tienen que cumplir las organizaciones consiste en comprender la importancia del Big Data, reconociendo así los puntos en los que más valor se puede conseguir gracias a su aplicación.
A medida que las organizaciones aumentan el número de soluciones basadas en Big Data para conseguir un valor y una ventaja competitiva, es importante que el auditor de la Seguridad de la Información sea capaz de entender los riesgos que esto conlleva y asegure que estos se están gestionando de manera correcta. El uso de la analítica avanzada puede ser vital para la detección de riesgos, a la vez que ayuda a señalar posibles sesgos en el pensamiento de la gestión, ineficiencias en el mercado y desarrollos emergentes. En resumen, los datos brindan una nueva ventana al mundo, pero los análisis adecuados son los que ayudan a comprender lo que significan para la organización [1]. A continuación, se muestran algunos de los principales riesgos que hay que mantener a raya [2].
Estrategia IT y recursos: Es importante entender la estrategia general de la empresa y como el Big Data debe ser utilizado o aplicado para apoyar esa estrategia. Muchas organizaciones no están preparadas para capitalizar las oportunidades que el Big Data puede ofrecer, especialmente en lo que a talento de los trabajadores se refiere, ya que es una tecnología todavía en alza que cuenta con una falta de expertos en su ámbito.
Los auditores de la seguridad de la información deberían evaluar estrategias tecnológicas y la gestión de recursos con el fin de asegurar que las iniciativas tecnológicas y están alineadas con la estrategia de la empresa y que esta cuenta con recursos suficientes y bien cualificados.
Desarrollo e implementación: Para este apartado listaremos una serie de riesgos que pueden experimentar los proyectos de tecnología de Big Data.
- Desafíos con el alcance, la calidad, el costo y el tiempo de comercialización.
- Los auditores de SI deben determinar si las soluciones de Big Data se adquieren y desarrollan de manera controlada utilizando procesos apropiados de gestión de proyectos y desarrollo de sistemas.
- Las iniciativas de Big Data a menudo utilizan metodologías de desarrollo ágiles iterativas como Scrum. Sin embargo, es probable que los auditores de SI estén familiarizados con los procesos de desarrollo de sistemas en cascada tradicionales, enfatizados más en la documentación completa y detallada.
- Los auditores de SI pueden tener el desafío de obtener la seguridad de que se realizaron las pruebas adecuadas para determinar que la solución de Big Data funciona según lo previsto.
- La veracidad de los datos, conocida a menudo como la cuarta V.
- Para lograr este objetivo, los auditores de SI deben evaluar la estrategia de aseguramiento de la calidad de Big Data de la organización o incluso determinar si se ha implementado un programa efectivo de gobernanza de datos.
Privacidad y seguridad de los datos: una de las grandes preocupaciones asociada al manejo de tanta cantidad de información es garantizar que se cumple con los requisitos de privacidad y seguridad. Los datos pueden ponerse en peligro por una serie de razones, incluidos los controles de seguridad inadecuados, amenazas tanto internas como externas o configuraciones del sistema débiles.
A la hora de manejar datos confidenciales existen requisitos normativos de la industria que recogen como se protegen, comparten y depuran esos datos. Se debe prestar especial atención a datos financieros, de salud e información de identificación personal. Los auditores de SI deben revisar las regulaciones para la protección de datos y la privacidad, y evaluar los controles de seguridad en detalle.
Como dato curioso y práctico que demuestra lo que sucede cuando las cosas no se hacen como se deberían, está la fuga de datos que sufrió una empresa de análisis de datos en 2017 que incluía información, 1,1 terabytes, sobre los votantes estadounidenses.
Tecnologías open source y cloud: muchas organizaciones pueden optar por utilizar plataformas de código abierto o entornos de computación en la nube de terceros, como podrían ser Apache Hadoop o Amazon Web Services (AWS). Este tipo de tecnologías presentan riesgos únicos que deben ser considerador por los auditores.
Otro riesgo asociado a las soluciones de código abierto es el relacionado con las licencias. Dependiendo del tipo de licencia que se utilice, existe el riesgo de infracción de la propiedad intelectual o la exposición del código propio de la organización.
Los auditores SI deben evaluar por una parte que los proveedores de tecnología en la nube tienen controles de seguridad adecuados, que la supervisión con los proveedores externos es suficiente, y, por otro lado, evaluar los controles que se encargan de gestionar y mitigar las vulnerabilidades del código abierto, a la vez que monitorean el cumplimiento de las licencias mencionadas.
A pesar de que cada vez estos riesgos estén más controlados y las medidas que se toman para mantenerlos a raya mejoren continuamente, las soluciones de Big Data también crecen a un ritmo desmesurado. Para hacer frente a ese crecimiento y esta evolución del Big Data hacia los datos no estructurados y el software de código abierto, los auditores SI deberán ampliar su conocimiento y desarrollar nuevas habilidades. Y, por último, volviendo a la analítica avanzada que hemos comentado en el comienzo del post, la utilización de esta ayudará también a reducir los riesgos en financiación, talento, tiempo y tecnologías mal asignadas.
Referencias
[1] «The Real Deal With Big Data», Deloitte. https://www2.deloitte.com/content/dam/Deloitte/us/Documents/regulatory/us-director-advisory-real-deal-with-big-data-013015.pdf
[2] «Auditing Big Data in the Enterprise», ISACA. https://www.isaca.org/resources/isaca-journal/issues/2018/volume-2/auditing-big-data-in-the-enterprise
Relevancia del Big Data
Una vez explicado que es el Big Data, (véase el primer post https://blogs.deusto.es/master-informatica/big-data/) pasaremos a mostrar la importancia que tiene en la industria actual, acompañando los diferentes aspectos en los que prima su utilidad con noticias actuales tanto nacionales como internacionales, de manera que se pueda entender de manera práctica el uso que se le puede dar.
Estado y Tendencias del Big Data
El Big Data ha ido tomando importancia en las estrategias de desarrollo de negocio de muchas empresas y apunta a que será una de las principales herramientas con las que transformaremos la sociedad hacia el futuro. Gracias al Big Data, las empresas, gobiernos e instituciones trabajan de manera más eficiente, rápida e inteligente y esto lleva a una cuidadosa observación a su desarrollo y novedades. De hecho, según el estudio ‘Big Data and AI Executive Survey 2019’ más de la mitad de las empresas en España están invirtiendo en tecnología como el Big Data o Inteligencia Artificial [1].
Casos prácticos
Industria
El uso del Big Data ya está dando beneficios a las empresas que lo ponen en práctica. El gráfico que vemos a continuación muestra el porcentaje de empresas que hacen uso de ello en las diferentes áreas de negocio.

Analizando los datos de manera global, se puede ver una tendencia ascendiente y de progreso a corto y largo plazo en su utilización, que deja ver como en unos años el 80% de las empresas utilizarán el Big Data para mejorar su papel en el marketing [2].
Una cosa que llama la atención es que las dos áreas con más porcentaje están centradas en el cliente, y tanto esas como las que más crecimiento esperan a corto plazo, tienen un estrecho contacto con el servicio al cliente.
El día a día
Más allá de la importancia que ha cogido en la industria, este 2020 ha mostrado un claro ejemplo de su relevancia en los aspectos que nos afectan de manera más directa a todos. Y es que, además del coronavirus, estos días también somos víctimas de una pandemia de información, que en este caso, nos ha sido beneficiosa para hacer frente a las adversidades inusual que estamos sufriendo. A continuación, veremos una lista de las ventajas más destacadas que hemos obtenido [3]:
Detección temprana
Las empresas Blue Dot/ Metabiot y el servicio automatizado HealthMap del Hospital Infantil de Boston (EE. UU.) detectaron muy pronto la aparición del coronavirus. Datos médicos, redes sociales y también otros datos sobre transporte, por ejemplo, se emplearon para estimar la rápida extensión del virus.
Evolución
Los datos genéticos del virus permiten seguir la pista al coronavirus, determinar su origen y sus ramificaciones. La web https://nextstrain.org/ publica datos casi en tiempo real que se están revelando como determinantes para saber por qué vías se está expandiendo el virus y cómo están funcionando las medidas de contención.
Predicción
El Imperial College London, una respetable institución universitaria con 15 premios Nobel y 3 Medallas Fields, publica información de interés. Sus modelos matemáticos sobre cuál sería la evolución del contagio de no tomarse las medidas adecuadas obligaron a Boris Jonhson a frenar en seco y cambiar de estrategia.
Noticias
Para ver como el Big Data está continuamente ofreciendo nuevas oportunidades, veremos una noticia a nivel nacional que remarca la importancia de su uso, a la vez que muestra el amplio rango de ámbitos en los que se pueden sacar ventajas gracias a su correcta aplicación.
Big Data e inteligencia artificial como pilares de la medicina del futuro centran la jornada ‘Algoritmos para la salud’.[4]
Algoritmos para la salud es una jornada organizada por la fundación Instituto Roche que en esta ocasión ha centrado su atención en la importancia de la combinación del Big Data con la Inteligencia Artificial. Como bien explican en su jornada y como puntualizamos en el primer post, la digitalización que estamos experimentando ha aumentado considerablemente la cantidad de dato que se producen. El procesamiento de éstos, ayudado de la inteligencia artificial, genera una información de gran valor para la prevención, el diagnóstico y tratamiento de muchas enfermedades. Esto a su vez, facilita la personalización de la medicina, haciendo que cada paciente reciba un tratamiento o una solución acorde a su caso concreto, no solo basado en la experiencia de los médicos que lo rodean, sino de todos los casos almacenados.
Sin embargo, al igual que esta noticia nos muestra un camino importante para recorrer en el cual el Big Data cobra una gran importancia, nos deja también a la vista uno de los primeros retos a los que se enfrenta, la protección con la que cuentan estos datos de pacientes por parte de la RGPD y que dificultan su extracción de centros médicos a entornos con gran capacidad de computación.
Artículos de interés
A continuación, se dejan dos enlaces a noticias recientes a nivel internacional que muestran la variedad de entornos en los que la utilización del Big Data puede traer beneficios.
- Noticias sobre economía: ITAINNOVA participa en el proyecto europeo EUHubs4Data, un impulso a la economía de las empresas gracias a Big Data. [5]
- Noticias sobre el Big Data en alza: Análisis de datos, ‘Big Data’ y teletrabajo, tendencias al alza en empresas en la pandemia, según Randstad. [6]
Referencias
[1] «Tres tendencias que cambiarán la industria manufacturera en 2020», Industria gráfica online. http://www.industriagraficaonline.com/articulo/24827/
[2] «Big Data Initiatives Are On The Rise Across The Enterprise», Bi.Survey. https://bi-survey.com/big-data-initiatives
[3] «El coronavirus en tiempos del Big Data», Artabro Tech. https://www.artabrotech.com/coronavirus-en-tiempos-del-big-data/
[4] «Big Data e inteligencia artificial como pilares de la
medicina del futuro centran la jornada ‘Algortimos para la salud’», Europa Press.
https://www.europapress.es/esandalucia/sevilla/noticia-big-data-inteligencia-artificial-pilares-medicina-futuro-centran-jornada-algoritmos-salud-20201008170547.html
[5] «ITAINNOVA participa en el proyecto EUHubs4Data, un impulso a la economía de las empresas gracias al Big Data», Europa Press. https://www.europapress.es/aragon/noticia-itainnova-participa-proyecto-europeo-euhubs4data-impulso-economia-empresas-gracias-big-data-20201004125940.html
[6] «Análisis de datos, ‘Big Data’, y teletrabajo, tendencias al alza en empresas en la pandemia, según Randstad», Europa Press. https://www.europapress.es/economia/laboral-00346/noticia-analisis-datos-big-data-teletrabajo-tendencias-alza-empresas-pandemia-randstad-20200818105946.html
Big Data
Introducción
A lo largo de los cinco posts que se publicarán en torno al Big Data, analizaremos, desde el punto de vista de la auditoría, los riesgos, desafíos y controles a los que deben hacer frente las empresas. Sin embargo, en este nos dedicaremos a hacer una pequeña introducción al concepto del Big Data, de manera que entendamos su significado, importancia y evolución a lo largo de los últimos años, a la vez que analizamos cuál es su futuro cercano y el impacto que este tendrá. Para esto, empezaremos abordándolo con una visión amplia, y en los próximos posts nos dedicaremos a entrar más en detalle y desde un punto de vista más enfocado a la auditoría.
¿Qué es?
Cuando hablamos de Big Data nos referimos a conjuntos de datos cuyo tamaño, complejidad y velocidad de crecimiento dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales. Estas características se pueden resumir en lo que se llaman las 3 Vs del Big Data: Volumen, Variabilidad y Velocidad.
¿Para qué?
El objetivo del Big Data es facilitar a las empresas la obtención de respuestas y la identificación de problemas a partir del análisis de los datos recaudados. Gracias a la recopilación de estos datos, es posible buscar tendencias en diferentes ámbitos empresariales, lo que permite adelantarse a futuros problemas que están por venir o prevenir tendencias de los requerimientos de los clientes.

Estas ventajas se trasladan directamente a una reducción de costes en muchos de los aspectos que forman una empresa, facilitan la toma de decisiones y agilizan la creación de nuevos servicios y productos.
Hoy en día podemos encontrar ejemplos del uso del Big Data en las siguientes áreas: registros de logs de TI, para la detección de infracciones de seguridad entre otras cosas; contenido de medios sociales para mejorar los productos, los servicios y la interacción con el cliente; detección y prevención de fraudes en cualquier industria que procese transacciones financieras online, tales como compras, actividades bancarias, inversiones y seguros; y por último, áreas como el turismo, la administración o la publicidad también se ven muy beneficiadas de la toma de decisiones basada en el análisis del Big Data.
Evolución
Hace tiempo que las grandes empresas analizan los datos de sus clientes para evolucionar en la dirección correcta, pero esta capacidad de análisis está directamente ligada a la evolución del Big Data. La capacidad de una empresa de interpretar estos datos es vital para facilitar la identificación de nuevas oportunidades en el mercado, como movimientos de negocio más inteligentes, operaciones más eficientes y clientes más felices, lo que se traduce en clientes más felices.
Con los avances tecnológicos que estamos experimentando a nivel mundial, el coste del almacenaje de los datos está reduciendo de manera significativa, lo que permite almacenar y gestionar el gran volumen de información con el que cuentan las empresas. Este avance, además, es imprescindible para hacer frente a uno de los pilares del Big Data, que es la velocidad con la que crecen los datos que se recopilan.
La capacidad de obtención de los datos con la que cuentan las grandes corporaciones es otro de los factores que han ayudado al crecimiento del Big Data. Estamos rodeados de dispositivos y tecnologías que recopilan datos: desde los web logs, las búsquedas en internet, las redes sociales, teléfonos móviles e incluso los vehículos, lo que es imprescindible para hacer crecer dos de las características que hemos nombrado anteriormente, el volumen y la variabilidad de los datos.

La investigación en torno al Big Data actualmente cuenta con procedimientos complejos que permiten la extracción de nuevos información de los repositorios de datos. Sin embargo, es un continuo reto el poder crear nuevas metodologías para en análisis de los datos generados de las fuentes cambiantes que nos rodean y es aquí donde se encuentra la clave para el futuro y la continua mejora del Big Data.
Futuro
Terminando esta introducción acerca del Big Data, solo falta echar un pequeño vistazo al futuro y ver qué nos esperan los años que vienen. Para ello, veremos unos datos bastante significativos que muestran el continuo crecimiento de los dispositivos que nos rodean. Según Gartner, en 2020 habrá más de 25.000 millones de dispositivos conectados a Internet. A finales de 2013, la cantidad de datos generados por los dispositivos era de 4.4 billones de GB. Cifra que se espera se multiplique por 10 en 2020.
Esta gran cantidad de datos supondrá un gran reto para la tecnología, pues requerirán de nuevas técnicas y de una capacidad de gestión mayor. Y a pesar de que lo conseguido ya con el Big Data permite ver el futuro con optimismo, esto será posible siempre y cuando la tecnología crezca al nivel al que lo hacen los datos. Además, áreas como el medio ambiente, la salud, la productividad o la vida personal podrán verse beneficiadas por esos miles de millones de bytes que generamos diariamente.
Referencias y bibliografía
«Big Data Initiative», Goverment of India, https://dst.gov.in/big-data-initiative-1
«¿En qué consiste? Importancia, desafíos y gobernabilidad», Power Data, https://www.powerdata.es/big-data#:~:text=Cuando%20hablamos%20de%20Big%20Data,convencionales%2C%20tales%20como%20bases%20de
«El origen del Big Data», Universidad de Alcalá, https://www.master-bigdata.com/origen-big-data/#:~:text=Existen%20expertos%20en%20Big%20Data,lograr%20y%20procesar%20la%20informaci%C3%B3n
Smart Cities + Big Data
Anticiparse a los atascos, definir rutas óptimas de recogida de basura en tiempo real o contar con redes eléctricas inteligentes (Smart Grids) son algunos ejemplos de la “magia” del Big Data en una Smart City.
Una Smart City utiliza la tecnología para proporcionar de forma más eficiente sus servicios y así mejorar la calidad de vida de sus habitantes. Hoy en día, esta idea cada vez está tomando más fuerza y protagonismo, por ello empieza a convertirse en una oferta común por parte de todas las ciudades.
Un claro ejemplo de esta evolución son los servicios como la información en tiempo real sobre la llegada de los autobuses, la videovigilancia inteligente, los dispositivos de medición del ruido y gases contaminantes, etc.
Mi experiencia como Data Scientist
Hoy vengo a hablar de mi experiencia como data scientist en IKUSI. La verdad es que tuve la suerte de trabajar con ellos gracias al Máster de Big Data & Business Intelligence realizado en el año pasado. Venía de trabajar como Becario en churning problem (fuga de clientes) para Eroski, en colaboración con Deusto.
Mi etapa fue corta, intensa y preciosa en la Ciencia de Datos. Seguramente, desde mi variada experiencia es la mejor de todas.
Por contextualizar, nos centramos en trabajar con productos del sector aeronáutico. Aparecí en la primera fase de Big Data, donde partiendo de la información existente teníamos que sugerir ideas. El motivo de hacerlo, era porque había muchísimos datos que eran potencialmente interesantes desde el punto de vista de este mundo. Recuerdo algún acrónimo como FIDS (naturaleza de la solución Dolphin, en IKUSI) o Beluga, para gestión de operaciones.
Veíamos el origen de los datos y las distribuciones de los mismos; buscábamos incoherencias y asociaciones así como anomalías… Me divertía como un niño la verdad. A ese proceso se le conoce como EDA (Exploratory Data Analysis).
Participé de manera activa en la generación de ideas para el desarrollo de I+D. A modo reflexión personal y autocrítica, he de admitir que parece fascinante (y para mí y mi cabeza, antes impensable) que se haya abierto un nuevo mundo donde a partir de los datos se pueda aportar valor hasta el punto en el que podamos trabajar exclusivamente sobre los mismos. Recuerdo temáticas como Gate Assigment Problems, Clasificadores de pasajeros, planificadores de anuncios… Para mí eran auténticos hallazgos de problemas que se resolvían con matemática y estadística que antes ni siquiera había escuchado. Se abrió todo un mundo nuevo para mí.
Otro aspecto que me encantaba era el tener que presentar a los distintos departamentos de IKUSI las conclusiones e ideas que se nos ocurrían. Había que ir a donde los departamentos (más concretamente, a donde los Product Owners) y plantearles vías de I+D para mejorar el producto y aportar valor. Me gustaba el no estar eternamente programando; el ser capaz de ofrecer soluciones que, primeramente, eran útiles (esto es, no sólo rentables a largo plazo sino que estas aportarían valor en el negocio) y segundo el realizar estas presentaciones resultado de un proceso de investigación propia. Me sentía como en familia, mejor dicho, en casa. Me sentía valorado y querido; me gané un sitio.
Es obvio que sin la evolución que ha sufrido la tecnología (y que ésta ha generado en el mundo, no sé si llamarlo en consecuencia o de manera recíproca) nada de esto sería posible. De hecho, menos mal que he nacido en esta época; si bien el mundo está globalizado y tiene sus contras tenemos el rol de cambiar las cosas a nuestra manera.
Por ir cerrando el post, he de confesar que muchas veces echo de menos la sensación de despertarme, tomarme un café y ponerme a trabajar en investigar, leer papers de innovación, explorar y atreverme a decidir si eran interesantes para las distintas soluciones dentro de la empresa. Me hacía sentirme un «artista» de alguna manera. Hoy tengo otros objetivos mucho más importantes y toca luchar por ellos y quien sabe, ya veremos si mañana volveremos a ese camino.
El valor añadido de los datos en el mundo organizacional
En este último post expondré mi punto de vista sobre los aspectos comunes que he identificado en los diferentes textos. En primer lugar voy hablar sobre un tema que se encuentra presente en todos ellos: los datos.
Los datos se encuentran detrás de cada nuevo producto o innovación tecnológica. Podríamos decir que el producto o la tecnología en sí sería la maquinaria, y el dato su combustible. Por este motivo, el volumen de datos que producimos está aumentando exponencialmente. Esto puede ser un problema ya que si no gestionamos adecuadamente dichas cantidades de datos, podemos perder el control sobre ellos, lo que supone numerosas consecuencias: fuga datos, exceso de información, problemas de privacidad… Por lo tanto, pienso que una de las principales ocupaciones de las empresas debería ser el tener una correcta gestión de los datos que generan y procesan.
Para dicha gestión, en primer lugar se debería tener consciencia de aspectos como qué tipos de datos se tratan, dónde se encuentran localizados, en qué parte del negocio tienen impacto… Es decir, tener formalizada una buena base a partir de la cual posteriormente se tomará como punto de partida para explotar los datos. En segundo lugar, se debería de establecer un método para integrar las diferentes fuentes de datos, ya que uno de los grandes problemas del big data es que los datos se encuentran en una amplia variedad de formatos, entre los cuales no sólo están los archivos de texto, sino también datos biométricos, voz, patrones de usuario… Pienso que disponer de una herramienta o tecnología que consiga unificar todo el espectro de datos es clave para sacarles el máximo rendimiento.
Por otro lado, los usuarios no son la única fuente de datos. Los dispositivos conectados que conforman el IoT (Internet of Things) aportan grandes cantidades de información que las empresas pueden utilizar para mejorar la calidad de sus servicios. Relacionándolo con la idea del apartado anterior de unificar los datos, otra de las ideas que se presentan en los textos es la poca o nula compatibilidad entre los diferentes dispositivos IoT. En mi opinión, se debería de establecer un protocolo universal mediante el cual cualquier dispositivo pudiese interactuar con el resto. De esta manera, las empresas se centrarían en mejorar la calidad de su producto y no tendrían que preocuparse por la implementación del sistema de comunicación. Además, la eficiencia de los programas inteligentes que hiciesen uso de los datos proporcionados por los dispositivos IoT aumentaría considerablemente debido a que al disponer de mayores cantidades de información se prestaría un servicio mucho más personalizado para el usuario.
Por último, me gustaría hablar sobre los Data Scientists. Cuando la información ha sido clasificada, depurada e integrada, aún no aporta un valor añadido importante a la organización. Es cuando los expertos en datos (o los llamados Data Scientists) realizan análisis y procesamiento de los datos mediante técnicas de big data cuando realmente se genera un conocimiento que sea de vital importancia para la toma de decisiones. Con esta idea quiero destacar que sólo por disponer de una gran cantidad de datos no vamos a conseguir una ventaja competitiva. Por ello, el papel de los Data Scientists es cada vez más importante debido a que son éstos los que extraen el conocimiento de unos datos que a simple vista sólo son los registros de la actividad de la organización.
Big Data y la protección de los datos
Hoy en día, si estamos mínimamente enterados del mundo tecnológico empresarial, seguramente que nos venga a la cabeza el término de Big Data, ya que ha sido uno de los conceptos más populares de las compañías los últimos años (como se puede ver en la imagen).
Todo eso ha hecho que parezca que todas las compañías tengan que invertir en ello, para poder sacar provecho a todos esos datos crudos que tenemos, transformarlos en información, y así, poder, por ejemplo, a encontrar posibles nichos de negocio sin explorar, que puedan beneficiar a la compañía.
Gracias a ello, se generan beneficios a las compañías, pero tiene un “problema”, que es básicamente, que, para hacer un análisis de Big Data, vas a necesitar datos (además de manera masiva), lo que termina generando una necesidad de los mismos, y para ello, al final, somos nosotros los que se los damos, muchas veces sin ningún tipo de control.
Aquí surge la típica frase, que define Internet, que es que “Si el producto es gratis, eres tú el producto”, ya que, en internet, nos hemos acostumbrado a que prácticamente todo sea gratis, y si no es así, pues prácticamente no lo queremos, sin darnos cuenta de que estamos pagando un gran peaje para poder entrar.
Todo esto puede parecer algo prácticamente exagerado, que no es para tanto, que es prácticamente imposible que todo esto me vaya a afectar… pero esto no está muy lejos de la realidad; ya es bastante común que, a la hora de contratar a un candidato, las compañías hagan un análisis previo de la actividad del candidato por las redes, y si encuentran algo que no les guste, pueden terminar no cogiéndote por eso.
Esto también es un problema de culturas: mientras que aquí, en Europa, se tiene una mentalidad más de protección de lo individual frente a la sociedad, en otros países, como en Estados Unidos, esto es prácticamente al revés (se le da prioridad a la sociedad, frente al individuo), a la hora de la protección de los datos; y claro, la mayoría de las compañías (Google, Facebook, Microsoft…) son americanas.
Por último, también recordar que no sabemos quién es el dueño final de nuestros datos, ya que algunas compañías venden esos datos sin ton ni son a otras compañías terceras, donde estos pueden hacer cualquier cosa con los mismos, como, por ejemplo, venderlos a otros…
Pero esto no solo se limita a la privacidad, también está el problema de las filtraciones de los datos, donde ya es casi costumbre que esto ocurra a las compañías, donde se roban cientos de miles de registros de información privada (y a veces crítica), sin poder hacer gran cosa para poder evitarlo.
Debido a esto, el nuevo reglamento de protección de datos busca poder “controlar” estos aspectos, aunque con las compañías externas parece que “no debe de cambiar mucho”, ya que, aunque los datos estén ahora en suelo europeo (si tratan con datos de ciudadanos europeos), prácticamente no hay ninguna garantía de que vayan a usarlos “correctamente”, porque el acuerdo se puede resumir en “vamos a usar los datos de los ciudadanos europeos de manera correcta”.
En conclusión, parece que el Big Data tiene un gran potencial, pero también un gran riesgo, si no se utiliza bien. Así que habría que tener una reflexión a la hora de usarlo, no solo teniendo en cuenta cuestiones de la compañía (qué me va a aportar…), sino también usando un poco la empatía, y pensar qué puede pasar a los usuarios finales por recolectar todos esos datos de los mismos, son ningún tipo de criterio.
- 1
- 2
- 3
- 4
- Next Page »