Resumen Jornada sobre Big Data en la UIB

La UIB está poniendo en marcha el Máster Oficial en Análisis de Datos Masivos en Economía y Empresa (MADM) y por este motivo organizó unas jornadas sobre Big Data. Un grupo de experimentados ponentes han compartido sus experiencias sobre las tecnologías y las aplicaciones del Big Data.

Ponentes de la jornada sobre Big Data en la UIB

Ponentes de la jornada sobre Big Data en la UIB

¿De qué estamos hablando cuando hablamos de Big Data?

En primer lugar José Manuel Benítez Sánchez, profesor del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada, explicó a qué velocidad crece la medida de los datos. El que hoy es «big» mañana puede dejar de serlo, porque mañana «big» será mucho más «big» que hoy. Por lo tanto, tenemos que saber de qué estamos hablando cuando hablamos de Big Data. Hoy ya se plantean las unidades de medida de Exabyte, Zettabyte, Yottabyte. ¿Y qué es esto? En esta entrada de la Wikipèdia podéis ver las equivalencias.

Benítez explicó que los conjuntos de datos son muy variados, no sólo hay información en las bases de datos, también la hay en las imágenes, en los vídeos, en los documentos,… Por todas partes hay datos que se pueden analizar. Los datos crecen a una gran velocidad y seguramente la tecnología para procesarlos no evoluciona a la misma velocidad. Cuando se habla de datos se tiene que tener en cuenta la Ley de Moore y ver como éstos están creciendo de forma exponencial. También recordó las 8 Vs del Big Data: volumen, volatilidad, variedad, valor, velocidad, variabilidad, veracidad, validez.

A continuación Benítez referenció un estudio utilizando el Big Data. Se trata de un análisis a partir de las buscas realizadas al buscador de Google en todo el mundo para determinar como evolucionaba la epidemia de la gripe. Se puede consultar el artículo «Detecting influenza epidemics using search engine query data» en la revista científica Nature. 

¿Qué tecnologías son necesarias para resolver los problemas de Big Data?

Antes de resolver un problema se tiene que enmarcar bien, recordó Benítez, comentando que no todo es Big Data. A pesar de que cuando hablamos de grandes cantidades de datos, para el análisis de las cuales se necesitan muchos ordenadores interconectados, hay que pensar en algoritmos que sean escalables. Y para poder llevar tal magnitud de análisis a la práctica han nacido tecnologías como MapReduce de Google, Hadoop de Yahoo y todo un ecosistema, Spark, Flink.

Para intentar entender como funciona MapReduce se puede empezar mirando esta presentación  y leyendo este artículo de referencia «MapReduce: simplified data processing on large clusters». Según Benítez uno de los éxitos de MapReduce ha sido poner al alcance la programación distribuida para «dummies».

Otra tecnología que ha facilitado el análisis masivo de datos ha sido Hadoop comenta Benítez. Apache Hadoop es un software que soporta aplicaciones distribuidas bajo una licencia libre. Hadoop se inspiró en los documentos Google por MapReduce y Google File System (GFS). Hadoop tiene un ecosistema muy diverso en continuo crecimiento. Y finalmente comenta que salió Spark, un entorno a trabajo genérico y rápido por el procesamiento de datos masivos. Está centrado en una estructura de datos distribuidos denominada «Resilient Distributes Dataset» (RDD).

Casi para acabar, Benítez recordó que para análisis del Big Data es interesante considerar los servicios del Cloud Computing, para pagar por uso, y no tener que realizar a priori una gran inversión; cómo los que ofrecen Google  o Amazon (aquí se ofrece un curso de cómo aprender a utilizarlo).

Aplicaciones del Big Data

Las aplicaciones de los Big Data son diversas, recordó Benítez, desde el análisis de servicios financieros, de servicios de salud o patrones de comportamiento. Explicó el ejemplo de un padre de una adolescente de Estados Unidos que se da cuenta del embarazo de la hija por las ofertas promocionales que le enviaban a casa relacionadas con bebés. Y todo porque la empresa seguía los patrones de compra de la hija a través de datos. En este artículo del País se explica la historia de la adolescente embarazada predecido por el Big Data.

Ángel García Crespo, profesor de la Universidad Carlos III de Madrid y Director del Instituto de Desarrollo Tecnológico y Promoción de la Innovación, expuso el caso práctico del Big Data aplicado al análisis de la percepción de las marcas a partir de la información publicada por los usuarios en las redes sociales, en concreto a Twitter.

García explicó todas las decisiones previas que se tienen que tomar antes de analizar los tweets que hablan de una marca, como: diferenciar los tweets emitidos por los usuarios de los emitidos a través de las cuenta de la marca y el filtraje de tweets por tópicos. En este caso el análisis era sobre automóviles y diferenciaban los tweets relativos a: los atributos de la marca y el producto, el lanzamiento de nuevos modelos o mejoras, la comunicación de campañas, el patrocinio de acontecimientos musicales, deportivos o culturales o noticias corporativas. Además se realizaron análisis desde 3 perspectivas: (a) de qué habla la gente, (b) qué le interesa a la gente y (c) qué opina la gente. Los indicadores que García y su equipo analizaron fueron: popularidad, alcance, esfuerzo/producto y compromiso.

Algunas de las conclusiones a las cuales llegó García en el análisis de tweets es que no se puede programar un sistema de análisis automático y de filtrado universal. Por ejemplo, cada marca lleva asociada una antimarca, comentó el símil de Timofónica para Telefónica. Y cada marca tiene su propio corpus de terminología. También incidió en el hecho de que correlación no siempre implica causalidad, refiriéndose a la relación entre ranking y ventas.

Javier Andrés, CE0 de 7ideas.com, explicó que el Big Data se puede aplicar a la detección del fraude, la gestión de marketing, la predicción de precios y la gestión del producto. Por ejemplo, en una web de viajes decidir qué ofertas se muestran primero en la página principal puede ser la tarea de un algoritmo que haya analizado millones de reservas previas.

Big Data y negocios

Miguel Iza Moreno (@IzaMMiguel) Head of Data & Analytics a Hotelbeds Group / TUI Group, explica que en el mundo de los negocios lo que puede solucionar el Big Data se tiene que explicar con el argot que puedan entender las personas de negocios, para que los proyectos puedan calar dentro de la empresa. Según su experiencia la emprea aprende con el Big Data que los procesos siempre se pueden mejorar y que colaborando con terceros aparecen nuevos modelos de negocio; a pesar de que las empresas no siempre obtienen una solución a los problemas planteados.

Para Iza el principal reto es conocer mejor al cliente como persona, aunque, advierte que del análisis de las personas hay una variable que nunca controlaremos: las circunstancias.

Big Data aplicado al conocimiento de los clientes. Miguel Iza. Hotel Beds

Big Data aplicado al conocimiento de los clientes. Miguel Iza. Hotel Beds.

En el caso de Hotel Beds, cada vez que la empresa interactúa con el cliente se almacenan datos, pero para sacar provecho, para que sean útiles, se tiene que dotar de inteligencia a estos datos, explica Iza.

Hotel Beds tiene todo un departamento para analizar cómo son sus clientes formado por: jefe de datos y análisis, arquitecto de datos, visualizador de datos, gestor de datos, científico de datos e ingeniero de datos. Sus retos son: predicción de respuestas en el servicio de atención al cliente, optimización comercial operativa, predicción del potencial (operadores turísticos y hoteles), predicción de abandono de clientes, pronóstico de días de estancia, motor de recomendaciones.

Big Data y Marketing Intelligence

Alex Rayón Jerez (@alrayon), Director Deusto eCampus y Director y Profesor del Programa de Big Data y Business Intelligence de la Universidad de Deusto, habló sobre el Marketing Intelligence. En primer lugar recomendó leer el artículo «Big Data: The Management Revolution» publicado en Harvad Business Review.

Alex Rayón explicando el "Customer Journey"

Alex Rayón explicando el "Customer Journey"

Rayon ilustró el «Customer Journey»: un viaje a través de los puntos de contacto físicos y digitales. Más que explicar en este artículo todo lo que contó a la audiencia creemos mejor que leáis su blog y reviséis una presentación que tiene publicada de 135 slides «Marketing Intelligence: cómo optimizar mí estrategia de marketing a través del Big Data». Es totalmente recomendable esta lectura. Aún así os dejamos algunos destacados de su charla:

  • Existen diferentes herramientas para cada etapa de contacto con el potencial cliente y cliente con la marca.
  • Se percibe un declive de las «celebrities» en pro de los «influencers», y se convierte en tendencia elegir prescriptores de las marcas que son más «influencers» sin necesidad de ser grandes «celebrities».
  • La tarjeta de fidelización es el mejor instrumento para capturar datos.
  • Nos encontramos en la era de monetarización de la influencia social.
  • La teoría de grafos sirve para analizar y saber quién es el «influencer».
  • Uno de los objetivos del Big Data es impactar a la persona correcta con la oferta idónea. Por ejemplo, ya existe una aseguradora que te ofrece un seguro en función a la tipología de conducción implantando un sistema al coche para analizar los datos de conducción: velocidad, prudencia, trayectos, horarios, etc.

Recoger los datos

Andrés, de 7ideas.com, empresa perteneciente al grupo Logitravel, habló sobre la importancia de recoger los datos para posteriormente poder ser analizadas a través de algoritmos. Andrés recordó que los datos que tiene recopiladas una empresa es un activo más para poderla valorar. En el caso de http://www.7ideas.com/ guardan datos clasificados con más de 100 variables correspondientes a más de 1.000 reservas de hoteles al día. Recoger datos no es barato ni sencillo explica Andrés, además la tecnología evoluciona muy rápido. Actuamente usan Sckit Learn, Kafka, Storm, MongoDB, Redis, Tensor Flow, Couchbase, Cassandra.

Tecnologías utilizada en 7ideas.com explicadas por Javier Andrés

Tecnologías utilizadas en 7ideas.com explicadas por Javier Andrés

Andrés explicó que con datos históricos y datos nuevos, con entrenamiento y nuevo entrenamiento se pueden descubrir algoritmos por ejemplo para realizar predicciones.

Los datos de los clientes de un hotel se pueden recopilar, por ejemplo, utilizando pulseras con sensores que te permitan también cargar los servicios consumidos a la cuenta del cliente, menciona Andrés.

Mauricio Socías Prats, CEO de MallorcaWifi, explicó que los datos también se pueden recoger de las redes desplegadas de wifi. Por ejemplo, a través de los usuarios que se conectan a una wifi pública, como la de Palma, se pueden conocer los flujos de gente sobre el territorio, cuáles son los itinerarios más masificados o menos, y sobre esta información los gestores públicos pueden tomar decisiones. Socías planteó el ciudadano y el turista como sensor, y que a través del seguimiento de las personas se puede predecir su comportamiento.

Flujos de personas en Palma captadas por Mallorca Wifi explicado por Mauricio Socias

Flujos de personas en Palma captados por Mallorca Wifi explicado por Mauricio Socias

Demanda de profesionales expertos en Big Data

Benítez explicó que hay gran demanda de profesionales de análisis de datos. Lo llaman en la universidad empresas alemanas para que les envíe alumnos.

Iza también comenta la carencia de profesionales en el análisis de datos y, para ilustrarlo, nos muestra una imagen con la demanda de profesionales en España. Además, reivindica la figura del sociólogo para el análisis de datos además de los matemáticos, no todo el mundo tiene que tener un perfil técnico, también son interesantes los perfiles sociales, por la parte teórica que pueden aportar en los análisis del comportamiento de las personas.

Ilustración de la demanda de profesionales de Big Data en España expuesto por Miguel Iza

Ilustración de la demanda de profesionales de Big Data en España expuesto por Miguel Iza

CineTIC

En esta jornada sobre Big Data se mencionaron algunas películas que describen parte de lo que explicaban los ponentes. Iza referenció Ex-Machina sobre inteligencia artificial  y Money Ball sobre análisis de datos.

Visualización de datos

Iza explicó que tan importante es el análisis de datos como la visualización de estos y para ejemplificarlo nos muestró un blog de recetas de cocina con ilustraciones que muestran la proporción de ingredientes para cada receta.

 Presentaciones de la jornada

 Se pueden descargar todas las presentaciones a través de la Web de la Jornada.

Acerca de Dr.TIC

Servei d'assessorament tecnològic per a empreses que volen obtenir una visió general del grau d'ús de les TIC al seu negoci i millorar la seva salut TIC.
Esta entrada fue publicada en Big Data, Noticias, TenTIC. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Spam protection by WP Captcha-Free