Entrevistas TenTIC: Carlos Alonso, Big Data

En el marco de nuestro proyecto Ten TIC (tendencias de futuro en las TIC) seguimos con nuestra serie de entrevistas a expertos. Esta semana entrevistamos a Carlos Alonso, de la empresa Meteoclim, spin-off de la Universidad de las Illes Balears, que se dedica a generar e analizar información meteorológica y climática con sus propias herramientas de predicción atmosférica, climática e hidrológica con la tecnología más avanzada para hacer previsiones meteorológicas para grandes eventos deportivos medios de comunicación e estudios d´impacto del cambio climático .

Carlos Alonso de Meteoclim (Fuente:ibeconomia.com)

1.- Qué relación tiene MeteoClim con el Big Data?

En el día a día de la empresa utilizamos grandes cantidades de información procediente tanto de las predicciones meteorológicas que generamos nosotros mismos, como de las proyecciones climáticas globales que utiliza el IPCC para elaborar sus informes. Esta información se tiene que tratar de forma personalizada según el uso final, de manera que partimos de grandes matrices de información y se va desgranado en bloques más pequeños de información para su análisis y tratamiento. Para hacerse una idea rápida, sólo un modelo climático tiene información diaria para más de cien años, y además se tiene que tener en cuenta que hay una gran cantidad de variables (temperatura, precipitación, etc..) y que como mínimo se trabajan tres escenarios de crecimiento económico. Esto sólo por un punto y un modelo, nosotros solemos trabajar con redes que cubren todo el mundo y como mínimo con 10 modelos diferentes…Para Meteoclim el Big Data es el día a día.

2.- ¿Qué metodología y tecnología utilizáis para buscar y almacenar la información?

En general almacenamos la información en ficheros NetCDF, que están pensados para datos científicos y son ampliamente utilizados en climatología, meteorología y aplicaciones de sistemas de información geográfica. Estos ficheros forman parte de un repositorio basado en un servidor THREDDS, una herramienta orientada a la conectividad entre proveedores científicos y posibles usuarios finales.

3.- ¿Qué fuentes de información analizáis?

Nosotros trabajamos con nuestras propias predicciones, así que generamos nuestras fuentes, y cuando es necesario utilizar un modelo global de predicción meteorológica utilizamos el GFS americano. En la rama de cambio climático utilizamos los datos del CMIP5, que son las que utiliza el IPCC para elaborar sus informes. 

4.- ¿Qué metodología y tecnología utilizáis para analizar la información que extraéis de las fuentes antes mencionadas? 

El tratamiento de datos lo hacemos con el programa estadístico R, que tiene capacidad para tratar con grandes cantidades de datos si va acompañado de un entorno informático con gran capacidad de cálculo. La principal ventaja es la gran versatilidad y personalización que permite.

5.- ¿Cuáles son las variables que analizáis y cómo relacionáis unas variables con las otras?

Analizamos las variables meteorológicas y climáticas presentes en los modelos y en las observaciones. Por ejemplo, temperatura, precipitación, cobertura nublosa, viento, etc. La relación entre ellas viene marcada por la física, por ejemplo, una zona de baja presión atmosférica suele estar asociada con vientos fuertes y elevación, que puede producir nubes.

6.- ¿Qué tecnología utilizáis para realizar los mapas y los gráficos que ofrecéis a vuestros clientes?

Para realizar los mapas y gráficos utilizamos una mezcla de scripts de R para preparar los datos, herramientas de visualización como highcharts para los gráficos, y leaflet para los mapas. Ambas herramientas permiten interacción por parte del usuario.

7.- ¿Qué dificultades os habéis encontrado para realizar este análisis y cómo las habéis solventado?

La mayor parte de las dificultades que hemos ido encontrando son la velocidad de cálculo de estos análisis, cuando haces predicciones propias y quieres actualizarlas lo mejor posible. Para ir resolviendo estas dificultades se trabaja en mejorar la eficiencia de los scripts que utilizamos y en aumentar la capacidad de cálculo de los equipos informáticos, tanto los nuestros como los servidores en la nube que tenemos contratados.

8.- ¿Cuáles son los resultados más significativos que podéis explicar ?

Como hemos dicho, para nosotros el Big Data es el día a día. Cualquier servicio o producto que ofrecemos utiliza la información generada por nosotros, para decirlo de una forma sencilla, nosotros trabajamos con Big Data de manera operacional y rutinaria. Se tiene que tener en cuenta que las predicciones puntuales que podemos hacer, por ejemplo, por un acontecimiento concreto, salen de estas grandes matrices de información. Nuestro objetivo es aprovechar esta gran cantidad de información para el máximo número posible de clientes y usuarios. Las principales investigaciones y avances que hacemos es al generar nuevas maneras de visualizar estos datos y que lleguen al máximo número de sectores.

9.- ¿Qué aconsejáis que estudie a un joven que se quiere dedicar al análisis y visualización de datos en el campo del Big Data?

Necesitará una buena base de programación y capacidad para aprender nuevos lenguajes de programación, puesto que es un campo en constante evolución. Además, también es importado tener conocimientos de análisis de datos y matemáticos en general.

10.- ¿Y a uno que se quiera reciclar para dedicarse a este nuevo campo que ahora parece estar tanto de moda?

La forma de reciclarse y aprender es ponerse a  trabajar en ello. Por lo tanto, lo mejor es coger un conjunto de datos de todas las que hay de libre descarga, tratarlos y visualizarlos. Durante todo este proceso hay numerosos manuales y ejemplos en línea y una comunidad muy grande que dan soporte para ir superando las trabas.

11.- ¿Nos puede recomendar una película que te ha inspirado en tu trabajo?

A pesar de que es Ciencia ficción, y por lo tanto no es rigurosamente lo que intentamos aplicar a nuestro trabajo, creo que “El día de mañana” me gustó y me impactó. El año que se proyectó, en el 2004, yo empezaba a interesarme por temas de cambio climático y me sirvió para hacerme preguntas y encontrar respuestas.

12.- ¿Nos puede recomendar un libro que explique parte de lo que está haciendo?

Mi día a día en la empresa está más enfocado a la gestión y la comercialización. Mi recomendación iría más hacia este sentido, por ejemplo, “El Método Lean Startup”.

 

 

Acerca de Dr.TIC

Servei d'assessorament tecnològic per a empreses que volen obtenir una visió general del grau d'ús de les TIC al seu negoci i millorar la seva salut TIC.
Esta entrada fue publicada en Big Data, Entrevistas, Noticias, TenTIC. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Spam protection by WP Captcha-Free