MÓDULO V: RECUPERACIÓN Y VISUALIZACIÓN DE DATOS
Presentación
En este módulo se presentan varias de las tecnologías más representativas para la recuperación y visualización da datos dentro del contexto del Big Data. En primer lugar, se proporcionarán un conjunto de fundamentos sobre la visualización de datos. Por otra parte, se introducirán diversas tecnologías de recuperación y visualización de datos más específicas, como Tableau o librerías específicas de Python.
Los estudiantes también trabajarán con ElasticSearch y Kibana; siendo el primero de ellos un motor de búsqueda e indexación de información avanzado bastante popular en la comunidad de desarrollo de tecnologías Big Data. La segunda, Kibana, la herramienta de visualización de información que complementa ElasticSearch. Todas estas herramientas son bastante flexibles y adaptativas, permitiendo un amplio abanico de posibilidades de configuración.
Por último, se proporcionarán diversos casos de uso generales en cuanto a visualización de datos se refiere.
Contextualización
Dentro del campo del Big Data, no sólo es importante la definición de las arquitecturas que gestionan un conjunto de datos masivo, tales como Hadoop o Spark, y todo su ecosistema relacionado. También es muy importante la recuperación de información, a ser posible de la manera más eficientemente posible. Por ello, existen bases de datos que almacenan e indexan la información de una manera más actual y menos tradicional, además de complementarse con otras tecnologías dentro del paradigma Big Data.
Por otra parte, directamente asociada a la recuperación de información tenemos a las tecnologías de visualización de datos. Estas son muy importantes, además de relevantes en la actualidad. Nos permiten captar un conjunto de información relativamente grande de un solo vistazo. Por otra parte, con las diversas representaciones existentes, podremos apreciar la importancia de unos datos u otros, desde diversos puntos de vistas, sacando así conclusiones más precisas sobre la temática que se esté tratando.
Importante es la visualización además a la hora de realizar informes que resuman la información que queramos presentar ante un colectivo y/o de cara a mejorar las prestaciones de una arquitectura Big Data, detectando sus debilidades y posibles mejoras.
Conocimientos previos recomendables
Para cursar adecuadamente este tema es muy recomendable tener los siguientes conocimientos previos:
- Familiaridad con el sistema operativo Linux y Windows.
- Familiaridad con tecnologías de virtualización de escritorio.
- Conocimientos de programación (Python, SQL, JSON, …).
Resultados de aprendizaje
Los resultados más relevantes que se pretenden alcanzar con el estudio de este módulo son los siguientes:
- Comprensión los conceptos de recuperación y visualización de información.
- Conocimiento sobre distintos tipos de representaciones gráficas básicas y avanzadas.
- Manejo de Tableau para la representación gráfica de información.
- Manejo de ElasticSearch y Kibana para la recuperación y visualización de información.
- Manejo de librerías avanzadas en python para la representación gráfica de información.
- Aplicación de las tecnologías aprendidas a la vida real.
Contenidos
Los contenidos de este módulo se organizan en los siguientes capítulos:
- Introducción
- Tipos de gráficos y su uso
- Ejemplos prácticos
- Tableau Public / Tableau Desktop
- Instalación y primeros pasos
- Primera aplicación
- Ejemplos avanzados
- ElasticSearch / Kibana
- Configuración del motor ElasticSearch
- Creación de gráficos con Kibana
- Programación avanzada de gráficos
- HoloViews
- Bokeh
- Casos de uso
Bibliografía
[Baldwin16] David Baldwin. Mastering Tableau. Packt Publishing, 2016. Enlace: http://proquest.safaribooksonline.com/book/databases-and-reporting-tools/9781784397692
[Bokeh19] Bokeh website, 2019. Link: https://bokeh.pydata.org/en/latest/
[Cairo16] Alberto Cairo. The Truthful Art: Data, Charts, and Maps for Communication. New Riders, 2016. Enlace: http://proquest.safaribooksonline.com/book/databases-and-reporting- tools/9780133440492
[Elastic19] ElasticSearch/Kibana website, 2019. Link: https://www.elastic.co/guide/en/kibana/current/getting-started.html
[Gupta17] Yuvraj Gupta, Ravi Kumar Gupta. Mastering Elastic Stack. Packt Publishing, 2017. Link: http://proquest.safaribooksonline.com/book/databases/business-intelligence/9781786460011
[HoloViews19] HoloViews website, 2019. Link: http://holoviews.org/
[Sharma16] Vishal Sharma. Beginning Elastic Stack. Apress, 2016. Link: http://proquest.safaribooksonline.com/book/operating-systems-and-server- administration/9781484216941