Cómo visualizar datos complejos en Linux

Tabla de contenido:

Anonim

Probablemente haya oído hablar de Elasticsearch, el motor de búsqueda que le permite indexar y luego buscar rápidamente en sus datos. Es posible que haya creado algunas visualizaciones en Kibana, la GUI para Elasticsearch, señalando y haciendo clic en su camino a través de la elegante interfaz.

Es posible que no haya utilizado un complemento de visualización menos conocido llamado Timelion.

Timelion es una fantástica herramienta de creación de visualización que hace posible escribir sus consultas en su lenguaje de expresión simple y poderoso para mostrar gráficos. Se utiliza para mostrar datos de series de tiempo, como el crecimiento de la población o las visitas a su sitio web.

  • A continuación, se muestra una lista de las mejores computadoras portátiles para desarrolladores.
  • Consulta estas mejores distribuciones para desarrolladores
  • Analice números con facilidad en estas mejores estaciones de trabajo
Acerca de este articulo

Este artículo apareció por primera vez en Linux Format Magazine, número 269, publicado en noviembre de 2022-2023.

Con Timelion, podemos calcular promedios móviles, mostrar la diferencia entre los datos de la semana pasada y los de hoy, y realizar una detección básica de anomalías. Es una herramienta útil para saber cómo trabajar. Empecemos.

Instalación

Si es un lector de formato Linux habitual, hay ejemplos de composición de Docker para configurar un clúster en LXF261.

De lo contrario, instalar Elasticsearch y Kibana es relativamente sencillo. El único requisito es Java, que es posible que ya haya instalado.

Si no un simple sudo apt install default-jre lo instala en distribuciones basadas en Debian o un sudo dnf install java debería hacer lo mismo para la familia de distribuciones Red Hat.

Luego, solo necesita descargar la última versión de Elasticsearch y Kibana para el tipo de sistema operativo que desee.

En el momento de redactar este artículo, la última versión es kibana-7.8.1-linux-x86_64.tar.gz.

Puede extraerlo con tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, cambiar al directorio extraído y ejecutar ./bin/kibana & para iniciar la instancia de Kibana.

Cuando haya realizado exactamente los mismos pasos para configurar Elasticsearch, reemplazando 'kibana' por 'elasticsearch', debería poder navegar a http: // localhost: 5601 en su navegador favorito y ver una nueva y brillante interfaz de Kibana para jugar alrededor con.

Si prefiere instalar paquetes con un administrador de paquetes, el mismo enlace que antes tiene información sobre cómo agregar el repositorio de Elastic a su sistema e instalar los paquetes de Kibana y Elasticsearch de esa manera.

Puede superponer gráficos uno encima del otro y utilizar el formato para que sus gráficos se vean de la mejor manera.

Obtener algunos datos

Las versiones recientes de Kibana permiten ingerir conjuntos de datos en nuestro clúster automáticamente con el Visualizador de datos en lugar de tener que crear un script o una configuración de Logstash. Puede trabajar con conjuntos de datos en formato JSON o CSV, así como con algunos archivos de registro estándar, como los registros de Apache. La única limitación es que tienen menos de 100 MB de tamaño. Esto es más que suficiente para nuestros propósitos.

Utilizaremos el conjunto de datos mundial de casos Covid-19 del portal de datos abiertos de la UE. Descargamos el archivo CSV de la sección Recursos de la página.

Si tiene problemas, puede optar por descargar la versión .xlsx de Excel, abrirla con LibreOffice Calc y guardarla en formato CSV de texto (.csv). También hay una versión JSON disponible para descargar que puede usar como alternativa.

Para acceder al Visualizador de datos en Kibana, haga clic en el icono de hamburguesa en la parte superior izquierda, luego en Aprendizaje automático y finalmente en Visualizador de datos. Una vez allí, haga clic en Cargar archivo dentro del cuadro Importar datos, luego seleccione o arrastre y suelte un archivo y elija su archivo csv para ingerir.

Después de un breve análisis, mostrará algunas estadísticas que se descubren en las primeras 1000 líneas del archivo CSV. Este será el formato en el que cree que se encuentra cada uno de los campos, como texto, fecha o número, y resaltará los valores principales que se encuentran en los campos.

Por lo general, hace un buen trabajo resolviendo esto por nosotros. Si necesita realizar algún ajuste, puede hacer clic en Anular configuración para modificar, por ejemplo, el nombre del campo tal como se configurará en Elasticsearch.

Un nombre de campo que deberíamos anular es dateRep, que representa la fecha de la cifra calculada en nuestro conjunto de datos. Timelion no sabrá cómo usar esto como el campo de tiempo de forma predeterminada, por lo que podemos simplificar nuestra vida más adelante cambiando el nombre de este campo ahora a algo que reconozca.

Un buen candidato es marca de tiempo. Haga clic en Aplicar para configurar eso. Cuando esté satisfecho con el aspecto del resto, haga clic en Importar en la parte inferior, asigne un nombre al índice (elegimos covid) y luego haga clic en Importar nuevamente para obtener los datos en su clúster.