Buscando una forma sencilla de analizar los logs de un servidor web sin complicarme la vida demasiado acabé dando con goaccess. Su ventaja sobre otros productos que requieren de una instalación compleja radica en que puede utilizarse directamente en la terminal sin necesidad de software adicional, aunque también podemos exportar informes HTML bastante completos, e incluso en JSON o CSV.
Su instalación en Debian (donde yo lo he probado) y derivadas es extremadamente sencilla:
apt-get install goaccess
Aparte de Debian también lo tenéis disponible no sólo para distros Linux como Fedora, Arch Linux o Gentoo sino también para sistemas basados en UNIX como OS X, FreeBSD, NetBSD o Solaris. Incluso podréis utilizarla en Windows en un entorno Cygwin. En estos casos el proceso de instalación también es sencillo. Para los más puristas, siempre quedará la opción de compilarlo desde el código fuente que podremos encontrar en la página que el proyecto tiene en Github.
Podemos ver las opciones disponibles del programa poniendo en terminal:
goaccess
Como mínimo tendremos que indicarle la localización en la que se encuentra el log del servidor web a analizar, cosa que podemos hacer con la opción -f
:
goaccess -f /var/log/apache/access.log
Después podremos seleccionar el formato en el que está definido el log para que Goaccess elabore el informe después de parsearlo. En este sentido, soporta formatos comunes, combinados, VirtualHosts… por lo que podremos utilizarlo en servidores web Apache, Nginx e incluso Internet Information Services de Microsoft.
Una vez seleccionado el formato del log podremos ver el informe en el que se nos facilita información como número de visitas, frases de búsqueda, códigos HTTP, páginas con error, recursos a los que se ha accedido, bots, etc…
Como decía al principio, una herramienta muy útil y sencilla tanto de instalar como de utilizar para administradores de servidores web.