Apache Ambari – Instalación de un Cluster Hadoop de manera sencilla.

La instalación y configuracion de Hadoop fue uno de los primeros quebraderos de cabeza a los que tenía que enfrentarse la comunidad cuando quería realizar pruebas.

Han surgido diversos proyectos que pretenden automatizar la instalación de Hadoop y su ecosistema a través de distintas herramientas, managers, administradores, etc. De hecho es uno de los principales puntos fuertes que tienen los Middlewares como Cloudera.

En esta línea surge el proyecto Apache Ambari, que busca facilitarnos la tarea de instalación de Hadoop.

Resumen de Ambari

  • Con Apache Ambari vamos a poder:· Proporcionar un Cluster Hadoop
    – Proporciona un instalador (wizard) paso a paso para instalar los servicios de Hadoop a distintos Hosts.
    – Permite configurar los servicios del Cluster Hadoop
    · Administrar un Cluster Hadoop
    – Permite iniciar, parar y reconfigurar los servicios de Hadoop
    · Monitorizar un Cluster Hadoop
    – Proporciona un dashboard para la monitorización de la salud y el estado de los nodos del Cluster Hadoop
    – Tenemos Glanglia para recolectar métricas
    – Nos ayuda en la instalación de Nagios, para alertarnos y enviarnos emails cuando sea necesario…
    · Además tiene una rich API Rest por si queremos hacer algún desarrollo propio.