Cloudera: Solución Big Data Analytics

Cloudera ofrece un altísimo rendimiento y es una plataforma para el uso de los datos para obtener mejores resultados de negocio.

Con la tecnología de distribución más popular del mundo: Apache Hadoop, Cloudera le permite centrarse en los resultados. Ofrecen soporte, servicios y formación.

Cloudera-LogoSu principal producto es Cloudera Enterprise consistente en una distribución 100% open source de Hadoop denominada CDH (Cloudera Distribution including Hadoop) que incluye toda la funcionalidad de Hadoop en cuanto a almacenamiento y procesado de datos (escalabilidad, entorno distribuido, tolerancia a fallos, alta disponibilidad, etc…), además de componentes adicionales como una interfaz de usuario amigable y funciones de seguridad necesarias para las empresas.

arquitectura cloudera El rendimiento es la clave para obtener el potencial de datos ilimitados. Con uno de los más robustos frameworks de código abierto, Apache es la chispa para el procesamiento de datos a gran escala. Los desarrolladores usan usar Apache Impala para manejar SQL de alto rendimiento. También incluye el único motor de búsqueda Hadoop nativo y proporciona optimización de datos activo. Impala no sólo excede los requisitos de velocidad y de concurrencia necesarios para la construcción de una base de datos de análisis, se integra de forma nativa a través de Hadoop y con las herramientas de BI líderes para una completa plataforma de bajo costo.

Además Cloudera Enterprise combina su distribución de Hadoop con otras herramientas que permiten la implementación de una solución Big Data completa. Son:

 

  • Cloudera Manager para la administración, monitorización y despliegue del cluster Hadoop de una manera centralizada.
  • Cloudera Navigator para la gestión de los datos de Hadoop (control de accesos, gestión de metadatos, encriptación, políticas de retención, etc…)
  • Apache HBase que facilita el acceso rápido en lectura y escritura a los datos almacenados en Hadoop en forma de registros (clave, valor).
  • Cloudera Impala. Permite realizar consultas SQL directamente sobre los datos almacenados en HDFS y HBase.
  • Cloudera Search. Permite realizar búsquedas de textos sobre contenido almacenado en HDFS y HBase.