Soluciones Big Data Analytics: UIMA

UIMA (Unstructured Information Management Architecture) es el estandard del sector en Content Analytics.

Se trata de una arquitectura de software para el desarrollo, descubrimiento, la composición y el despliegue de analíticas multimodales para el análisis de la información no estructurada y su integración con las tecnologías de búsqueda desarrolladas como por ejemplo IBM. El código fuente está disponible en el sitio web de la Apache Software Foundation. UIMA permite analizar grandes volúmenes de información no estructurada con el fin de descubrir datos relevantes para un usuario final.

Un ejemplo de aplicación de la UIMA, podría ingerir texto plano e identificar entidades, como personas, lugares, organizaciones o las relaciones.

UIMA permite que las aplicaciones se puedan descomponer, por ejemplo “identificación del idioma” => “La detección de frases” => “segmentación específica idioma” => “La detección entidad (persona / nombres de lugares, etc.)”. Cada componente implementa interfaces definidas y proporciona metadatos de auto-descripción, a través de archivos XML.

El framework gestiona estos componentes y el flujo de datos entre ellos. Los componentes están escritos en Java o C++.