Tendencias Big Data

enero 2, 2017
Cerrando el último trimestre es buen momento para hacer balance de lo que ha sido el año y evaluar lo que nos espera el 2017 en el espacio del Big Data Analytics. Aunque nadie puede predecir cuales serán los temas más calientes sí podemos repasar en este artículo cuáles son las últimas tendencias en big data.

los LÍDERES EN BI SE DESINFLAN

Varios de los líderes en BI y herramientas de visualización han tenido su annus horribilis. Ya al comienzo de año se veía cómo de complicado sería el año para este sector, Tableau perdió la mitad de su capitalización bursátil en un sólo día después de presentar unos resultados financieros que decepcionaron a los inversores. Pocos meses después Qlik fue adquirida, después de perder más de la mitad de su valor en el Nasdaq, por la firma de inversión Thoma Bravo que pagó 3.000 millones de dólares. El mercado de BI se ha ido fragmentando a medida que otras de las grandes como Microsoft o Microstrategy han sacado nuevas alternativas menos costosas (también menos funcionales). Y nuevos players como Alteryx, Domo, Birst, Sisense o Gooddata han emergido al mercado. Gartner después de analizar a más de 24 empresas de BI en su cuadrante mágico llegó a decir que el mercado de BI ha alcanzado «Un punto de inflexión que requiere una nueva perspectiva».

AUGE DE LA INTELIGENCIA ARTIFICIAL

Cuando la plataforma DeepMind adquirida por Google venció al mejor jugador humano del juego milenario Go, quedó claro que estamos asistiendo al Big Bang en lo que a inteligencia artificial (IA) se refiere. Desde chatbots como Siri de Apple o Alexa de Amazon, a coches autónomos, millones de usuarios han comenzado a disfrutar de las ventajas de un buen uso de la IA.

También hemos visto el lanzamiento de nuevos servicios como Amazon AI lanzado hace un mes. O noticias sobre hacia donde se dirige el talento en cuanto al desarrollo: la universidad de Berkeley,  anunció en octubre que el prolífico equipo de AMPlab que nos ha dado maravillosas plataformas de big data como Apache Spark, será reemplazado por RISELab que en parte se centrará en IA y sus aplicaciones como vehículos autónomos. Poco a poco se hace más evidente que la noción de inteligencia artificial irá acaparando y tomando el control de big data como concepto.

HADOOP CUMPLE UNA DÉCADA

En enero se cumplió el décimo aniversario del lanzamiento en producción del primer cluster Hadoop por Hadoopparte de Yahoo. Sus ingenieros, que por entonces eran felices si su cluster de diez nodos corriera continuamente durante 24 horas, no podían llegar ni siquiera a imaginar en qué llegaría a convertirse su criatura, casi sinónimo hoy día de computación big data, desplegada en mayor o menor medida en los sistemas informáticos de las mayores empresas del mundo. Bien es cierto que comienza a haber discusión si Hadoop ha tocado techo y si la versión 3 en desarrollo que promete doblar la capacidad de almacenamiento y habilitar la codificación de borrado será suficiente al ritmo acelerado de la evolución de plataformas big data.

APACHE SPARK DOMINA

El enfoque abierto y económico de computación distribuida de Hadoop captó la atención de los profesionales con necesidad de procesar enormes data sets que hasta el momento dependían de un software propietario demasiado caro. Pero si la plataforma basada en Java está empezando a atenuarse, no es sinoApache Spark porque hay una nueva estrella capaz de deslumbrar aún más. El ascenso meteórico de Apache Spark está siendo muy interesante de analizar. Especialmente cuando los grandes de la industria como IBM lo han adoptado como parte estratégica de su arquitectura de servicios, o casi todas las herramientas de BI y visualización usan la tecnología in-memory de Spark para procesar trabajos en streaming, interactivos o en batch. Muchos piensan que pronto Spark rebasará a Hadoop en popularidad.

LA BATALLA DE LOS FRAMEWORKS: FLINK y BEAM

A pesar de que Spark prácticamente ha reemplazado a MapReduce como motor de procesamiento batch (sin contar las capacidades de Spark en SQL, Machine Learning y streaming), la comunidad big data no tiene suficiente e intenta mejorar el framework basado en Scala soportado por Databricks. Nuevos Apache Flinkdesarrollos como Apache Flink y Apache Beam están tomando mucha fuerza como competidores de Spark en la batalla de frameworks big data. Incluso el principal arquitecto de Cloudera afirmó que la arquitectura de Flink es aún mejor que la de Spark. Como siempre, en la variedad está el gusto, y qué mejor que contar con diversas opciones ya que no será siempre la misma la mejor en todas las circunstancias. Beam está basado en Dataflow, el API de Google Cloud, y pretende unificar los desarrollos de aplicaciones en big data bajo un único API que permita trabajar con Spark, Flink o Dataflow.

ATAQUES DE SEGURIDAD

El que los datos proporcionan valor es algo que claramente ya nadie discute, por lo que no es ninguna sorpresa que «los malos» quieran robar datos. Este año hemos asistido a brechas de seguridad de muy alto nivel. Desde los famosos servidores de email del partido demócrata estadounidense supuestamente hackeados por rusos a la confirmación por parte de Yahoo de la intrusión que dejó al descubierto datos de 1.000 millones de sus cuentas, después de reconocer otra filtración en septiembre de 500 millones de usuarios. En el medallero de la vergüenza se encuentran también el Departamento de Justicia americano (que perdió datos de 30.000 empleados del DHS y el FBI), el IRS (Hacienda de EEUU) con registros de 700.000 contribuyentes, Oracle (330.000 cajas registradoras hackeadas), Verizon (1,5 millones de registros de cuentas de clientes), Dropbox (admitiendo robos de 68 millones de cuentas), AdultFriendFinder.com (412 millones de registros de clientes), y un sinfín de casos más.

nuevas Startups especializadas en datos

Aunque las inversiones en capital riesgo bajaron un 10% desde 2015, el empuje de emprendedores en tecnologías relacionadas con el dato no ha bajado un ápice. Entre las startups más novedosas que hemos visto este año en tendencias big data podemos identificar:

  • SnappyData, enfocados a unificar Spark y el data grid GemFire de Pivotal.
  • Panoply, creando software ETL para usuarios de AWS Redshift.
  • Cosmify, está utilizando aprendizaje automático para minería del conocimiento de clientes.
  • Bonsai, especializados en IA.
  • Armorway, utilizando deep learning para temas relacionados con ciberseguridad.
  • Leyvx, que está unificando Flash con Spark.
  • Jask, utilizando IA para análisis de ciberseguridad.
  • Alluvium, pretende cerrar el hueco de máquina a humano.
  • Pachyderm, especializada en contenedores.
  • Skry, con soluciones relacionadas con inteligencia y blockchain.
  • Wavefront, que utiliza big data para monitorizar sistemas.

 

Proyectos Open Data

No todos los esfuerzos y productos en torno al big data buscan una compensación monetaria. De hecho, muchas de las tecnologías más prometedoras vienen de diferentes proyectos open source. Entre los proyectos que más han salido en los medios especializados del sector encontramos:

  • Apache Arrow. Este proyecto, encabezado por un arquitecto de MapR Technologies, busca crear una capa de datos común que trabajará con una gran variedad de herramientas y motores de datos, como Drill, Spark, Impala, Cassandra y Parquet.
  • Alluxio. Sistema de ficheros en memoria salido del AMPLab, creadores también de otros proyectos Apache como Spark y Mesos.
  • Apache Beam, su ambicioso objetivo es crear un API unificado para procesamiento en tiempo real, interactivo y batch.
  • CrateDB: es una base de datos escalable (NewSQL) bajo licencia Apache 2.0 para machine analytics en tiempo real.
  • Apache Kylin: Solución OLAP sobre Hadoop de código libre.
  • Apache Geocode: Base de datos distribuida con capacidad de trabajo in-memory basada en Gemfire de Pivotal.

 

No podemos conocer con certeza lo que el 2017 nos deparará pero siguiendo las tendencias de big data actuales tenemos un panorama de crecimiento continuado, sorpresas espectaculares y avances inesperados en las tecnologías y cómo nuestras vidas están cambiando con ellas.

What do you think?

What do you think?

22 Comments:
octubre 17, 2019

buena pagina pero quiero saber como o donde comprarlo y ocuparlo en el movil

noviembre 21, 2019

Desde Baoss ofrecemos productos y soluciones a medida para empresas y organizaciones. Para particulares puedes buscar en internet por herramientas de análisis de datos y podrás acceder una serie muy variada de oferta dependiendo tus necesidades y presupuesto.

octubre 25, 2019

El avance tecnológico es indudablemente de gran ayuda en los diferentes sectores o áreas de la vida real. Me gustaría saber el uso del big Data en las exploraciones mineras,dando un ejemplo real.

noviembre 21, 2019

Estimado Alberto, gracias por tu comentario. Para analizar un caso real en el sector que comentas puedes ponerte en contacto con nosotros a través del formulario que encontrarás en la página de Contacto y con mucho gusto estudiaremos tu caso.

diciembre 17, 2019

Creo que también ha sido muy útil en las predicciones de las ocurrencias de eventos de la naturaleza, como los huracanes, los terremotos, maremotos, las trombas marinas, incluso creo que con los suficientes datos podrán predecir los incendios forestales

febrero 2, 2020

Hola muy buen día, soy estudiante de Ciencias de la Tierra y el Big Data es uno de los temas que más se están manejando en la actualidad, pues sus aplicaciones son realmente ilimitadas- Me gustaría que me compartieran un poco de sus conocimientos a manera breve y general sobre las aplicaciones en casos de la vida real que se estén llevando a cabo en sectores como la industria minera, la industria petrolera y algunas otras aplicaciones en la solución de problemas ambientales.

.Espero me puedan compartir un poco de su información, sin duda sería interesante aplicarlo en la solución de problemas de mi área de estudio y de la misma forma compartirlo con mis colegas de profesión, pues es necesario divulgar estos conocimientos para que lleguen a más personas y comiencen a tomarse en cuenta en otras áreas de estudio. Saludos y gracias por su tiempo

febrero 21, 2020

Gracias Emiliano por tu comentario y por seguirnos. Iremos publicando nuevos artículos. Suerte en tu carrera!

mayo 1, 2020

I am really enjoying the theme/design of your site.

Do you ever run into any browser compatibility issues?
A few of my blog readers have complained about my site not
operating correctly in Explorer but looks great in Firefox.
Do you have any tips to help fix this problem?

mayo 11, 2020

Not at all. Thanks!

junio 6, 2020

Hay algún municipio que utilice el big data y que haya mejorado el servicio a la ciudadanía, me podrías compartir esa información

junio 11, 2020

Prácticamente todos los municipios grandes lo llevan utilizando hace años para medir y prever niveles de contaminación, tráfico, turismo, y muchos casos mas.

octubre 18, 2020

A través de la Big Data, existe el más pavoroso riesgo, todo lo anterior obvia el mayor peligro implícito en este tipo de tecnologías que hoy por hoy están fuera de control. La posibilidad de controlar, manipular, inducir, orientar a poblaciones enteras en pos de obtener objetivos perversos dirigidos por poderes fácticos ubicados en cualquier parte del mundo. Estamos iniciando un proceso que más temprano que tarde terminará con las democracias occidentales.

10 Trackbacks:

[…] conclusiones obtenidas del estudio masivo de datos ya están revolucionando muchos campos que nada tienen que ver con la empresa o el retail. Por ejemplo: Google y el CDC, el centro de control de enfermedades de Estados Unidos, se aliaron […]

[…] Fuente de información: https://www.baoss.es/10-ejemplos-usos-reales-big-data/ […]

[…] Referencias: wikipedia.org, pauhortal.net, baoss.es, powerdata.es, mintic.gov.co […]

[…] Y, como decíamos, esta tendencia no solo puede ayudarnos a mejorar las ventas en nuestros negocios, si no que, aplicada a otros sectores, puede mejorar nuestra calidad de vida. La administración pública, el turismo, la sanidad, hacienda… todos ellos disponen de grandes almacenes de datos que con un buen análisis y el uso de las herramientas adecuadas pueden aportar importantes soluciones. Hay ya muchos ejemplos reales de uso de Big Data en este sentido: se integran datos de historiales clínicos con otros de redes sociales para detectar brotes de gripe en tiempo real; se usan datos de tráfico rodado para mejorar la movilidad en las ciudades; o el uso de datos personales (a veces trascendiendo el derecho a la privacidad) para evitar ataques terroristas. Ver más ejemplos aquí. […]

[…] EJEMPLOS: Marketing y ventas son quizá las áreas de mayor aplicación de big data en la actualidad, los datos que se encuentran sirven para entender mejor al cliente. en la salud pública La capacidad de procesamiento de plataformas de análisis de big data nos permite ya descodificar cadenas enteras de ADN en cuestión de minutos y permitirá encontrar nuevos tratamientos y comprender mejor las enfermedades, sus desencadenantes y los patrones de propagación mejoramiento de la seguridad: El sistema de IA creado en el MIT predice el 85% de los ciberataques.  Otros ejemplos: Las fuerzas policiales están empezando a utilizar herramientas de big data para dar con criminales e incluso prevenir actividades criminales.Otro ejemplo que lleva años empleándose es en la detección de transacciones fraudulentas con tarjetas de crédito. https://www.sas.com/es_pe/insights/big-data/what-is-big-data.html https://xombit.com/2015/11/big-data-procesar-informacion http://www.iic.uam.es/innovacion/big-data-caracteristicas-mas-importantes-7-v/ https://www.baoss.es/10-ejemplos-usos-reales-big-data/ […]

[…] Lee más ejemplos de Big Data Analytics eficaz aquí. […]

[…] El uso de Big Data: El uso de Big Data nos facilita muchísimo la conexión con posibles compradores y sus intereses, esto nos ayuda a ser […]

Comments are closed.

More notes