Cuando hablamos de Big Data en general hablamos de grandes volúmenes de data semi estructurada o sin estructurar, que produce una empresa y que es casi imposible cargar en una base de datos relacional para su análisis. No es que no se pueda, pero cuesta mucho dinero y tiempo para hacerlo.
Cuando hablo de volumen, en realidad no hay una especificación clara ni una cantidad que define los que es considerado Big Data, pero para que tengan una idea de Big Data, son cantidades de datos que podemos medir en petabytes, exabytes o zettabytes.
Para manejar estos volúmenes de datos las empresas y administraciones públicas necesitan de una tecnología diferente a las usadas con cantidades de datos mucho menores. Necesitan una tecnología capaz de almacenar, procesar y analizar los datos en forma rápida y eficiente.
Esta tecnología es Apache Hadoop, plataforma desarrollada en Java por Doug Cutting e inspirada en los documentos Google MapReduce y Google File System (GFS). Fue implementada por primera vez por Yahoo!
Muchísimas empresas de primer nivel, que manejan grandes volúmenes de datos están trabajando con Apache Hadoop. Ejemplos hay muchos, pero solo con nombrar Facebook, Twitter, Bank of America y Telefónica, les da una idea de lo importante que es.
Sobre Hadoop, la empresa Pragsis integró varias herramientas creando una nueva plataforma Open Source llamada Bidoop. Pragsis es partner de Cloudera y opera desde España
El jefe de Big Data Solutions en Pagsis explica las razones por qué contar con una plataforma como BIDOOP:
“Las empresas, y la sociedad en su visión más amplia, están generando un mar de información del que se está procesando y analizando menos de un 15%. La información es un valioso activo que las empresas tienen que aprender a analizar y explotar en su totalidad para conseguir ser más competitivas en un mercado cada vez más complicado y saturado. El análisis exhaustivo de la información generada por las empresas, ayuda a reducir costes, a maximizar el beneficio y, sobre todo, a generar nuevos negocios no imaginados hasta la fecha. BIDOOP ofrece nuevas dimensiones y posibilidades empresariales pues ayuda a canalizar, procesar e interpretar grandes volúmenes de información de diversa índole. Si además añadimos que BIDOOP es de código abierto, que no hay que abonar licencias de ningún tipo y que se sustenta en hardware de bajo coste, las ventajas y beneficios son aún mucho mayores.”
Como les comenté anteriormente Pragsis opera desde España y en un futuro próximo piensa abrir nuevas oficinas en México y Brasil.