Desde hace algún tiempo, el big data es un tema co­n­tro­ve­r­ti­do. Mientras que sus de­fe­n­so­res remarcan la gran utilidad de los datos masivos en di­fe­re­n­tes ámbitos, sus de­tra­c­to­res ma­ni­fie­s­tan dudas al respecto de la pro­te­c­ción de la intimidad de las personas. Las polémicas de­cla­ra­cio­nes de Edward Snowden a propósito de las prácticas de espionaje y vi­gi­la­n­cia llevadas a cabo a nivel global no han hecho más que avivar el fuego de la de­s­co­n­fia­n­za general sobre la pro­te­c­ción de los datos pe­r­so­na­les de los ciu­da­da­nos. En este ambiente general de su­s­pi­ca­cia, todo lo que gira alrededor del big data viene cargado de co­n­no­ta­cio­nes negativas aunque, en realidad, este aspecto es solo una parte de la de­fi­ni­ción de este concepto.

¿Qué es el big data?

Con este término, o con su equi­va­le­n­te en español “datos masivos”, se designa a un volumen de datos tan complejo que no puede ser procesado con ningún tipo de software y hardware tra­di­cio­nal. En sí, es un concepto neutro, ya que también puede referirse a una cantidad in­aba­r­ca­ble de datos pro­ce­de­n­te de la in­ve­s­ti­ga­ción. Sin embargo, y dado que los datos re­co­pi­la­dos pueden ser de carácter personal (hábitos de co­mu­ni­ca­ción o de consumo de los usuarios), el término ha acabado por adquirir un tono negativo. Sus de­tra­c­to­res ven en la re­co­le­c­ción de datos y, en especial, en su eva­lua­ción, una clara agresión a los derechos pe­r­so­na­les.

¿Qué tamaño tiene el big data?

El concepto de big data no se refiere a una cantidad de­te­r­mi­na­da de datos, ya que no hay ninguna li­mi­ta­ción definida a partir de la cual los datos masivos pasen a co­n­si­de­rar­se big data. En la práctica, el término es sinónimo de un volumen de datos que no puede medirse en gigabytes.

¿Cómo se genera el big data?

El volumen de datos ha crecido de forma ex­po­ne­n­cial: la cantidad de datos re­co­pi­la­dos por la humanidad desde el comienzo de su historia hasta 2002 se generó en 2014 en un plazo de diez minutos. Según los pro­nó­s­ti­cos, esta montaña de datos seguirá creciendo, do­blá­n­do­se cada dos años. Esta marea de datos es co­n­se­cue­n­cia de la di­gi­ta­li­za­ción general en todos los ámbitos de la vida diaria y procede de fuentes como:

  • Conexión a Internet desde el móvil
  • Redes sociales
  • Geo­lo­ca­li­za­ción
  • Medición de datos vitales
  • Consumo de medios au­dio­vi­sua­les

El big data no hace re­fe­re­n­cia úni­ca­me­n­te a los datos en sí, sino también a su análisis y a su uti­li­za­ción. En este proceso de eva­lua­ción se intentan buscar patrones y co­ne­xio­nes para co­n­te­x­tua­li­zar­los co­rre­c­ta­me­n­te. El desafío no es solamente el ingente volumen de datos, sino también su velocidad y su variedad (las tres “v” del big data), ya que estos acuden de forma constante a un archivo des­es­tru­c­tu­ra­do y deben ser, idea­l­me­n­te, re­gi­s­tra­dos, al­ma­ce­na­dos y pro­ce­sa­dos en tiempo real. Para leerlos co­rre­c­ta­me­n­te y poder co­ne­c­tar­los es necesaria una so­fi­s­ti­ca­da in­frae­s­tru­c­tu­ra de datos.

¿Cómo puedo trabajar con big data?

El big data es re­s­po­n­sa­ble del su­r­gi­mie­n­to de nuevos re­qui­si­tos técnicos respecto al software. Para analizar estos datos se requieren fra­me­wo­r­ks es­pe­cia­les (in­frae­s­tru­c­tu­ras digitales), cuya función principal sea la de procesar tantos conjuntos de datos como sea posible y de im­po­r­tar­los rá­pi­da­me­n­te. Además, este software debe poner a di­s­po­si­ción del usuario los datos en tiempo real y responder al mismo tiempo a varias so­li­ci­tu­des de bases de datos.  

Hadoop es una conocida solución de código abierto para este fin, aunque su ex­tre­ma­me­n­te compleja im­ple­me­n­ta­ción requiere, a menudo, el apoyo por parte de expertos, los llamados data scie­n­ti­sts. Sin embargo, para in­tro­du­ci­r­se en el mundo del big data una muy buena opción la re­pre­se­n­tan las so­lu­cio­nes en la nube.

Ejemplos de uso del big data

Los ámbitos de apli­ca­ción del big data incluyen diversos aspectos de la vida cotidiana. Por ejemplo, en sector del eCommerce, quien haya comprado alguna vez en una tienda online conoce la frase “clientes que compraron el producto A, compraron también el producto B”. Estas re­co­me­n­da­cio­nes se basan en la eva­lua­ción de millones de datos de otros clientes.

Otros ámbitos de apli­ca­ción incluyen:

  • In­ve­s­ti­ga­ción médica: mediante la eva­lua­ción de datos masivos, los cie­n­tí­fi­cos pueden encontrar las mejores so­lu­cio­nes y pla­ni­fi­ca­cio­nes te­ra­péu­ti­cas para sus pacientes.
  • Industria: gracias a la uti­li­za­ción de datos sobre sus máquinas, las empresas pueden aumentar la pro­du­c­ti­vi­dad y trabajar de forma más so­s­te­ni­ble.
  • Economía: el big data permite a las empresas conocer mejor a sus clientes y ajustar mejor sus ofertas.
  • Energía: para adaptar el consumo de energía a las ne­ce­si­da­des in­di­vi­dua­les hay que co­no­ce­r­las. La re­co­le­c­ción de datos de consumo permiten un aba­s­te­ci­mie­n­to ene­r­gé­ti­co so­s­te­ni­ble.
  • Marketing: el big data en el marketing se usa a menudo con objetivos de targeting. La finalidad es, sobre todo, la mejora de las re­la­cio­nes con el cliente y un aumento de las co­n­ve­r­sio­nes en di­fe­re­n­tes es­tra­te­gias.
  • Lucha contra el crimen: también para el gobierno y la seguridad del estado es útil la re­co­le­c­ción y análisis de datos masivos (por ejemplo, para combatir el te­rro­ri­s­mo).

Críticas al big data

Pri­n­ci­pa­l­me­n­te se trata de la pro­te­c­ción de la pri­va­ci­dad de las personas. A la hora de optimizar es­tra­te­gias de marketing, las grandes bases de datos presentan un gran potencial para empresas y marcas, ya que, usadas para segmentar a su audiencia según su co­m­po­r­ta­mie­n­to, sirven para crear perfiles de usuario mucho más precisos. Y esto es co­n­si­de­ra­do en sí mismo un ataque a la esfera privada del usuario. Es por eso que, si se trata con big data, hay que informar en la página web (apartado de Pro­te­c­ción de Datos) sobre el uso de los datos pe­r­so­na­les que se recaban de los usuarios.

Otro punto crítico es la “au­to­cra­cia de los datos”. Na­tu­ra­l­me­n­te, también en este ámbito existen los llamados “big player”, empresas que, ya desde hace años, trabajan con grandes bases de datos y obtienen be­ne­fi­cios de ellas (Google y otros bu­s­ca­do­res). Es así como unas pocas empresas mo­no­po­li­zan la propiedad de esos datos. Y esto es pre­ci­sa­me­n­te lo que se critica, así como el peligro de un abuso de los datos a gran escala. Sin la exi­s­te­n­cia de reglas claras en cuanto a la pro­te­c­ción de los datos y al anonimato de los datos evaluados, no se puede excluir la po­si­bi­li­dad de un mal uso de los datos de los usuarios.

Uso re­s­po­n­sa­ble del big data

Dando por sentado un uso correcto de la te­c­no­lo­gía, en el otro extremo se en­cue­n­tran los be­ne­fi­cios que el uso del big data puede procurar. Por ejemplo, algunos avances im­po­r­ta­n­tes en la in­ve­s­ti­ga­ción sobre el cáncer no habrían sido posibles sin el uso del big data. El aba­s­te­ci­mie­n­to de energía y el control del tráfico también son co­n­ti­nua­me­n­te op­ti­mi­za­dos mediante la eva­lua­ción de datos masivos, ofre­cie­n­do mayor seguridad en la vida diaria. A pesar de todas las opo­r­tu­ni­da­des que brinda en medicina, control de tráfico y economía, surgen preguntas de índole ética a propósito del big data, pues, por ejemplo, la pre­di­c­ción de ciertos sucesos, como podría ser la pro­ba­bi­li­dad de que alguien sea víctima de una de­te­r­mi­na­da en­fe­r­me­dad, sigue siendo para muchos cie­r­ta­me­n­te in­de­sea­ble. La ciu­da­da­nía tiene sus reservas al respecto, haciendo que el miedo hacia las empresas re­co­le­c­to­ras de in­fo­r­ma­ción crezca cada vez más. En este sentido, los expertos abogan por la tra­n­s­pa­re­n­cia a la hora de informar a los usuarios sobre el uso de sus datos y por la creación de un marco legal que permita los avances te­c­no­ló­gi­cos sin perder de vista la pro­te­c­ción de la pri­va­ci­dad de las personas.

Ir al menú principal