As pessoas têm opiniões con­tro­ver­sas sobre big data. Enquanto seus de­fen­so­res destacam as vantagens da coleta de enormes quan­ti­da­des de dados pos­si­bi­li­tada pela di­gi­ta­li­za­ção, críticos ganham vi­si­bi­li­dade ao levantar questões sobre a proteção de dados pessoais. Depois das denúncias de Edward Snowden e da di­vul­ga­ção de diversas práticas de es­pi­o­na­gem e mo­ni­to­ra­mento, não só empresas, mas também usuários privados, começaram a se preocupar com seus dados pessoais. O que se ouve e se lê por aí sobre big data ge­ral­mente é muito negativo. Mas esse é apenas um dos seus múltiplos aspectos.

O que é big data?

O termo big data diz respeito a uma enorme quan­ti­dade de dados de uma com­ple­xi­dade tal, que hardwares e softwares tra­di­ci­o­nais não são capazes de processá-los. Em si, big data é um termo geral que também pode sig­ni­fi­car grande quan­ti­dade de dados coletados em pesquisas, por exemplo. Mas, quando esse termo é usado para se referir a dados pessoais coletados na internet (como dados sobre co­mu­ni­ca­ção ou com­por­ta­men­tos de consumo), ele fre­quen­te­mente tem conotação negativa. Os críticos con­si­de­ram que a coleta e a análise desses dados violam o direito das pessoas à pri­va­ci­dade.

Qual é o tamanho do big data?

Como o próprio nome já diz, a quan­ti­dade de dados do big data não é exata. Não há um valor definido a partir do qual se pode ou não chamar um conjunto de dados de big data. Mas, na prática, o termo é ge­ral­mente usado como sinônimo de quan­ti­da­des de dados tão grandes, que já não podem mais ser medidos em gigabytes.

Como o big data é coletado?

O volume de dados existente adquiriu pro­por­ções des­co­mu­nais. Em 2014, foram ne­ces­sá­rios somente 10 minutos para que todos os dados pro­du­zi­dos pela hu­ma­ni­dade até o ano de 2002 fossem coletados. Alguns prog­nós­ti­cos afirmam que essa montanha de dados con­ti­nu­ará a aumentar, dobrando a cada dois anos. A imensa quan­ti­dade de dados se deve ao aumento da di­gi­ta­li­za­ção na vida cotidiana. O big data tem origem na coleta de dados de diversas fontes, como:

  • Uso de internet móvel
  • Mídias sociais
  • Ge­o­tar­ge­ting (ge­o­lo­ca­li­za­ção de usuários)
  • Com­pu­ta­ção em nuvem
  • Medição de dados vitais
  • Streaming de mídias

Quando as pessoas falam sobre big data, elas ge­ral­mente não se referem somente à coleta de dados, mas também às suas análises e uti­li­za­ções. O objetivo de se coletar esses dados é iden­ti­fi­car padrões e relações para aplicá-los nos contextos certos. O desafio vai além da enorme quan­ti­dade de dados, pois eles também são coletados em ve­lo­ci­da­des al­tís­si­mas e contêm in­for­ma­ções ex­tre­ma­mente di­ver­si­fi­ca­das. É um fluxo contínuo de dados em um re­ser­va­tó­rio de­sor­ga­ni­zado. Eles devem ser re­gis­tra­dos, ar­ma­ze­na­dos e pro­ces­sa­dos, se possível em tempo real. Para ler cor­re­ta­mente esses dados e es­ta­be­le­cer relações entre eles, é ne­ces­sá­rio ter uma so­fis­ti­cada in­fra­es­tru­tura de dados.

Como lidar com o big data?

De acordo com a definição de big data, o volume de dados é tão grande, que a tec­no­lo­gia dos hardwares e softwares normais não é capaz de processar esses dados de maneira eficiente. Portanto, para lidar com essa enorme quan­ti­dade de dados é ne­ces­sá­rio aumentar os re­qui­si­tos técnicos dos softwares uti­li­za­dos. Somente fra­meworks especiais podem analisar esses dados: só eles são capazes de processar si­mul­ta­ne­a­mente a maior quan­ti­dade possível de conjuntos de dados e importá-los com rapidez. Além disso, esses softwares conseguem dis­po­ni­bi­li­zar dados aos usuários em tempo real e, se ne­ces­sá­rio, responder múltiplas consultas ao banco de dados de uma só vez.

Uma conhecida solução open source é o Apache Hadoop. Mas como sua im­ple­men­ta­ção é muito complexa, ge­ral­mente não é possível realizá-la sem a ajuda de es­pe­ci­a­lis­tas, os chamados ci­en­tis­tas de dados. Mas, para começar a se fa­mi­li­a­ri­zar com o big data, você também pode usar soluções em nuvem.

Exemplos de uti­li­za­ção de big data

O big data é utilizado nas mais diversas áreas da vida cotidiana. Até as coisas mais comuns, que todo usuário de internet conhece, são baseadas nele. Um dos exemplos de aplicação do big data está nas compras on-line: quem já comprou pela internet pro­va­vel­mente se deparou com sugestões de compra se­me­lhan­tes a: “Os clientes que compraram o produto XY também compraram o produto XZ”. Essas sugestões são geradas a partir da análise de milhões de dados de compras de outros usuários.

Outros exemplos de áreas be­ne­fi­ci­a­das pelo big data são:

  • Pesquisas médicas: A análise de dados em grande escala facilita que pro­fis­si­o­nais de saúde encontrem os melhores pla­ne­ja­men­tos e soluções para o tra­ta­mento de pacientes.
  • Indústria: A uti­li­za­ção dos dados das próprias máquinas pode con­tri­buir para que empresas aumentem a efi­ci­ên­cia de sua produção e funcionem de maneira mais sus­ten­tá­vel.
  • Economia: O big data pos­si­bi­lita que empresas conheçam melhor seus clientes e adaptem suas ofertas com mais efi­ci­ên­cia.
  • Energia: Para que o consumo de energia seja ideal para as demandas in­di­vi­du­ais, é preciso saber quais são essas demandas. A coleta de dados de consumo contribui, a longo prazo, para um consumo de energia mais sus­ten­tá­vel.
  • Marketing: O big data é usado para fins de di­re­ci­o­na­mento ao público-alvo (targeting). O objetivo dessa uti­li­za­ção é aprimorar o re­la­ci­o­na­mento com os con­su­mi­do­res e im­ple­men­tar diversas ações de marketing.
  • Combate ao crime: Ins­ti­tui­ções públicas recorrem ao big data para detectar com­por­ta­men­tos suspeitos e prevenir o co­me­ti­mento de crimes e atos ter­ro­ris­tas.

Críticas ao big data

Para muitos críticos do big data, o maior de seus problemas diz respeito à proteção de dados. A imensa quan­ti­dade de dados é valiosa para empresas e marcas, que podem aprimorar a efi­ci­ên­cia de suas ações de marketing. Dados uti­li­za­dos para targeting também permitem elaborar perfis de usuário precisos, o que pode ser visto como uma violação ao direito dos usuários à pri­va­ci­dade. Por isso, sempre que se for utilizar big data, é ne­ces­sá­rio avisar con­su­mi­do­res e usuários de sites, na política de pri­va­ci­dade, sobre a coleta de dados pessoais.

Outro argumento da crítica é o monopólio sobre os dados. “Big players” operam o big data: empresas geram lucro tra­ba­lhando com essa imensa quan­ti­dade de dados, como o Google e outros me­ca­nis­mos de busca. Há uma soberania de dados por parte dessas empresas. A mo­no­po­li­za­ção é criticada tão fre­quen­te­mente quanto o risco da uti­li­za­ção indevida de dados em grande escala. Sem uma re­gu­la­men­ta­ção clara sobre proteção de dados e ano­ni­mi­za­ção, não é possível eliminar o risco do uso indevido dos dados dos usuários.

Uso res­pon­sá­vel do big data

Apesar de todas as críticas, a uti­li­za­ção do big data traz grandes be­ne­fí­cios quando a tec­no­lo­gia é cor­re­ta­mente empregada. Alguns pro­gres­sos valiosos, como no combate ao câncer, não teriam sido possíveis sem o big data. As áreas de dis­tri­bui­ção de energia e de controle de trânsito também são apri­mo­ra­das con­ti­nu­a­mente, graças à análise de grandes quan­ti­da­des de dados, que oferecem mais segurança ao dia a dia. Mas, apesar das opor­tu­ni­da­des de de­sen­vol­vi­mento nas áreas de medicina e economia, é preciso pensar com cuidado sobre questões éticas. Afinal, poder prever de­ter­mi­na­dos eventos, se alguém vai de­sen­vol­ver uma de­ter­mi­nada doença no futuro, por exemplo, é as­sus­ta­dor para muitas pessoas. A população tem direito à pri­va­ci­dade e preocupa-se com a segurança dos seus dados.

No site da Serpro, empresa pública res­pon­sá­vel pela maior parte das soluções digitais go­ver­na­men­tais do Brasil, você encontra in­for­ma­ções sobre a Lei Geral de Proteção de Dados Pessoais (LGPD), que entrou em vigor no Brasil em 2018. O site oferece tanto in­for­ma­ções di­re­ci­o­na­das aos usuários quanto às empresas.

Dica

Nosso Digital Guide também detalha a aplicação da LGPD no comércio ele­trô­nico bra­si­leiro.

Ir para o menu principal