Aplicações do Big Data
Com a grande quantidade de informação e volume de dados criados diariamente através das tecnologias de informação e comunicação, surgiu a necessidade de pensar a capacidade de gerar, armazenar, coletar e tratar dados. É então que o termo Big Data é utilizado para descrever grandes volumes de dados e o termo datificação a conversão das coisas em dados. Canary (2013, p. 22) propõe o seguinte quadro com várias definições sobre Big Data:
A quantidade de dados gerados com a internet tem crescido de forma tão exponencial que se fala que estamos na era do zetabyte (= 1.000.000.000.000.000.000.000 de bytes; para se ter uma noção dessa quantidade, 8 zetabytes equivaleria ao acervo de 18 milhões de bibliotecas do Congresso dos Estados Unidos). Dados da IBM sugerem que em 2008 foram produzidos cerca de 2,5 quintilhões de bytes diariamente dos quais 90% teriam sido criados nos últimos dois anos, decorrente da adesão das grandes empresas à internet, como exemplo as redes sociais, dados dos GPS, dispositivos embutidos e móveis. Atualmente a humanidade produz em um ano tudo o que havia produzido de informação e conseguia acumular até 1986.
E a tendência é que o volume de informações cresça ainda mais, quando se pensa por exemplo na internet das coisas (IoT, na sigla em inglês: internet of things) que vai conectar diferentes tipos de aparelhos à internet gerando novas informações. A Internet das Coisas mudou a forma como os dados são gerados pois todos os objetos conectados são capazes de coletar e transmitir dados, gerando dados não estruturados que não podem ser armazenados e processados por banco de dados comuns. Com a Internet das Coisas grandes volumes de dados serão armazenados por centenas, talvez milhares de dispositivos, a cada segundo, conectados à rede mundial de computadores. “A IoT já uma realidade, acrescida do recurso Big Data, faz com que este conjunto cause alterações intensas, que as empresas ainda não estão preparadas a assimilá-lo completamente, em função dos impactos e das transformações possíveis” (SANTOS; FREITAS, 2016, p. 4).
O conceito de big data foi definido inicialmente por 3'V mas com o tempo se percebeu que seu conceito deve ser expandido para 5'V, representados da seguinte forma:
- Volume: relacionado a grande quantidade de dados que são gerados;
- Variedade: as fontes de dados são muito variadas, o que aumenta a complexidade das análises;
- Velocidade: o processamento de dados deve ser ágil para gerar as informações necessárias;
- Veracidade: o quanto uma informação é verdadeira.
- Valor: conceito relacionado com o valor obtido a partir dos dados, ou seja, com a utilidade da informação.
Disponível em: Edureka. Acesso em: jun. 2019
Vivemos em um oceano de informações (volume), oriundas de fontes bem variadas, em grandes velocidades, que podem ou não ser verdadeiras e cujo valor pode ser útil de várias maneiras.
Mas não basta armazenar, é preciso saber o que se pode fazer com uma quantidade tão grande de dados. O tratamento dos dados é realizado a partir de algoritmos (de modo geral qualquer instrução dada para que um programa execute uma tarefa). Os algoritmos seguem determinadas instruções e a partir de então executam algum tipo de ação. “Algoritmos são uma tentativa de descrever o passo a passo necessário para a realização de um procedimento de forma tão precisa que possa ser executado sem qualquer interpretação de quem (ou o que) o executa” (TOMAZ; SILVA, 2018, p. 34). “Esses algoritmos, são a ‘rede neural’ do sistema e podem servir para fins diversos dependendo do propósito buscado pela corporação” (GALDINO, 2016, p. 3).
Os dados são qualificados em três categorias: dados estruturados, pertencentes a um SGBD relacional com esquema relacional associado, dados semiestruturados, que são irregulares ou incompletos não necessariamente de acordo com um esquema, compreensíveis por maquinas mas não por seres humanos, como documentos HTML e logs de web sites , e dados não estruturados, sem estrutura prévia nem possibilidade de agrupamento em tabelas, como vídeos, imagens e e-mails (Intel 2015 apud GALDINO, 2016, p. 3)
Grande parte dos dados que são gerados atualmente são não estruturados, o que torna difícil sua utilização. Os dados são provenientes das mais diversas fontes, como celulares, computadores, qualquer dispositivo conectado à internet, dados de GPS (Global System Positioning). Bancos de dados convencionais podem interagir com informações do tipo estruturada, mas a enxurrada de dados geradas diariamente totalmente desestruturada exige uma nova abordagem para que se possa analisar esses dados, o que é possível graças ao Big Data através de ferramentas como: MapReduce, Hadoop, Pig, Hive, Hadoop Distributed File System (HDFS) e bancos de dados NoSQL.
Aplicações do Big Data
A questão do Big Data ultrapassa a área computacional e é de interesse de várias áreas como a política, econômica e social. Através da utilização de algoritmos, o Big Data pode executar uma série de ações, nas mais diferentes áreas, como é o caso da área empresarial, segurança pública, área de saúde e muito mais. Vejamos alguns exemplos.
No ramo empresarial
Com um volume grande de informações, as empresas podem analisar os dados para melhorar suas estratégias, abrangendo técnicas de cruzamento e tratamento de dados com o fim de extrair conclusões e inferências dos mesmos. O Big Data permite a identificação de comportamentos e tendências, não sendo utilizado somente como uma estratégia de marketing, mas sim para a melhoria de serviços, produtos, etc.
As ferramentas de big data são de grande importância na definição de estratégias de marketing, aumento de produtividade, redução de custos e tomada de decisões mais inteligentes. Se até pouco tempo atrás as empresas armazenavam suas operações diárias em uma pequena base de dados, utilizados para manter o controle de operações, por exemplo, hoje pode-se dizer que com o grande volume de dados é possível coletar dados sobre clientes em potencial a partir, por exemplo, da rede mundial de computadores.
Os profissionais de marketing também podem coletar informações sobre todas as conversas que as pessoas estão tendo sobre sua marca. Essas fontes de dados criaram verdadeiros tesouros modernos que podem ser extraídos para conhecer ideias sobre produtos, serviços e clientes. Apesar de isso ser conceitualmente possível, faz-se necessária a implementação de novos processos, tecnologias e mecanismos de governança que são coletivamente referidos como Big Data (PARISE; IYER; VESSET, 2012 apud CASALINHO, 2015, p. 157).
É através dos dados obtidos com o uso do Big Data que “a Amazon pode recomendar o livro ideal, Google pode indicar a página da web mais relevante, Facebook conhece nossos gostos, e LinkedIn advinha quem conhecemos” (MAYER-SCHÖNBERGER; CUKIER, 2013, p. 24 apud ANTUNES; MAIA, 2018, p. 194).
Santos e Freitas (2016, p. 4) destacam que “o Big Data irá mudar a maneira como empresas competem no mercado e ainda identificará padrões de comportamento, trazendo a eficiência desejada às indústrias”.
Para prevenção de crimes
Nos Estados Unidos, o Big Data é utilizado desde 2011 para análise preventiva de ações criminosas, permitindo, uma atuação antecipada da polícia. Inclusive, potenciais criminosos já foram previamente abordados sem que tivessem cometido crime algum.
No Brasil, Em 2014, a prefeitura de São Paulo adquiriu o sistema DETECTA, desenvolvido pela Microsoft juntamente com a prefeitura de Nova York, que permite o monitoramento criminal, visando analisar os dados obtidos pelo INFOCRIM e pelo Registro Digital de Ocorrências. O sistema DETECTA auxilia o trabalho policial nas atividades investigativas e operacionais, relacionando imagens de pessoas, veículos e locais com as informações dos bancos de dados de diferentes instituições, com o fim de promover ações estritamente coordenadas.
O sistema integra bancos de dados das polícias paulistas, cadastro de pessoas procuradas e desaparecidas, dados do DETRAN e registro de veículos furtados, roubados e clonados, sendo considerado o maior conjunto de informações armazenadas da América Latina.
Utilizando dados de imagens, o sistema pode contribuir para a prisão de pessoas em flagrante delito, apreensão de armas de fogo, entre outros.
Utilização na Saúde
Um interessante estudo de caso sobre sucessos e erros do uso do big data ocorreu em 2008 com o chamado Google Flu Trends (GTF). Este serviço prometia detectar com algumas semanas de antecedência a ocorrência de epidemias de gripe. Por causa do acesso à internet, verificou-se que mais de 90 milhões de americanos procuravam todos os anos por informações sobre uma doença específica ou problema médico. Por isso, acreditava-se que era possível correlacionar essas buscas com casos efetivos de gripe. Essa ideia foi testada em tempo real nos anos de 2007 e 2008 e os resultados mostraram que seria possível prever casos de gripe. Todavia, a ideia foi abandonada devido a erros em anos posteriores como em 2009, quando o sistema na previu a epidemia da gripe H1N1 ou em 2013, quando o sistema não previu uma epidemia de gripe.
Na área da saúde, Chiavegatto Filho (2015, p. 326) identifica pelo menos três grandes áreas que podem ser beneficiadas com o uso do big data: “a medicina de precisão, os prontuários eletrônicos do paciente e a internet das coisas”. Com a digitalização de todos os dados dos pacientes dos serviços de saúde no Brasil será possível pensar em uma melhor eficácia nas intervenções de saúde dos indivíduos. Essa digitalização poderá contribuir tanto para se obter maior precisão na prescrição de medicamentos quanto no acesso ao prontuário dos pacientes de diferentes postos de saúde, de diferentes municípios brasileiros. No que tange à internet das coisas, uma “possiblidade promissora será o uso de wearables, objetos eletrônicos conectados ao corpo que poderão identificar a iminência de infartos e acidentes vasculares antes mesmo do próprio indivíduo” (CHIAVEGATTO FILHO, 2015, p. 327).
O grande volume de dados que pode ser gerado, armazenado e organizado pelo sistema de saúde pública brasileiro pode contribuir oferecendo suporte de banco de dados que ajudarão a executar com maior rapidez prescrições e prontuários eletrônicos contribuindo para que os profissionais de saúde tenham “maior capacidade de decisão sobre as ações do cuidado, o que se refletirá diretamente na qualidade da assistência prestada” (ROCHA et al, 2012 apud SILVA; SILVA; FORTES, 2018, p. 349). Desta forma, o Big Data no setor da saúde “tornará o sistema de saúde mais efetivo e eficiente” (PRATO, 2015 apud SILVA; SILVA; FORTES, 2018, p. 352).
Utilização na Política
O big data já foi relacionado como ferramenta essencial em manipulação de eleições (como no caso do Brexit – o referendo britânico para permanência ou saída da União Europeia – veja o texto: Brexit) e disseminação de fake news. Isso é possível graças a capacidade inerente da tecnologia de reunir e segmentar um determinado público alvo, fazendo com que campanhas de marketing sejam muito mais efetivas e impactantes, o que faz do big data uma metodologia questionável do ponto de vista ético, uma vez que pode ser usado para manipular massas e obter resultados parciais de acordo com a motivação dos especialistas.
Algo semelhante ocorreu com a eleição de Donald Trump em 2016, como afirma Antunes e Maia (2018, p. 190): uma “falha” na segurança de dados dos usuários do Facebook permitiu a agência britânica de consultoria política Cambridge Analytca o uso desses dados. Essa agência trabalhou tanto nas eleições de Trump quanto durante o plebiscito Brexit.
Algo semelhante aconteceu com o programa de espionagem Norte Americana, onde o governo Americano interceptou e analisou diariamente quantidades absurdas de dados, gerados continuamente, vindos de diversas fontes.
Informação e Privacidade
Diante de tantas e tão grandes possibilidades de uso das informações que são produzidas diariamente por cada ser humano, um dos grandes desafios que temos pela frente diz respeito a privacidade das informações pessoais de cada indivíduo. “É cada vez mais real a possibilidade de dados confidenciais serem roubados e usados de forma inadequada” (SILVA; SILVA; FORTES, 2018, p. 353). Para isso será necessário implantar tecnologias de protocolo de segurança rígidas pois os escândalos de vazamento de dados já estão ocorrendo e neste cenário estamos todos expostos a ter dados sigilosos utilizados indevidamente. Por isso é preciso analisar de forma crítica os benefícios que a tecnologia tem trazido para a população em geral.
Referências Bibliográficas
ANTUNES, Deborah Cristina; MAIA, Ari Fernando. Big Data, exploração ubíqua e propaganda dirigida: novas facetas da indústria cultural. Psicologia USP, v. 29, n. 2, p. 189-199, 2018. Acesso em: 19 jun. 2019.
CANARY, Vivian Passos. A Tomada de Decisão no Contexto do Big Data: Estudo de Caso Único. Trabalho de Conclusão de Curso (Bacharelado em Administração). Escola de Administração, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013.
CASALINHO, Gilmar D’Agostini O. O impacto do uso do big data na inteligência competitiva e na percepção do produto pelo cliente: desenvolvimento de proposições de pesquisa. Estudo & Debate, Lajeado, v. 22, n. 2, p. 154-170, 2015. Acesso em: 19 jun. 2019.
CHIAVEGATTO FILHO, Alexandre Dias P. Uso de big data em saúde no Brasil: perspectivas para um futuro próximo. Epidemiologia e Serviços de Saúde, Brasília, v. 24, n. 2, p. 325-332, abr./jun., 2015. Acesso em: 17 jun. 2019.
GALDINO, Natanael. Big Data: Ferramentas e Aplicabilidade. XIII SEGet – Simpósio de Excelência em Gestão e Tecnologia: Desenvolvimento de Competências Frente aos Desafios do Amanhã. 31 de outubro e 01 de novembro de 2016.
SANTOS, Dalma de Oliveira; FREITAS, Eduardo Bonetti de. A Internet das Coisas e o Big Data Inovando os Negócios. REFAS – Revista Fatec Zona Sul, v. 3, n. 1, p. 1-18, out. 2016. Acesso em: 20 jun. 2019.
SILVA, Aricio M. da; SILVA, Natanael Almeida S.; FORTES, Denise Xavier. Adoção de Gestão do Conhecimento e Big Data na Saúde Pública. Revista Científica da FASETE, n. 15, p. 347-364, 2018. Acesso em: 19 jun. 2019.
TOMAZ, Tales; SILVA, Guilherme C. Repensando big data, algoritmos e comunicação: para uma crítica da neutralidade instrumental. § Parágrafo, São Paulo, Brasil, v. 6, n. 1, p. 31-42, jan./abr. 2018. Acesso em: 17 jun. 2019.
Ciência Política → Políticas Públicas → Ciência, Tecnologia & Inovação → Aplicações do Big Data