Big data e suas ramificações, para demonstração de como pode ser amplo o numero de dados- PD Sistemas

Dados transformados em insights: Big Data

Há cerca de uns 30.000 anos, os homens primitivos – sim, aqueles que viviam nas cavernas e praticavam a caça para sobrevivência – faziam riscos em ossos de animais ou em pedaços de madeira. Em uma caverna na Europa Central, um desses homens desenhou precisamente 57 riscos verticais, agrupados de cinco em cinco, em um pedaço da tíbia de um urso.

Não sabemos exatamente o que esse homem estava contando ou por quê estava fazendo isso, mas sabemos hoje, milênios depois, que naquele momento do registro havia 57 itens de alguma coisa. Isso é informação ou “data”, em inglês – algo conhecido há milhares de anos pelos seres humanos e que nada mais é do que um dado que pode ser transmitido ou registrado.

Mas nos últimos 15 ou 20 anos, um adjetivo foi colocado à frente desse substantivo em inglês: “data” passou a ser “Big data”, ou seja, “grandes dados” ou “grandes conjuntos de dados”. Para termos uma ideia da magnitude que o volume de informações adquiriu recentemente, podemos referir, por exemplo, que há uns dez anos, o Google processava diariamente 10 terabytes de dados todos os dias; ano passado, em 2018, a empresa norte-americana Walmart coletou 2.500 tirabytes de dados dos seus clientes a cada… hora.

 

Estatísticas impressionantes

Impressionante? O universo do Big Data está repleto de outras estatísticas assim. Isso porque, desde a época das cavernas, nunca antes se produziu e se armazenou tanta informação em tão pouco tempo. Segundo estimativas da IBM, cerca de 90% de toda informação encontrada no mundo foi produzida apenas nos últimos 2 ou 3 anos.

Mas de que tipo de informação falamos exatamente quando falamos de “Big Data”? Por exemplo, ao ter chegado à leitura deste artigo, seja porque clicou em um link específico ou fez uma pesquisa no Google, você já produziu dados para a database de alguém. Tais informações podem depois ser usados de diversas formas, inclusive, claro, com fins comerciais, de modo a te sugerir, por exemplo, a compra de livros ou de outros produtos relacionados ao universo da tecnologia.

O artigo de hoje é dedicado a este tema tão central nos negócios nos dias atuais. Como usar o Big Data para produzir vantagem competitiva para a sua organização? Como estruturar os dados de modo a gerar insights para os negócios? Neste post, com recurso a exemplos práticos, apresentamos os 3 passos indispensáveis para quem quer transformar dados em informações realmente valiosas no mundo dos negócios. Se você já usa ou pretende começar a usar o Big Data, está artigo é para você! Continue a leitura e fique por dentro.

 

#1 Combinação de diferentes tipos de dados

Uma das principais características do Big Data é que esta ferramenta consiste em uma combinação de diversos tipos de dados. Por exemplo, um neurocirurgião hoje tem acesso a inúmeras tomografias do cérebro de um paciente, mas isso representa apenas um conjunto de informações. Esse profissional pode combinar esse conhecimento com o registro do histórico médico do paciente e o relatório das condições climáticas de onde essa pessoa morou ao longo da vida, de modo a responder: qual a relação entre a exposição solar e a esclerose múltipla e de que modo isso impacto o tratamento oferecido ao doente?

No mundo dos negócios, algo semelhante acontece. É preciso saber combinar dados diferentes e de diversas fontes de modo a gerar insights significativos. No fundo, o desafio principal não é ter acesso à informação, que existe em uma proporção absolutamente espantosa, como referido; é preciso agrupar e combinar essas informações tão diversas e traduzi-las em ações que interessem ao mundo dos negócios.

Por exemplo, na prática, uma empresa do varejo pode coletar no seu e-commerce dados como cliques em anúncios; sistema operacional do dispositivo usado pelo cliente; tipo de dispositivo (se é um smartphone ou um notebook); endereço de IP e e-mail; localização geográfica; e histórico de compras e de buscas. Tudo isso pode ser usado para prever, com elevada confiabilidade, qual produto tem maior chance de ser vendido para determinado perfil de cliente.

 

#2 Pré-processamento dos dados

Esta é uma etapa extremamente importante do processo. Trata-se de uma espécie de “limpeza” ou de triagem dos dados e, por meio disso, podem ser identificadas anomalias ou discrepâncias que possam comprometer a análise e a propositura das ações que referimos anteriormente.

Uma vez que se trata de uma quantia inumana de dados, essa triagem, claro, é feita de forma automática, com o recurso a programas baseados em métodos estatísticos, capazes de avaliar desvios e, com base em alguns critérios, definir a relevância desses desvios para a análise. Na prática, isso significa, por exemplo, que alguns dados considerados anômalos (nulos, inconsistentes, duplicados etc.) serão removidos para evitar que causem algum tipo de viés nos insights gerados.

Cá vai um bom exemplo para entendermos bem esta etapa.

Desde 2004, a empresa americana UPS, após uma cuidadosa análise das rotas de seus motoristas, proibiu que eles virassem à esquerda. Segundo a empresa, fazer essa manobra implicava mais tempo de espera numa rua e mais risco de colisão. A proibição permitiu entregar 350 mil pacotes a mais, além de economizar por ano cerca de 38 milhões de litros de combustível, reduzindo a emissão de 20 mil toneladas de dióxido de carbono.

Por causa dessa mudança, os motoristas não seguem necessariamente os caminhos mais curtos quando se dirigem de um ponto a outro, nem evitam que seus caminhões fiquem mais tempo no trânsito. A partir da análise de trilhões – sim, trilhões de potenciais rotas! o objetivo não é determinar o caminho mais curto, e, sim, o mais conveniente e eficiente. Isso, implica, logicamente, uma triagem muito específica nos dados coletados para determinar as melhores rotas dos condutores.

 

#3 Mineração de dados

A mineração de dados (do inglês, “data mining”) envolve o processamento de dados para a identificação de determinados padrões e, geralmente, é realizada computacionalmente, podendo envolver métodos de Inteligência Artificial, Machine Learning, estatística etc.

É nessa etapa da utilização do Big Data que são levantadas as questões relevantes para cada situação, dependendo do objetivo da empresa. Devido ao volume de dados envolvido, a mineração permite identificar padrões que mesmo o olhar humano mais apurado não conseguiria.

Por exemplo, durante um processo de mineração de dados, uma rede de mercados norte-americana descobriu que um número razoável de compradores de fralda descartável também comprava cerveja perto dos finais de semana. Depois de uma análise em milhares transações de compra, com a ajuda do software, os analistas perceberam que os compradores eram homens que, ao comprarem fraldas para seus filhos, aproveitavam e compravam também cerveja para consumo durante o final de semana – tratava-se, sem dúvida, de um padrão inesperado, mas era um padrão. Houve, portanto, uma a associação entre fraldas e cervejas, o que levou a que a rede de supermercados aproximasse as gôndolas de fraldas e cervejas na rede de mercados, turbinando a venda combinada desses dois produtos.

Como vimos, o Big Data oferece um potencial enorme para alavancar o sucesso dos negócios, transformando dados em insights relevantes. Por hoje, é tudo. Para receber outras dicas práticas voltadas para a vida das empresas, assine a nossa Newsletter e siga nossas redes sociais agora mesmo. Estamos no Facebook, Instagram, Twitter e no Linkedin.

 

PD Sistemas

Veja outros conteúdos