Read, hack, repeat

Dark data: como lidar com o filho bastardo do big data

Ramon de Souza

Toda tendência ou revolução tecnológica benéfica vem acompanhada de efeitos colaterais negativos. Ao longo dos últimos anos, ganhamos ferramentas, plataformas e soluções que nos deram poder para armazenar e processar uma quantidade cada vez maior de dados — o que, na teoria, dentro do cenário corporativo, significa ter maior capacidade para extrair informações que possam ser usadas para análises, predições e elaboração de estratégias comerciais. Sim — basicamente estamos descrevendo o big data de uma forma simplista.

Mas será que todos os dados que as empresas guardam são realmente úteis? A resposta mais rápida é “não”. De acordo com Rahul Telang, professor da Faculdade Heinz de Sistemas de Informação e Políticas Públicas da Universidade Carnegie Mellon (EUA), cerca de 90% dos ativos digitais que as corporações guardam atualmente podem ser categorizados como dark data — nome utilizado para descrever dados sem valor algum e que não se traduzem em informação útil mesmo quando orquestrados e organizados.

Dark data refere-se aos dados sem valor para a estratégia comercial (Reprodução: Sophos)

A Gartner possui uma ótima definição para tal termo, que pode ser traduzido em português como “dados obscuros”. De acordo com a companhia, tratam-se de “ativos de informações que as organizações coletam, processam e armazenam durante atividades comerciais regulares, mas geralmente não os utilizam para outros fins (por exemplo, análises, relações comerciais e monetização direta) [...] as organizações geralmente retêm dados obscuros apenas para fins de conformidade. Armazenar e proteger esses dados geralmente incorre em mais despesa (e às vezes maior risco) do que valor.

Separando o joio do trigo

Em entrevista concedida à Forbes, Sky Cassidy, CEO da MountainTop Data, compara os dados obscuros corporativos àquelas fotos que você provavelmente tirou na sua última viagem de férias e jamais as visualizou novamente. “São todas aquelas informações que as empresas coletam em seus processos corporativos regulares, não a utilizam, não possui planos para utilizá-las, mas jamais vai jogá-las fora. São web logs, dados de rastreio de visitantes, vídeos de câmeras de vigilância, emails de funcionários antigos etc.”, explica.

A má gestão do dark data pode representar uma série de problemas, incluindo gastos desnecessários com infraestrutura para armazenar esses dados e maior dificuldade na hora de garantir compliance com legislações de proteção de dados. Visto que os dados obscuros não costumam estar estruturados, muitas empresas sequer sabem exatamente o que elas têm nas mãos — esses ativos podem ser sensíveis e causar danos à imagem corporativa na ocasião de um eventual incidente de segurança.

Dark data pode trazer mais custos e riscos (Reprodução: Softline)

Felizmente, o mercado está cada vez mais rico em soluções que podem ajudar as empresas a lidar com esse problema. Inteligência artificial e machine learning, por exemplo, são aliados valiosos na hora de vasculhar, categorizar e gerenciar dados obscuros — algo que, na maioria dos casos, é impossível de se fazer manualmente. O correto gerenciamento dessas informações não apenas reduz riscos, mas também pode levantar insights inéditos sobre o comportamento dos seus clientes ou lacunas em sua própria operação corporativa.

Obviamente, gerenciar dark data não é uma tarefa pontual, mas sim um processo contínuo, sendo essencial ainda adotar soluções e estratégias mais eficazes para mapear quais dados estão sendo coletados em todos os processos da corporação e definir de antemão quais devem ser armazenados ou não. Dessa forma, evita-se gastos desnecessários com, por exemplo, processamento em nuvem, além de reduzir os riscos de exposição de informações sensíveis.


Fonte: Forbes, Gartner, Datumize, IT Forum 365

Compartilhar twitter/ facebook/ Copiar link
Your link has expired
Success! Check your email for magic link to sign-in.