IA sem dados: a rota certa para o fracasso

Começar um projeto de IA sem dados estruturados é como montar uma apresentação de PowerPoint bonita, mas totalmente oca por dentro. Para funcionar bem, a IA precisa de contexto, e o contexto está nos dados que você entrega para ela trabalhar. Sem eles, qualquer resultado vai ser superficial e insustentável, inclusive no curto prazo.

Independentemente do tamanho da sua empresa ou do seu negócio, algumas questões são os alicerces para ter dados em ordem e, a partir deles estabelecer onde a IA pode ser benéfica para os seus resultados.

O primeiro é a Governança de Dados. Alguém precisa ser o “xerife” das informações, seja um DPO (Data Protection Officer) nas grandes corporações, seja o dono da empresa em pequenos empreendimentos. É a pessoa que assume a responsabilidade pelos dados. Estabelece regras, políticas de uso e processos de validação

O segundo alicerce é a  Qualidade de Dados. A garantia de que eles estejam limpos, completos, coerentes e atualizados. Não custa lembrar que dados enviesados ou não representativos podem gerar modelos discriminatórios ou decisões problemáticas, para não dizer, alucinadas. Dados de baixa qualidade podem transformar-se em comedores de verbas, à medida que cada pequeno erro pode significar dinheiro jogado fora na definição de público-alvo

O terceiro é a Arquitetura de Sistemas. Se a empresa tem vários sistemas ou fontes de dados (inclusive aquelas típicas planilhas de Excel escondidas nos arquivos de vendedores e gestores), eles precisam estar integrados em um repositório central e permitir a rastreabilidade, ou seja, a capacidade de acompanhar a origem, o histórico e o ciclo de vida completo de uma informação, desde sua coleta até seu uso e destino

O quarto alicerce e, talvez, o mais desprezado de todos, é a  Documentação. Documentação de dados é o processo de registrar, descrever e organizar informações sobre conjuntos de dados, incluindo sua origem, estrutura, significado e transformações. Ela cria um registro detalhado para garantir a clareza, a transparência e a compreensão dos dados, o que é crucial para a tomada de decisões, análises e colaboração. A documentação ajuda a contextualizar os dados, descrevendo fontes, metadados, regras de limpeza e a metodologia usada. 

Finalmente, o quinto é o Acesso aos dados: Os dados críticos estão mapeados? Os acessos são controlados? Os dados estão protegidos e não apenas para cumprir as leis?

A história recente tem revelado que boa parte dos ataques a bases de dados é feito a partir de pessoas, dentro das empresas, que não deveriam ter acesso a determinadas bases de dados.

Uma vez garantidos os alicerces, é sempre bom lembrar que só recursos tecnológicos não resolvem todos os problemas. Dados são ativos de negócios e não apenas subprodutos  do negócio. São estratégicos e não meramente operacionais.

Ignorar os atributos necessários aos dados antes de usá-los em IA é o melhor caminho para o desastre, inclusive o financeiro.

  • Estudos da IBM e Gartner indicam perdas entre 12% e 15% da receita devido a problemas com dados. [1]
  • Segundo a Experian, 88% das empresas sofrem impacto direto, com perda média de 12% da receita. [2]

Isso não é pouco dinheiro.

Por onde começa o trabalho?

  1. Nada funciona em empresas que não tenham uma estratégia clara
  2. Se existe uma estratégia: quais os dados que precisamos para acioná-la?
  3. Quais desses temos internamente? Quais precisam ser captados?
  4. Organize os processos de captura, tratamento e segurança (governança e qualidade são os principais fundamentos)
  5. Valide tudo e, aí sim, comece a treinar a sua IA

A cada etapa estabeleça quick wins, assim você garante que o projeto não será descontinuado por falta de resultados imediatos

IA não começa na escolha de ferramentas. Não começa no código ou no algoritmo.

Começa nos dados.


[1] https://enricher.io/blog/the-cost-of-incomplete-data

[2] https://insideainews.com/2017/05/05/hidden-costs-bad-data/