
Começar um projeto de IA sem dados estruturados é como montar uma apresentação de PowerPoint bonita, mas totalmente oca por dentro. Para funcionar bem, a IA precisa de contexto, e o contexto está nos dados que você entrega para ela trabalhar. Sem eles, qualquer resultado vai ser superficial e insustentável, inclusive no curto prazo.
Independentemente do tamanho da sua empresa ou do seu negócio, algumas questões são os alicerces para ter dados em ordem e, a partir deles estabelecer onde a IA pode ser benéfica para os seus resultados.
O primeiro é a Governança de Dados. Alguém precisa ser o “xerife” das informações, seja um DPO (Data Protection Officer) nas grandes corporações, seja o dono da empresa em pequenos empreendimentos. É a pessoa que assume a responsabilidade pelos dados. Estabelece regras, políticas de uso e processos de validação
O segundo alicerce é a Qualidade de Dados. A garantia de que eles estejam limpos, completos, coerentes e atualizados. Não custa lembrar que dados enviesados ou não representativos podem gerar modelos discriminatórios ou decisões problemáticas, para não dizer, alucinadas. Dados de baixa qualidade podem transformar-se em comedores de verbas, à medida que cada pequeno erro pode significar dinheiro jogado fora na definição de público-alvo
O terceiro é a Arquitetura de Sistemas. Se a empresa tem vários sistemas ou fontes de dados (inclusive aquelas típicas planilhas de Excel escondidas nos arquivos de vendedores e gestores), eles precisam estar integrados em um repositório central e permitir a rastreabilidade, ou seja, a capacidade de acompanhar a origem, o histórico e o ciclo de vida completo de uma informação, desde sua coleta até seu uso e destino
O quarto alicerce e, talvez, o mais desprezado de todos, é a Documentação. Documentação de dados é o processo de registrar, descrever e organizar informações sobre conjuntos de dados, incluindo sua origem, estrutura, significado e transformações. Ela cria um registro detalhado para garantir a clareza, a transparência e a compreensão dos dados, o que é crucial para a tomada de decisões, análises e colaboração. A documentação ajuda a contextualizar os dados, descrevendo fontes, metadados, regras de limpeza e a metodologia usada.
Finalmente, o quinto é o Acesso aos dados: Os dados críticos estão mapeados? Os acessos são controlados? Os dados estão protegidos e não apenas para cumprir as leis?
A história recente tem revelado que boa parte dos ataques a bases de dados é feito a partir de pessoas, dentro das empresas, que não deveriam ter acesso a determinadas bases de dados.
Uma vez garantidos os alicerces, é sempre bom lembrar que só recursos tecnológicos não resolvem todos os problemas. Dados são ativos de negócios e não apenas subprodutos do negócio. São estratégicos e não meramente operacionais.
Ignorar os atributos necessários aos dados antes de usá-los em IA é o melhor caminho para o desastre, inclusive o financeiro.
- Estudos da IBM e Gartner indicam perdas entre 12% e 15% da receita devido a problemas com dados. [1]
- Segundo a Experian, 88% das empresas sofrem impacto direto, com perda média de 12% da receita. [2]
Isso não é pouco dinheiro.
Por onde começa o trabalho?
- Nada funciona em empresas que não tenham uma estratégia clara
- Se existe uma estratégia: quais os dados que precisamos para acioná-la?
- Quais desses temos internamente? Quais precisam ser captados?
- Organize os processos de captura, tratamento e segurança (governança e qualidade são os principais fundamentos)
- Valide tudo e, aí sim, comece a treinar a sua IA
A cada etapa estabeleça quick wins, assim você garante que o projeto não será descontinuado por falta de resultados imediatos
IA não começa na escolha de ferramentas. Não começa no código ou no algoritmo.
Começa nos dados.
[1] https://enricher.io/blog/the-cost-of-incomplete-data
[2] https://insideainews.com/2017/05/05/hidden-costs-bad-data/