A inteligência artificial (IA) tem um papel cada vez mais estratégico para empresas e órgãos públicos. Por outro lado, um dos grandes desafios para essa tecnologia gerar resultados expressivos é implementar projetos de IA com qualidade de dados.
Uma prova dessa dificuldade é o estudo da Accenture com 1.500 executivos (115 do Brasil), em que foi constatado progressos significativos com IA em somente 20% das companhias. De acordo com essa pesquisa, muitas organizações não saem da Prova de Conceito (POC) para um nível maior de maturidade.
Para reverter essa situação, uma medida necessária é executar a coleta de dados de forma adequada. Assim, torna-se viável ter uma maior qualidade de dados, fator imprescindível para um projeto de Inteligência Artificial ser bem-sucedido.
Em razão disso, a coleta de dados deve ser feita por meio de fontes seguras e verificadas. Além disso, precisa ser feita com requisitos claros relativos ao formato das informações. Outra medida correta é implantar processos de controle de qualidade relativos à coleta.
Mais outro procedimento válido é automatizar a obtenção dos dados. Dessa forma, é possível minimizar erros humanos nesse processo e alcançar um maior nível de consistência das informações.
Contudo, é necessário, depois da coleta, haver uma higienização dos dados. Esse processo é muito importante para garantir que os dados estejam devidamente preparados para serem utilizados em projetos de IA.
Uma boa limpeza de dados envolve remover ruídos e falhas, o preenchimento de lacunas e a implementação de algoritmos para localizar e tratar eventuais anomalias. Também é vital priorizar a governança de dados, com foco em manter a qualidade e a integridade das informações.
Nesse sentido, os projetos de IA devem seguir políticas e padrões claros para a administração de dados. Essa prática envolve a definição de responsabilidade com o objetivo de haver uma maior aderência às leis de privacidade.
A governança de dados nos projetos de IA também envolve a adoção de procedimentos de controle de acesso para a proteção de dados sensíveis e a prevenção de acesso não autorizado ou adulteração.
Outra iniciativa relevante voltada para governança é o emprego de processos contínuos de monitoramento para identificar e corrigir falhas ligadas à qualidade de dados. Mais um aspecto indispensável para os modelos de IA alcançarem bons resultados abrange o cuidado com a diversidade e a representatividade.
Para essa ação ser bem-sucedida, é importante verificar se os dados obtidos contemplam grupos demográficos distintos. Também é fundamental conseguir informações de várias fontes para alcançar uma perspectiva mais ampla.
A realização de avaliações periódicas para identificar e corrigir falhas e a presença de equipes diversas nas fases de coleta, preparação e desenvolvimento de modelos de inteligência artificial são medidas válidas para conseguir uma abordagem mais inclusiva e equitativa.
Esse esforço é necessário, pois a qualidade de dados é um fator primordial para os projetos de IA atingirem um alto desempenho. Com certeza, a ausência de dados corretos e bem administrados pode gerar resultados ruins e problemas para a organização no futuro.
Esse cenário mostra que o controle de qualidade precisa ser uma ação constante, para que os benefícios proporcionados pela inteligência artificial sejam consolidados de forma ética, eficaz e segura.