Mar
23
22 de março de 2018 - 18:15

Dados-errados-o-maior-risco-para-a-inteligencia-artificial-televendas-cobranca

*Com informações da revista CIO/EUA

Uma reportagem publicada pela revista CIO/EUA aponta que o maior risco para o avanço e implementação das tecnologias de inteligência artificial (AI, na sigla em Inglês) é a utilização de dados errados. Segundo a matéria, a qualidade da governança de dados será fator essencial para o avanço da tecnologia. Se por um lado, ferramentas como o machine learning prometem transformar radicalmente muitas indústrias; por outro, representam riscos significativos – muitos ainda não descobertos, uma vez que só agora essas inovações começaram a avançar de forma considerável.

No entanto, as empresas não costumam perceber a importância dos dados antes de iniciar seus projetos de inteligência artificial.  “A maioria simplesmente não reconhece isso como um problema”, afirma Michele Goetz, analista da Forrester Research. “Quando questionadas sobre os desafios esperados com AI, o item ´ter coletas de dados com boa curadoria para treinar a IA´ está na parte de baixo da lista”.

Uma pesquisa recente da Forrester revela que apenas 17% dos entrevistados entendem que o maior desafio em um projeto de AI é o fato de não possuírem um acervo bem curado dos dados que serão usados para treinamento dos sistemas. “No entanto, quando as companhias embarcam em projetos de AI, esse é um dos pontos de maior sofrimento e uma das principais barreiras para passar de um piloto ou de uma prova de conceito para um sistema em produção”, destaca a analista.

“Outro problema é o fato de esses dados estarem bloqueados e serem de difícil acesso”, afirma o fundador e VP de pesquisas da 451 Research, Nick Patience. Ele explica que o machine learning não vai funcionar se os dados estiverem isolados. “Se os dados financeiros estiverem em sistemas da Oracle, os de RH no Workday, os contratos em um repositório da Documentum e não se criar conexões entre esses grupos, certamente as empresas terão dificuldades”, afirma.

As “tendências escondidas” dentro dos seus conjuntos de dados de treinamento é outro ponto que requer atenção. Diversos estudos recentes demonstraram que conjuntos de dados populares usados para treinar reconhecimento de imagem via AI incluíam uma predisposição de gênero. Por exemplo, uma imagem de um homem cozinhando seria identificada erroneamente como uma mulher, porque nos dados de treinamento as cozinheiras eram mulheres.

Como evitar problemas – “Qualquer que seja o viés, se existe discriminação por raça, gênero ou idade, isso podem ser refletido nos dados”, aponta o CEO da SpringBoard.ai, Bruce Molloy. Segundo ele, as empresas que estão criando sistemas de AI precisam garantir que os dados e os algoritmos usados para analisá-los estejam alinhados com seus princípios, objetivos e valores. “Você não pode terceirizar valores éticos e de julgamento para a AI”, destaca.

Esse cuidado pode ser tomado a partir de ferramentas de análises que ajudem as pessoas a entenderem como a AI tomou determinada decisão, incluindo auditores internos ou externos, ou painéis de revisão. Compliance também merece atenção quando se fala em fontes de dados – apenas porque uma empresa possui acesso à informação, isso não significa que ela pode e deve usá-la da maneira que quiser.

De acordo com o diretor de pesquisas sobre sistemas cognitivos e de AI do IDC, David Schubmehl, as empresas já começaram a realizar auditorias nos seus modelos de machine learning e a analisar os dados que vão para esses modelos. “Companhias de auditoria independentes também estão começando a olhar para essa questão”, diz o especialista. “Acho que isso vai se tornar parte do processo de auditoria. Mas como todo o restante, é uma área emergente. Ainda estão tentando descobrir quais são as melhores práticas”, observa.

“Penso que estamos nos dias iniciais, em que os modelos de AI ou de machine learning estão apenas fornecendo assistência e recomendações para profissionais treinados, em vez de eles mesmos fazerem o trabalho”, afirma Schubmehl.

Mesmo dados totalmente precisos podem apresentar problemas em termos de predisposição, afirma o líder global de AI da PricewaterhouseCoopers, Anand Rao. “Digamos que uma empresa de seguros com sede no centro oeste dos EUA use seus dados históricos para treinar seus sistemas de AI e então expanda sua atuação para a Flórida. O sistema não seria útil para prever o risco de furacões, por exemplo. A história é válida; o dado é válido. Mas as questões mandatórias são onde você usa o modelo e como você usa o modelo”, diz.

Aumento de dados falsos – As influências intrínsecas também são apontadas como outro fator de atenção. Um exemplo é a disseminação de notícias falsas (fake news) nas redes sociais. “É uma corrida armamentista”, afirma Rao.

Enquanto as redes sociais trabalham para combater o problema, os hackers usam a sua própria AI para criar bots inteligentes o bastante para se passar por humanos, seja para influenciar as redes sociais, ou para convencer os anunciantes de que são consumidores reais.

É aí que entra em cena o conhecimento sobre domínios e o bom senso.  “Compreender os padrões e a parte matemática é o que vai levar até certo ponto”, explica o CTO da empresa Garrigan Lyman Group, Chris Geiser. “O mais importante é entender todas as suas fontes individuais de dados. Quanto mais você entende os seus dados, o que você está tentando alcançar e seus indicadores principais de desempenho, mais você poderá apontar para a direção correta a seguir.”

Compare suas fontes de dados – Se uma empresa possui dados vindos de diversas fontes, é importante verificar as informações de uma fonte em relação à outra antes de aplicar qualquer tipo de aprendizado de máquina.

A NTT Group, uma das maiores empresas de telecom do mundo, gera um grande volume de dados a partir da sua infraestrutura de redes.  Atualmente, a companhia está investindo em tecnologias para melhorar a qualidade dos dados de treinamento para machine learning.

Para isso, usa métodos de “agrupamento”. Cada grupo tem um valor de ponderação, que seria o “grau de confiança” da fonte de dados. A partir de uma seleção baseada em seu nível de curacidade, os dados selecionados seguem para uma base de grande escala que os prepara como dados de treinamento para aprendizado de máquina.

Em resumo, com estratégia, ferramentas e profissionais certos para o gerenciamento de dados, é possível elevar muito a chance de sucesso em projetos de AI.

Conheça gratuitamente a ferramenta de atualização cadastral da Think Data e entenda como ela auxilia as empresas na melhora dos seus atendimentos via robôs: http://www.thinkdata.com.br/teste-gratuito

CADASTRE-SE no Blog Televendas & Cobrança e receba semanalmente por e-mail nosso Newsletter com os principais artigos, vagas, notícias do mercado, além de concorrer a prêmios mensais.

» Conheça os colaboradores que fazem o Blog Televendas e Cobrança.

Gostou deste artigo? Compartilhe!

Escreva um comentário:

[fechar]
Receba as nossas novidades por e-mail:
Cadastre-se agora e receba em seu e-mail:
  • Notícias e novidades do segmento de contact center;
  • Vagas em aberto das principais empresas de Atendimento ao Cliente;
  • Artigos exclusivos sobre Televendas & Cobrança assinados pelos principais executivos do mercado;
  • Promoções, Sorteios e muito mais.
Preencha o campo abaixo e fique por dentro das novidades: