MIT tem IA que edita contextualmente artigos da Wikipédia

Compartilhe

A Wikipédia é uma plataforma colaborativa, onde (quase) qualquer pessoa pode editá-la para adicionar informações, verificar fatos, adicionar fontes e atualizar dados que estão desatualizados. Essas não são tarefas simples em uma plataforma com múltiplos idiomas, mas uma inteligência artificial pode facilitar as coisas.

O MIT desenvolveu um sistema que atualiza as inconsistências factuais em artigos da Wikipédia em um tempo muito menor que os humanos. A IA fica ciente das mudanças que acontecem nos fatos e informações, atualizando os artigos automaticamente.

Mudanças de dados para manter a linguagem humana

Nesse momento, o sistema ainda exige uma interação humana, mas a ideia é que, no futuro, o sistema faça tudo sozinho, preservando a linguagem humana e respeitando a forma em como os humanos escrevem e editam os artigos.

Para que o sistema funcione, o usuário deve escrever em uma interface uma frase não estruturada com as informações atualizadas. Inserindo os dados, o sistema procura a página onde estão essas informações e atualiza os dados, re-escrevendo a frase, tal e como um humano faria.

Alguns bots já fazem edições automáticas na Wikipédia, mas são baseados em regras, ou seja, se uma palavra maliciosa for colocada em um artigo, ela será removida. Já a tarefa de editar um arquivo exige um raciocínio mais aprofundado sobre partes conflitantes em duas frases, gerando textos consistentes.

Um exemplo prático. Vamos supor que a frase é a seguinte:

“O Fundo A considera que 28 de suas 42 participações minoritárias em empresas operacionais são de particular importância para o grupo.”

E que os dados devem ser alterados para a sentença a seguir:

“O Fundo A considera que 23 de suas 43 participações minoritárias são significativas.”

Aqui, dois dados precisam ser alterados: 28 e 42 para 23 e 42. Então, o sistema encontra o item do Fundo A e altera automaticamente, mantendo a estrutura da frase e, portanto, a concordância do texto. Para isso, o sistema foi treinado com um conjunto de dados baseado em pares de frases.

A IA analisou, com base em como os pares foram marcados, o que as palavras na frase da Wikipédia contradiziam as da alegação, reduzindo o número de palavras para um valor mínimo, com o texto mais neutro possível. Tudo isso é feito em um sistema de código e decodificação da sentença final.

Nos resultados, o modelo gerado pela IA foi mais preciso na realização de atualizações factuais do que outros sistemas de geração automática de texto (não foram revelados quais sistemas são esses). Em outro teste, algumas pessoas marcam o modelo aos cinco anos com base nas frases resultantes, e a nota foi de 4 pontos nos fatos e 3.85 pontos na gramática.

Via Engadget

Compartilhe