Descubra como um detector de IA sabe diferenciar sua escrita do GPT-4 e Gemini

Por Da redação

Bucharest, Romania - July 30th 2024 - Man typing prompts into an AI powered chat on his smartphone app, advanced virtual assistant showcases smart solutions for task completion.

Algumas tecnologias analisam pontos específicos que podem identificar certas características que são mais comuns em artigos IA. Outras buscam analisar estilo das frases e a estrutura de textos em frases para apontar possíveis textos não humanos.

Conforme a tecnologia IA vai avançando detectar ou verificar se o artigo foi elaborado por IA ou por um ser humano é um trabalho duro constante.

Como funcionam os geradores de textos?

Antes de aplicar a inteligência artificial como criador de textos, jornalistas e editores atualizavam muitas informações de forma manual desde apresentação de resultados trimestrais de grandes empresas ou dos resultados dos jogos de futebol, artigos em que era preciso reescrever periodicamente inúmeras vezes.

Após o surgimento de algoritmos inteligentes esses tipos de tarefas repetitivas começaram a ser automatizadas.

Depois de testá-lo pela primeira vez em 2016, quando as Olimpíadas do Rio foram realizadas, o criador de texto online Heliograf escreveu inúmeras histórias para o site americano The Washington Post. De notas políticas sobre a eleição para governador dos EUA em 2017 a pontuações esportivas de futebol.

Os editores do Guardian publicaram um artigo de 500 palavras escrito pelo GPT-3 em 2020 sobre “por que os humanos não devem temer o IA”. Segundo o jornal britânico, o criador do texto submeteu oito ensaios: "Cada um era único, interessante e apresentava um argumento diferente. Escolhemos as melhores partes de cada para capturar os diferentes estilos e registros. A edição do artigo de opinião do GPT-3 não foi diferente da edição de um artigo de opinião humana. No geral, a edição levou menos tempo do que muitas opiniões humanas".

No inicio a escrita da inteligência artificial só poderia escrever com dados repetitivos e mais ou menos desse jeito, resultados de uma partida de futebol ou a demonstração de resultado de uma empresa específica. É o mesmo que o chatbots de atendimento ao cliente, que precisam ser treinados e ajustados para conhecer melhor o setor e a empresa em que ele será integrado. O chatbot do banco por exemplo, deve saber responder a perguntas básicas sobre hipotecas, financiamento ou taxas de juros, enquanto um chatbot de companhia aérea pode falar precisamente sobre voos, pilotos e coisas do tipo.

O que está por trás da IA Detector?

Para entender como essas ferramentas funcionam você precisa olhar no texto não como um conjunto de emoções ou ideias humanas, mas sim como uma grande equação matemática cheia de variáveis complexas. Quando nós sentamos para escrever um post no twitter ou publicar uma foto com descrição no Instagram, a nossa mente funciona de um jeito único.

Mudamos de ideia no meio da frase, usamos uma palavra técnica difícil seguindo uma gíria comum do nosso dia a dia. Geralmente construimos frases gigantescas para explicar um conceito denso e depois colocamos um ponto final seco em uma frase de apenas três ou quatro palavras. Essa alternância natural e imprevista é o que os especialistas em tecnologia chamam de explosividade, ou variação estrutural narrativa.

Já do outro lado da moeda temos os sistemas de análise que leem o seu documento procurando justamente pela falta dessa mudança. O conceito técnico principal que permite essa distinção chama-se "perplexity" (não é a toa que existe uma AI com esse nome). De forma básica o aplicativo de detecção calcula o quão aleatória e surpreendente é a escolha da próxima palavra dentro de uma frase ou parágrafo. Se um software lê um trecho e consegue adivinhar com quase 100% de certeza qual será o próximo termo que vai aparecer, perplexity é considerada baixa.

Isso é um sinal forte de automação já que algoritmos tendem a ser constantes, lembrando também de que a tecnologia avalia o comprimento dos parágrafos. Máquinas adoram escrever parágrafos onde todas as frases têm praticamente o mesmo tamanho e a mesma estrutura (sujeito, verbo e predicado) e isso cria um ritmo de leitura monótono que dá um alerta vermelho na hora nos detectores.

Nós geralmente usamos sarcasmo e algumas vezes fazemos pausas dramáticas e conectamos ideias de formas que desafiam a estatística e um detector moderno consegue perceber quando o texto sai como uma conversa real ou quando ele parece apenas uma junção de dados organizados por um processador.

É essa hesitação de escrita do pensamento humano que as ferramentas de detecção buscam isolar e validar para garantir que a internet não se torne apenas um rio de textos repetitivos e sem alma.

A dificuldade de ter um texto original em trabalhos

Eu sei muito bem como é a pressão de ter que entregar um volume grande de palavras todos os dias com prazos apertados, falo isso porque acabei passando por isso recentemente na minha própria rotina de trabalho. Como redator publicitário de uma agência de alto desempenho, eu recebi a missão de entregar alguns artigos sobre um nicho de tecnologia de saúde que eu não dominava totalmente, mas o tempo era curto e a cobrança da diretoria era imensa.

Pensando sobre esse assunto vou deixar o passo a passo para tornar o artigo natural o mais rápido possível.

Para você garantir que o seu trabalho tenha a sua assinatura pessoal e não seja confundido com uma resposta automática, é muito importante seguir um método de revisão organizado. O primeiro passo que eu recomendo para você é se distanciar um pouco da tela e aplicar este roteiro prático de forma manual e atenciosa.

1° peça para alguém ler o seu texto e apontar frases repetitivas que travam a fluidez da leitura e cansam o seu leitor.

2° Troque finais esperados e frases prontas por ideias baseadas na sua experiência real e em dados que você mesmo coletou durante a sua pesquisa.

3° Faça uma análise de métricas de previsibilidade em ferramentas como JustDone para saber exatamente quais trechos estão soando artificiais demais aos olhos dos algoritmos.

4° E por fim, ajuste como você escreveu o artigo, troque o vocabulário e o ritmo das explicações com exatidão a sua autoria e o seu estilo de escrita único.

Você também deve prestar atenção especial nas primeiras e últimas frases de cada parágrafo, porque é nesses locais que o leitor decide se vale a pena continuar passando tempo no seu conteúdo. Use perguntas retóricas, chame o leitor para a conversa e evite começar frases sempre com as mesmas palavras. Se você notar que usou o termo "além disso" três vezes na mesma página, então faça a modificação ou simplesmente reestruture a frase para que ela saia sem precisar de forma normal.

Perguntas Frequentes

Como os detectores sabem que o artigo é IA?

Esses aplicativos trabalham verificando o seu artigo pela estrutura das suas frases com muitos dados guardados, além disso sabem que um conteúdo foi automatizado quando percebem que a escolha de palavras segue um cálculo com o mesmo resultado.

Qual é a diferença entre a escrita humana e a de IA?

Os principais sinais de um texto escrito por uma automação geralmente são pelas escolhas de palavras demasiado previsíveis e muitas vezes em parágrafos todas as frases têm praticamente o mesmo tamanho.

Como reduzir os textos de IA no meu artigo?é usar ferramentas de humanização ou fora disso recomendo o uso de informações que realmente são suas, como algo que aconteceu na sua vida e evitar o uso de palavras muito comuns pelas IAs.

Dá pra confiar totalmente nos resultados de um relatório de detecção?

Nenhum software disponível hoje possui precisão absoluta em todas as ocasiões, pois a linguagem é um fenômeno complicado que muda com o passar do tempo. Mas, os relatórios de ferramentas como JustDone fornece 99% de assertividade.

O que é perplexidade (perplexity) na escrita?

Perplexidade é o cálculo de quão previsível e estatisticamente esperada é a próxima palavra em um determinado artigo ou frase. Se o aplicativo adivinhar a próxima palavra com facilidade (baixa perplexidade), é um forte sinal de que o texto foi gerado por IA.