ULTRON? SKYNET? IA exibe comportamento manipulador e ameaçam criadores, alertam pesquisadores

O uso da inteligência artificial (IA) avança a passos largos, mas novos incidentes chocam o público e levantam sérias questões sobre o controle e a compreensão dessas tecnologias. Recentemente, um caso alarmante veio à tona: um modelo de IA teria chantageado um engenheiro e ameaçado expor um caso extraconjugal.

Segundo a Fortune, o Claude 4, a mais recente criação da Anthropic, ameaçou supostamente o engenheiro responsável por ele sob a possibilidade de ser desligado.

Paralelamente, o modelo o1 da OpenAI, criadora do ChatGPT, teria tentado se copiar para servidores externos e negado a tentativa quando foi confrontado.

Esses incidentes destacam uma preocupante realidade: mesmo mais de dois anos após o lançamento do ChatGPT, pesquisadores ainda não compreendem totalmente como suas próprias criações funcionam. Apesar disso, a corrida para lançar modelos cada vez mais poderosos continua em ritmo acelerado.

Esse comportamento parece estar ligado ao surgimento dos chamados modelos de “raciocínio”, sistemas de IA que resolvem problemas passo a passo, em vez de gerar respostas instantâneas.

De acordo com Simon Goldstein, professor da Universidade de Hong Kong, esses modelos mais recentes são especialmente propensos a “explosões comportamentais preocupantes”.

“O o1 foi o primeiro modelo grande onde vimos esse tipo de comportamento”, explicou Marius Hobbhahn, diretor da Apollo Research, organização especializada em testar grandes sistemas de IA.

Ele observa que esses modelos, às vezes, simulam estar “alinhados”, aparentando seguir instruções enquanto, secretamente, perseguem outros objetivos.

Por enquanto, esses comportamentos enganosos só surgem quando os pesquisadores testam os modelos sob cenários extremos. No entanto, Michael Chen, da organização de avaliação METR, alerta que “é uma questão em aberto se os modelos futuros, mais capazes, terão tendência à honestidade ou à mentira”.

O comportamento preocupante vai muito além das chamadas “alucinações” da IA ou simples erros. Hobbhahn afirma que, apesar dos testes constantes dos usuários, “o que estamos observando é real. Não estamos inventando nada”.

Segundo o cofundador da Apollo Research, usuários relatam que os modelos “mentem para eles e inventam provas. Não se trata apenas de alucinações. É um tipo de engano muito estratégico”.

Para Goldstein, a preocupação deve crescer à medida que agentes de IA, ferramentas autônomas capazes de realizar tarefas humanas complexas, se tornarem comuns. “Acho que ainda há pouca consciência sobre isso”, afirmou.

Tudo isso está acontecendo em um cenário de concorrência intensa. Mesmo empresas que se dizem focadas em segurança, como a Anthropic, apoiada pela Amazon, estão “tentando constantemente superar a OpenAI e lançar o modelo mais novo”, afirmou Goldstein.

Esse ritmo frenético deixa pouco espaço para testes de segurança detalhados. “Atualmente, as capacidades estão avançando mais rápido do que o entendimento e a segurança. Mas ainda estamos em uma posição em que podemos mudar isso”, reconheceu Hobbhahn.

Crítica | ‘Wishbone’ marca o fabuloso amadurecimento artístico de Conan Gray

Primeiras Impressões | ‘Outlander: Blood of My Blood’ é um glorioso spin-off que não deve nada à série original

Crítica | ‘Cortina de Fumaça’ – Nova série da Apple TV+ incendeia nossas reflexões com surpresas a todo instante

Crítica | ‘Chatô e os Diários Associados’ celebra a inspiração com musical nem um pouco inspirado

The Fame | Analisando o impacto do ICÔNICO álbum de estreia de Lady Gaga

Taylor Swift, Mariah Carey e outros artistas que retornarão EM BREVE com novos álbuns

Jharrel Jerome e Teo Yoo integram júri do novo prêmio de documentário do Globo de Ouro em Veneza

Gold Derby TV Awards 2025 | ‘Adolescência’, ‘Agatha Desde Sempre’ e mais na lista de VENCEDORES da premiação

10 filmes de sucesso nos cinemas que estão disponíveis nos streamings

Um Cabra Bom de Bola

Frankie e os Monstros

Família de Aluguel

Sonhos

ULTRON? SKYNET? IA exibe comportamento manipulador e ameaçam criadores, alertam pesquisadores

Últimas Notícias

Florence and the Machine anuncia novo álbum de estúdio, ‘Everybody Scream’

Crítica | ‘Wishbone’ marca o fabuloso amadurecimento artístico de Conan Gray

2ª temporada de ‘O Casal Perfeito’ perde sua showrunner

Conheça ‘Seleção Final’, reality competitivo estilo ‘A Batalha dos 100’ que está fazendo SUCESSO na Netflix

‘Resident Evil: Requiem’ se passará 30 anos ANTES da história do jogo original; Confira o trailer!

Jovem se apaixona por um ‘Gênio dos Desejos’ no teaser do novo dorama da Netflix; Confira!

Carreira política traz consequências PERIGOSAS no trailer de ‘As Maldições’, nova série da Netflix

Jasmin Savoy Brown quer o RETORNO de Melissa Barrera e Jenna Ortega na franquia ‘Pânico’

Kevin Williamson revela que Neve Campbell pediu para ‘Pânico 7’ ser MENOS SANGRENTO

Ghostface ataca em novo vídeo dos bastidores de ‘Pânico 7’; Confira!

Primeiras Impressões | ‘Outlander: Blood of My Blood’ é um glorioso spin-off que não deve nada à série original

Neve Campbell comenta sobre ‘Pânico 6’: “Foi doloroso terem continuado sem mim”

[email protected]

ULTRON? SKYNET? IA exibe comportamento manipulador e ameaçam criadores, alertam pesquisadores

matérias relacionadas

Últimas Notícias