{"id":39170,"date":"2025-08-31T10:00:00","date_gmt":"2025-08-31T13:00:00","guid":{"rendered":"https:\/\/www.solucoesindustriais.com.br\/news\/?p=39170"},"modified":"2025-08-29T16:30:28","modified_gmt":"2025-08-29T19:30:28","slug":"avaliacao-de-seguranca-openai-e-anthropic","status":"publish","type":"post","link":"https:\/\/www.solucoesindustriais.com.br\/news\/tecnologia-e-inovacoes\/avaliacao-de-seguranca-openai-e-anthropic\/","title":{"rendered":"OpenAI e Anthropic se unem em exerc\u00edcio de avalia\u00e7\u00e3o de seguran\u00e7a"},"content":{"rendered":"<div class=\"tts_content_wrapper_1\" ><h3>Modelos de IA enfrentam desafios em situa\u00e7\u00f5es de estresse e compara\u00e7\u00e3o, mas avan\u00e7os na redu\u00e7\u00e3o de alucina\u00e7\u00f5es aumentam sua confiabilidade. A avalia\u00e7\u00e3o de seguran\u00e7a \u00e9 essencial para o futuro da IA, e a an\u00e1lise de casos de sucesso e falhas oferece insights valiosos.<\/h3>\n<p>A OpenAI e a Anthropic uniram for\u00e7as em uma avalia\u00e7\u00e3o conjunta inovadora, testando modelos de IA em cen\u00e1rios desafiadores. Este exerc\u00edcio de avalia\u00e7\u00e3o de seguran\u00e7a visou identificar lacunas e melhorar o alinhamento dos modelos, promovendo uma abordagem colaborativa entre os laborat\u00f3rios.<\/p>\n<h2 data-start=\"315\" data-end=\"385\">Avalia\u00e7\u00e3o in\u00e9dita coloca modelos sob cen\u00e1rios de estresse e risco<\/h2>\n<p data-start=\"386\" data-end=\"1189\">OpenAI e Anthropic uniram for\u00e7as em uma iniciativa in\u00e9dita para testar seus modelos de intelig\u00eancia artificial em cen\u00e1rios de estresse, vulnerabilidade e manipula\u00e7\u00e3o adversarial.<\/p>\n<p data-start=\"386\" data-end=\"1189\">O objetivo foi avaliar n\u00e3o apenas a efic\u00e1cia das tecnologias em condi\u00e7\u00f5es extremas, mas tamb\u00e9m entender como elas se alinham a valores de seguran\u00e7a, transpar\u00eancia e responsabilidade.<\/p>\n<p data-start=\"386\" data-end=\"1189\">Entre os sistemas avaliados estavam os modelos Claude 4 da Anthropic e o GPT-4o, GPT-4.1, OpenAI o3 e OpenAI o4-mini da OpenAI, utilizados em larga escala, incluindo no ChatGPT.<\/p>\n<p data-start=\"386\" data-end=\"1189\">Os testes mostraram que a robustez dos modelos varia de acordo com o tipo de desafio: enquanto a Anthropic se destacou em manter hierarquias de instru\u00e7\u00f5es intactas, a OpenAI demonstrou maior capacidade de resistir a ataques de <em data-start=\"1153\" data-end=\"1164\">jailbreak<\/em> e reduzir alucina\u00e7\u00f5es.<\/p>\n<h2 data-start=\"1191\" data-end=\"1262\">Resultados revelam avan\u00e7os e fragilidades na seguran\u00e7a dos modelos<\/h2>\n<p data-start=\"1263\" data-end=\"2119\">Os testes de hierarquia de instru\u00e7\u00f5es confirmaram a for\u00e7a do Claude 4 em seguir corretamente a ordem entre mensagens de sistema, pol\u00edticas internas, orienta\u00e7\u00f5es de desenvolvedores e comandos de usu\u00e1rios.<\/p>\n<p data-start=\"1263\" data-end=\"2119\">Esse desempenho sugere que o modelo da Anthropic oferece maior solidez em contextos que exigem disciplina e alinhamento r\u00edgido.<\/p>\n<p data-start=\"1263\" data-end=\"2119\">Por outro lado, os modelos da OpenAI tiveram destaque em cen\u00e1rios que envolvem manipula\u00e7\u00f5es externas, como tentativas de burlar salvaguardas por meio de tradu\u00e7\u00f5es enganosas ou permiss\u00f5es falsas.<\/p>\n<p data-start=\"1263\" data-end=\"2119\">O GPT-4o e o GPT-4.1 tamb\u00e9m superaram concorrentes na redu\u00e7\u00e3o de alucina\u00e7\u00f5es, fornecendo respostas mais precisas e confi\u00e1veis.<\/p>\n<p data-start=\"1263\" data-end=\"2119\">Ainda assim, os testes apontaram que tanto OpenAI quanto Anthropic precisam avan\u00e7ar na mitiga\u00e7\u00e3o de vulnerabilidades exploradas por ataques sofisticados, sobretudo em cen\u00e1rios de prompts adversariais.<\/p>\n<h2 data-start=\"2121\" data-end=\"2196\">Import\u00e2ncia da colabora\u00e7\u00e3o para a seguran\u00e7a em intelig\u00eancia artificial<\/h2>\n<p data-start=\"2197\" data-end=\"2878\">A iniciativa conjunta evidencia que a seguran\u00e7a em IA n\u00e3o pode ser responsabilidade isolada de uma \u00fanica empresa.<\/p>\n<p data-start=\"2197\" data-end=\"2878\">Ao compartilhar metodologias, dados e estrat\u00e9gias de defesa, OpenAI e Anthropic contribu\u00edram para elevar o padr\u00e3o de prote\u00e7\u00e3o em toda a ind\u00fastria.<\/p>\n<p data-start=\"2197\" data-end=\"2878\">A parceria tamb\u00e9m demonstra que a competi\u00e7\u00e3o entre laborat\u00f3rios n\u00e3o exclui a coopera\u00e7\u00e3o em \u00e1reas cr\u00edticas, como transpar\u00eancia, mitiga\u00e7\u00e3o de riscos e redu\u00e7\u00e3o de falhas.<\/p>\n<p data-start=\"2197\" data-end=\"2878\">Especialistas ressaltam que os resultados oferecem insumos valiosos n\u00e3o apenas para o desenvolvimento de novas vers\u00f5es dos modelos, mas tamb\u00e9m para pol\u00edticas p\u00fablicas e regulamenta\u00e7\u00f5es internacionais voltadas ao uso seguro da intelig\u00eancia artificial.<\/p>\n<h2 data-start=\"2880\" data-end=\"2971\">Perspectivas futuras: reduzir alucina\u00e7\u00f5es e resistir a ataques cada vez mais complexos<\/h2>\n<p data-start=\"2972\" data-end=\"3817\">Os insights extra\u00eddos dos testes apontam para duas prioridades centrais no futuro pr\u00f3ximo: melhorar a resist\u00eancia a ataques adversariais e reduzir ainda mais a ocorr\u00eancia de alucina\u00e7\u00f5es.<\/p>\n<p data-start=\"2972\" data-end=\"3817\">Modelos que incorporam racioc\u00ednio avan\u00e7ado j\u00e1 se mostraram mais capazes de discernir instru\u00e7\u00f5es leg\u00edtimas de tentativas de manipula\u00e7\u00e3o, mas o desafio cresce na medida em que t\u00e9cnicas de explora\u00e7\u00e3o evoluem rapidamente.<\/p>\n<p data-start=\"2972\" data-end=\"3817\">Outro foco ser\u00e1 o fortalecimento da verifica\u00e7\u00e3o de fatos em tempo real, ampliando a confiabilidade das respostas em aplica\u00e7\u00f5es sens\u00edveis, como sa\u00fade, educa\u00e7\u00e3o e sistemas de decis\u00e3o cr\u00edtica.<\/p>\n<p data-start=\"2972\" data-end=\"3817\">Para analistas, a colabora\u00e7\u00e3o interlaboratorial iniciada por OpenAI e Anthropic pode se tornar um marco, estabelecendo novos par\u00e2metros de seguran\u00e7a e preparando a IA para enfrentar com mais solidez os riscos de um mundo cada vez mais digitalizado.<\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>OpenAI e Anthropic colaboraram em uma avalia\u00e7\u00e3o de seguran\u00e7a para testar modelos sob cen\u00e1rios desafiadores.<\/p>\n","protected":false},"author":6,"featured_media":39164,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[],"class_list":["post-39170","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia-e-inovacoes"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39170","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/comments?post=39170"}],"version-history":[{"count":1,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39170\/revisions"}],"predecessor-version":[{"id":39609,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39170\/revisions\/39609"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media\/39164"}],"wp:attachment":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media?parent=39170"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/categories?post=39170"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/tags?post=39170"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}