{"id":14225,"date":"2025-04-08T10:00:00","date_gmt":"2025-04-08T13:00:00","guid":{"rendered":"https:\/\/www.solucoesindustriais.com.br\/news\/?p=14225"},"modified":"2025-04-08T10:35:54","modified_gmt":"2025-04-08T13:35:54","slug":"deepseek-grm","status":"publish","type":"post","link":"https:\/\/www.solucoesindustriais.com.br\/news\/tecnologia-e-inovacoes\/deepseek-grm\/","title":{"rendered":"Modelos DeepSeek-GRM usam aprendizado por refor\u00e7o para melhorar a IA"},"content":{"rendered":"<div class=\"tts_content_wrapper_1\" ><h3>A DeepSeek, em colabora\u00e7\u00e3o com a Universidade Tsinghua, lan\u00e7ar\u00e1 os modelos de intelig\u00eancia artificial DeepSeek-GRM, que utilizam uma abordagem inovadora de aprendizado por refor\u00e7o para otimizar custos operacionais e aumentar a precis\u00e3o.<\/h3>\n<p>A DeepSeek est\u00e1 colaborando com a Universidade Tsinghua para desenvolver modelos de IA que necessitam de menos treinamento, visando reduzir custos operacionais. A startup chinesa, conhecida por seu modelo de racioc\u00ednio de baixo custo, est\u00e1 focada em melhorar a efici\u00eancia dos modelos de IA por meio de uma nova abordagem de aprendizado por refor\u00e7o.<\/p>\n<h2>Colabora\u00e7\u00e3o entre DeepSeek e Tsinghua<\/h2>\n<p>A colabora\u00e7\u00e3o entre a <strong>DeepSeek<\/strong> e a <strong>Universidade Tsinghua<\/strong> marca um avan\u00e7o significativo na pesquisa de modelos de intelig\u00eancia artificial.<\/p>\n<p>O objetivo principal dessa parceria \u00e9 reduzir o tempo e os recursos necess\u00e1rios para treinar modelos de IA, o que pode resultar em uma diminui\u00e7\u00e3o substancial nos custos operacionais.<\/p>\n<p>Essa colabora\u00e7\u00e3o \u00e9 impulsionada pela expertise de Tsinghua em pesquisa acad\u00eamica e a abordagem inovadora da DeepSeek no desenvolvimento de modelos de racioc\u00ednio de baixo custo.<\/p>\n<p>Juntas, as institui\u00e7\u00f5es est\u00e3o explorando novas t\u00e9cnicas de aprendizado por refor\u00e7o que prometem tornar os modelos de IA mais eficientes e alinhados \u00e0s prefer\u00eancias humanas.<\/p>\n<p>O trabalho conjunto resultou na cria\u00e7\u00e3o de um artigo que detalha essas novas abordagens, destacando como a aplica\u00e7\u00e3o de recompensas pode melhorar a precis\u00e3o e a compreens\u00e3o das respostas geradas por modelos de IA.<\/p>\n<p>Essa pesquisa n\u00e3o s\u00f3 contribui para o campo da intelig\u00eancia artificial, mas tamb\u00e9m estabelece um novo padr\u00e3o para colabora\u00e7\u00f5es entre empresas de tecnologia e institui\u00e7\u00f5es acad\u00eamicas.<\/p>\n<h2>Nova abordagem de aprendizado por refor\u00e7o<\/h2>\n<p>Uma <strong>nova abordagem de aprendizado por refor\u00e7o<\/strong> desenvolvida pela DeepSeek e pela Universidade de Tsinghua representa um avan\u00e7o significativo na efici\u00eancia dos modelos de intelig\u00eancia artificial.<\/p>\n<p>Essa metodologia visa otimizar o processo de aprendizado, reduzindo a necessidade de extensos recursos computacionais e tempo de treinamento.<\/p>\n<p>O conceito central dessa abordagem \u00e9 a introdu\u00e7\u00e3o do que a equipe chama de &#8220;auto-cr\u00edtica principiol\u00f3gica&#8221;.<\/p>\n<p>Essa t\u00e9cnica permite que os modelos de IA se ajustem de forma aut\u00f4noma, aprimorando suas respostas com base em crit\u00e9rios de recompensa que valorizam a precis\u00e3o e a clareza.<\/p>\n<p>Isso n\u00e3o apenas melhora a performance dos modelos em tarefas espec\u00edficas, mas tamb\u00e9m amplia suas capacidades em aplica\u00e7\u00f5es mais gerais.<\/p>\n<p>Os resultados obtidos com essa nova t\u00e9cnica superaram m\u00e9todos e modelos existentes em diversos benchmarks, demonstrando um desempenho superior com menos recursos.<\/p>\n<p>Essa inova\u00e7\u00e3o tem o potencial de transformar a maneira como os modelos de IA s\u00e3o treinados e aplicados, oferecendo solu\u00e7\u00f5es mais r\u00e1pidas e eficientes para uma ampla gama de desafios tecnol\u00f3gicos.<\/p>\n<h2>Modelos DeepSeek-GRM e c\u00f3digo aberto<\/h2>\n<p>Os <strong>modelos DeepSeek-GRM<\/strong>, ou &#8220;Generalist Reward Modeling&#8221;, representam a mais recente inova\u00e7\u00e3o da DeepSeek no campo da intelig\u00eancia artificial.<\/p>\n<p>Esses modelos foram projetados para serem mais adapt\u00e1veis e eficientes, utilizando uma abordagem de modelagem de recompensas que permite um aprendizado mais alinhado \u00e0s prefer\u00eancias humanas e com menor consumo de recursos.<\/p>\n<p>A DeepSeek anunciou que esses modelos ser\u00e3o disponibilizados em formato de <strong>c\u00f3digo aberto<\/strong>, permitindo que a comunidade de desenvolvedores e pesquisadores tenha acesso completo \u00e0s suas funcionalidades.<\/p>\n<p>Essa decis\u00e3o visa fomentar a colabora\u00e7\u00e3o e o avan\u00e7o cont\u00ednuo no desenvolvimento de tecnologias de IA, permitindo que outros desenvolvedores contribuam com melhorias e novas aplica\u00e7\u00f5es.<\/p>\n<p>Com a disponibiliza\u00e7\u00e3o em c\u00f3digo aberto, espera-se que os modelos DeepSeek-GRM sejam amplamente adotados e adaptados para uma variedade de usos, desde aplica\u00e7\u00f5es comerciais at\u00e9 pesquisas acad\u00eamicas.<\/p>\n<p>Essa iniciativa destaca o compromisso da DeepSeek em promover a inova\u00e7\u00e3o aberta e colaborar com a comunidade global para enfrentar os desafios da intelig\u00eancia artificial.<\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Modelos de IA da DeepSeek buscam reduzir custos operacionais e melhorar efici\u00eancia com novos m\u00e9todos de aprendizado.<\/p>\n","protected":false},"author":6,"featured_media":14224,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[],"class_list":["post-14225","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia-e-inovacoes"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/14225","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/comments?post=14225"}],"version-history":[{"count":1,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/14225\/revisions"}],"predecessor-version":[{"id":14244,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/14225\/revisions\/14244"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media\/14224"}],"wp:attachment":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media?parent=14225"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/categories?post=14225"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/tags?post=14225"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}