{"id":18128,"date":"2025-05-02T17:30:00","date_gmt":"2025-05-02T20:30:00","guid":{"rendered":"https:\/\/www.solucoesindustriais.com.br\/news\/?p=18128"},"modified":"2025-05-02T18:14:48","modified_gmt":"2025-05-02T21:14:48","slug":"phi-4-reasoning-plus","status":"publish","type":"post","link":"https:\/\/www.solucoesindustriais.com.br\/news\/tecnologia-e-inovacoes\/phi-4-reasoning-plus\/","title":{"rendered":"Phi-4-reasoning-plus da Microsoft supera modelos com mais par\u00e2metros"},"content":{"rendered":"<div class=\"tts_content_wrapper_1\" ><h3>O modelo Phi-4-reasoning-plus da Microsoft, com 14 bilh\u00f5es de par\u00e2metros, se destaca em tarefas complexas, superando modelos maiores. Ele utiliza fine-tuning supervisionado, racioc\u00ednio estruturado e aprendizado por refor\u00e7o para aumentar a precis\u00e3o e efici\u00eancia, sendo especialmente eficaz em benchmarks como o exame AIME 2025, o que resulta em respostas claras e precisas em contextos t\u00e9cnicos.<\/h3>\n<p>A Microsoft lan\u00e7ou o Phi-4-reasoning-plus, um modelo de linguagem de pesos abertos projetado para tarefas que exigem racioc\u00ednio estruturado profundo. Com 14 bilh\u00f5es de par\u00e2metros, o modelo supera outros maiores em benchmarks de matem\u00e1tica, ci\u00eancia e l\u00f3gica. Ele foi treinado com 16 bilh\u00f5es de tokens, incluindo dados sint\u00e9ticos e da web.<\/p>\n<h2>Desempenho Superior em Modelos Menores<\/h2>\n<p>O <strong>Phi-4-reasoning-plus<\/strong> da Microsoft desafia a no\u00e7\u00e3o de que apenas modelos de grande porte podem alcan\u00e7ar alto desempenho.<\/p>\n<p>Com 14 bilh\u00f5es de par\u00e2metros, ele \u00e9 consideravelmente menor que outros modelos de pesos abertos, como o DeepSeek-R1-Distill-70B, mas ainda assim, supera-os em benchmarks exigentes.<\/p>\n<p>Um exemplo marcante \u00e9 o desempenho no exame de matem\u00e1tica AIME 2025, onde o Phi-4-reasoning-plus obteve uma maior precis\u00e3o m\u00e9dia ao responder corretamente a todas as 30 quest\u00f5es na primeira tentativa, conhecido como &#8220;pass@1&#8221;.<\/p>\n<p>Este feito \u00e9 compar\u00e1vel ao desempenho do modelo DeepSeek-R1, que possui 671 bilh\u00f5es de par\u00e2metros, uma quantidade muito superior a do modelo da Microsoft.<\/p>\n<p>Essa efici\u00eancia \u00e9 alcan\u00e7ada por meio de uma estrat\u00e9gia de treinamento centrada em dados, que utiliza uma combina\u00e7\u00e3o de tra\u00e7os de racioc\u00ednio em cadeia sint\u00e9ticos e prompts de alta qualidade filtrados.<\/p>\n<p>Este m\u00e9todo n\u00e3o s\u00f3 melhora a precis\u00e3o, mas tamb\u00e9m promove a transpar\u00eancia e coer\u00eancia na resolu\u00e7\u00e3o de problemas complexos.<\/p>\n<h2>Racioc\u00ednio Estruturado com Fine-Tuning<\/h2>\n<p>O <strong>racioc\u00ednio estruturado<\/strong> do Phi-4-reasoning-plus \u00e9 aprimorado por um processo de fine-tuning supervisionado. Durante esta fase, o modelo \u00e9 treinado com uma mistura cuidadosamente selecionada de tra\u00e7os de racioc\u00ednio em cadeia sint\u00e9ticos e prompts de alta qualidade.<\/p>\n<p>Uma inova\u00e7\u00e3o chave no treinamento foi a incorpora\u00e7\u00e3o de sa\u00eddas de racioc\u00ednio estruturado marcadas com tokens especiais, como <code>&lt;think&gt;<\/code> e <code>&lt;\/think&gt;<\/code>.<\/p>\n<p>Esses tokens orientam o modelo a separar suas etapas intermedi\u00e1rias de racioc\u00ednio da resposta final, promovendo tanto a transpar\u00eancia quanto a coer\u00eancia na resolu\u00e7\u00e3o de problemas de longo prazo.<\/p>\n<p>Essa t\u00e9cnica n\u00e3o apenas melhora a clareza das respostas, mas tamb\u00e9m permite que o modelo explique suas decis\u00f5es de forma mais clara, facilitando a interpreta\u00e7\u00e3o e auditoria dos resultados, o que \u00e9 essencial em aplica\u00e7\u00f5es que exigem precis\u00e3o e responsabilidade.<\/p>\n<p>Ap\u00f3s a etapa de fine-tuning, o <strong>Phi-4-reasoning-plus<\/strong> passa por um processo de <em>aprendizado por refor\u00e7o<\/em> para aprimorar ainda mais sua precis\u00e3o e efici\u00eancia.<\/p>\n<p>Para isso, a Microsoft utiliza o algoritmo Group Relative Policy Optimization (GRPO) para otimizar a sa\u00edda do modelo, equilibrando corre\u00e7\u00e3o e concis\u00e3o.<\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Modelo de racioc\u00ednio da Microsoft, Phi-4-reasoning-plus, destaca-se em tarefas complexas com pesos abertos.<\/p>\n","protected":false},"author":6,"featured_media":18126,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[],"class_list":["post-18128","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia-e-inovacoes"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/18128","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/comments?post=18128"}],"version-history":[{"count":1,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/18128\/revisions"}],"predecessor-version":[{"id":18151,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/18128\/revisions\/18151"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media\/18126"}],"wp:attachment":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media?parent=18128"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/categories?post=18128"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/tags?post=18128"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}