{"id":21905,"date":"2025-05-27T10:00:00","date_gmt":"2025-05-27T13:00:00","guid":{"rendered":"https:\/\/www.solucoesindustriais.com.br\/news\/?p=21905"},"modified":"2025-05-27T11:04:29","modified_gmt":"2025-05-27T14:04:29","slug":"modelo-ai-multimodal-bagel","status":"publish","type":"post","link":"https:\/\/www.solucoesindustriais.com.br\/news\/tecnologia-e-inovacoes\/modelo-ai-multimodal-bagel\/","title":{"rendered":"Modelo AI multimodal da ByteDance revoluciona edi\u00e7\u00e3o de imagens"},"content":{"rendered":"<div class=\"tts_content_wrapper_1\" ><h3>A ByteDance lan\u00e7ou o modelo AI multimodal Bagel, que se destaca na edi\u00e7\u00e3o de imagens com suas capacidades avan\u00e7adas de manipula\u00e7\u00e3o visual, permitindo edi\u00e7\u00f5es livres e s\u00edntese multivis\u00e3o, al\u00e9m de uma melhor compreens\u00e3o da rela\u00e7\u00e3o entre texto e imagem, resultando em edi\u00e7\u00f5es precisas e inovadoras.<\/h3>\n<p>ByteDance lan\u00e7ou o modelo de intelig\u00eancia artificial multimodal Bagel, capaz de entender, gerar e editar imagens. Com suporte para manipula\u00e7\u00e3o visual livre e s\u00edntese multivis\u00e3o, o Bagel supera modelos existentes em edi\u00e7\u00e3o de imagens. Dispon\u00edvel em reposit\u00f3rios populares como GitHub, o Bagel oferece uma nova dimens\u00e3o em edi\u00e7\u00e3o visual.<\/p>\n<h2>Capacidades avan\u00e7adas de manipula\u00e7\u00e3o visual<\/h2>\n<p>As capacidades avan\u00e7adas de manipula\u00e7\u00e3o visual do modelo Bagel s\u00e3o um marco significativo no desenvolvimento de modelos de intelig\u00eancia artificial multimodal.<\/p>\n<p>Com a habilidade de aceitar tanto texto quanto imagens como entrada, o Bagel oferece uma gama de funcionalidades que aprimoram a intera\u00e7\u00e3o entre diferentes modalidades de dados.<\/p>\n<p>Entre suas capacidades, destaca-se a manipula\u00e7\u00e3o visual livre, que permite edi\u00e7\u00f5es criativas e personalizadas, como a adi\u00e7\u00e3o ou remo\u00e7\u00e3o de elementos em uma imagem, sem comprometer a integridade visual.<\/p>\n<p>Essa funcionalidade \u00e9 particularmente \u00fatil em aplica\u00e7\u00f5es de design gr\u00e1fico e fotografia, onde a precis\u00e3o e a criatividade s\u00e3o essenciais.<\/p>\n<p>Al\u00e9m disso, o Bagel \u00e9 capaz de realizar sintetiza\u00e7\u00e3o multivis\u00e3o, uma t\u00e9cnica que permite a cria\u00e7\u00e3o de novas perspectivas de uma imagem existente.<\/p>\n<p>Isso \u00e9 poss\u00edvel gra\u00e7as ao seu treinamento em dados intercalados multimodais, que fornecem ao modelo uma compreens\u00e3o mais profunda das rela\u00e7\u00f5es espaciais e contextuais dentro de uma imagem.<\/p>\n<p>Outra capacidade not\u00e1vel \u00e9 a modelagem do mundo, que refere-se \u00e0 habilidade do modelo em entender o funcionamento visual do mundo real, incluindo a rela\u00e7\u00e3o entre objetos e o contexto f\u00edsico.<\/p>\n<p>Isso \u00e9 crucial para aplica\u00e7\u00f5es que exigem uma representa\u00e7\u00e3o precisa do ambiente, como em simula\u00e7\u00f5es e realidade aumentada.<\/p>\n<h2>Desempenho superior do Bagel em edi\u00e7\u00e3o de imagens<\/h2>\n<p>O <strong>desempenho superior<\/strong> do modelo Bagel da ByteDance em edi\u00e7\u00e3o de imagens \u00e9 um dos seus principais destaques. Este modelo foi projetado para realizar tarefas complexas de edi\u00e7\u00e3o, como adicionar emo\u00e7\u00f5es a uma imagem, remover ou substituir elementos e realizar transfer\u00eancias de estilo.<\/p>\n<p>Essas capacidades permitem que o Bagel ofere\u00e7a edi\u00e7\u00f5es mais precisas e contextualmente relevantes em compara\u00e7\u00e3o com outros modelos de linguagem visual multimodal (VLM) dispon\u00edveis no mercado.<\/p>\n<p>Al\u00e9m disso, o Bagel \u00e9 capaz de realizar edi\u00e7\u00f5es livres, o que significa que ele pode modificar imagens sem seguir um script r\u00edgido, proporcionando uma flexibilidade criativa que \u00e9 altamente valorizada em aplica\u00e7\u00f5es pr\u00e1ticas.<\/p>\n<p>Testes internos realizados pela ByteDance demonstraram que o Bagel supera o modelo Gemini-2-exp no GEdit-Bench, uma refer\u00eancia espec\u00edfica para avalia\u00e7\u00e3o de edi\u00e7\u00e3o de imagens.<\/p>\n<p>Isso reflete n\u00e3o apenas a capacidade t\u00e9cnica do Bagel, mas tamb\u00e9m sua habilidade em compreender e manipular imagens de forma inovadora.<\/p>\n<p>Essas melhorias s\u00e3o poss\u00edveis gra\u00e7as ao treinamento em dados multimodais em larga escala, permitindo que o Bagel entenda melhor a rela\u00e7\u00e3o entre texto e imagem.<\/p>\n<p>Como resultado, o modelo pode gerar edi\u00e7\u00f5es que n\u00e3o apenas atendem aos requisitos t\u00e9cnicos, mas tamb\u00e9m \u00e0s expectativas criativas dos usu\u00e1rios.<\/p>\n\n\n<p><\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Modelo AI multimodal da ByteDance est\u00e1 redefinindo a edi\u00e7\u00e3o de imagens com capacidades avan\u00e7adas.<\/p>\n","protected":false},"author":6,"featured_media":21904,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[],"class_list":["post-21905","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia-e-inovacoes"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/21905","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/comments?post=21905"}],"version-history":[{"count":1,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/21905\/revisions"}],"predecessor-version":[{"id":21922,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/21905\/revisions\/21922"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media\/21904"}],"wp:attachment":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media?parent=21905"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/categories?post=21905"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/tags?post=21905"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}