{"id":39371,"date":"2025-08-29T15:00:00","date_gmt":"2025-08-29T18:00:00","guid":{"rendered":"https:\/\/www.solucoesindustriais.com.br\/news\/?p=39371"},"modified":"2025-08-29T14:17:11","modified_gmt":"2025-08-29T17:17:11","slug":"api-realtime-da-openai","status":"publish","type":"post","link":"https:\/\/www.solucoesindustriais.com.br\/news\/tecnologia-e-inovacoes\/api-realtime-da-openai\/","title":{"rendered":"API Realtime da OpenAI recebe novos recursos para agentes de voz"},"content":{"rendered":"<div class=\"tts_content_wrapper_1\" ><h3>A API Realtime da OpenAI agora oferece suporte a servidores MCP remotos, chamadas SIP e entradas de imagem, melhorando a experi\u00eancia de agentes de voz com o modelo gpt-realtime, que traz qualidade de \u00e1udio aprimorada, intelig\u00eancia e personaliza\u00e7\u00e3o, al\u00e9m de novas vozes naturais.<\/h3>\n<p>A <strong>API Realtime<\/strong> <strong>da OpenAI<\/strong> est\u00e1 agora dispon\u00edvel com novos recursos que permitem a cria\u00e7\u00e3o de agentes de voz mais confi\u00e1veis e prontos para produ\u00e7\u00e3o. Com suporte a servidores MCP remotos e chamadas telef\u00f4nicas via SIP, os agentes de voz se tornam mais capazes, acessando ferramentas e contextos adicionais.<\/p>\n<h2>Novas funcionalidades da API Realtime<\/h2>\n<p>A <strong>API Realtime da OpenAI<\/strong> foi aprimorada para oferecer suporte a novas funcionalidades que ampliam suas capacidades.<\/p>\n<p>Uma das principais adi\u00e7\u00f5es \u00e9 o suporte a servidores MCP remotos, que permite que os desenvolvedores integrem ferramentas externas sem a necessidade de configura\u00e7\u00f5es manuais complexas.<\/p>\n<p>Isso facilita a expans\u00e3o das capacidades dos agentes de voz, tornando-os mais vers\u00e1teis e adapt\u00e1veis \u00e0s necessidades espec\u00edficas de cada projeto.<\/p>\n<p>Al\u00e9m disso, a API agora suporta chamadas telef\u00f4nicas atrav\u00e9s do Session Initiation Protocol (SIP), integrando-se diretamente com redes telef\u00f4nicas p\u00fablicas e sistemas PBX.<\/p>\n<p>Essa funcionalidade permite que os agentes de voz realizem e recebam chamadas, ampliando significativamente suas aplica\u00e7\u00f5es em cen\u00e1rios de suporte ao cliente e atendimento automatizado.<\/p>\n<p>Outra inova\u00e7\u00e3o importante \u00e9 a inclus\u00e3o de entradas de imagem, permitindo que os desenvolvedores enviem imagens, fotos e capturas de tela junto com \u00e1udio ou texto em uma sess\u00e3o da API Realtime.<\/p>\n<p>Isso possibilita que o modelo baseie a conversa no que o usu\u00e1rio est\u00e1 vendo, enriquecendo a intera\u00e7\u00e3o e permitindo perguntas como &#8220;o que voc\u00ea v\u00ea nesta imagem?&#8221; ou &#8220;leia o texto nesta captura de tela&#8221;.<\/p>\n<p>Por fim, a API Realtime tamb\u00e9m introduziu melhorias na qualidade do \u00e1udio, com novas vozes mais naturais e expressivas, como Marin e Cedar, e atualiza\u00e7\u00f5es nas vozes existentes.<\/p>\n<p>Essas melhorias garantem uma experi\u00eancia de usu\u00e1rio mais envolvente e fluida, essencial para aplica\u00e7\u00f5es em ambientes reais.<\/p>\n<h2>Gpt-realtime da OpenAI revoluciona agentes de voz<\/h2>\n<p>O <strong data-start=\"2\" data-end=\"18\">gpt-realtime<\/strong>, modelo de fala para fala mais avan\u00e7ado da OpenAI, foi desenvolvido em colabora\u00e7\u00e3o com clientes e projetado para aplica\u00e7\u00f5es do mundo real, como suporte ao cliente, assist\u00eancia pessoal e educa\u00e7\u00e3o.<\/p>\n<p>Com melhorias significativas em intelig\u00eancia, execu\u00e7\u00e3o de instru\u00e7\u00f5es e qualidade de \u00e1udio, o sistema \u00e9 capaz de interpretar prompts com precis\u00e3o, ler scripts de forma fiel, repetir sequ\u00eancias alfanum\u00e9ricas e at\u00e9 alternar idiomas em uma mesma frase.<\/p>\n<p>A OpenAI tamb\u00e9m aprimorou a naturalidade da fala, garantindo entona\u00e7\u00e3o, emo\u00e7\u00e3o e ritmo pr\u00f3ximos aos de um ser humano, o que amplia a fluidez das intera\u00e7\u00f5es e favorece experi\u00eancias mais envolventes.<\/p>\n<p>Al\u00e9m das vozes j\u00e1 conhecidas, foram adicionadas Marin e Cedar, dispon\u00edveis exclusivamente na API Realtime, trazendo maior expressividade e realismo \u00e0s conversas.<\/p>\n<p>Essas inova\u00e7\u00f5es tornam o gpt-realtime uma ferramenta de destaque para desenvolvedores que buscam criar agentes de voz mais eficientes e personalizados.<\/p>\n<h2>Capacidades adicionais da API<\/h2>\n<p>A <strong>API Realtime<\/strong> da OpenAI foi enriquecida com v\u00e1rias capacidades adicionais para facilitar sua integra\u00e7\u00e3o e torn\u00e1-la mais flex\u00edvel para uso em produ\u00e7\u00e3o.<\/p>\n<p>Uma das principais adi\u00e7\u00f5es \u00e9 o suporte ao <em>Session Initiation Protocol<\/em> (SIP), permitindo que os desenvolvedores conectem seus aplicativos a redes telef\u00f4nicas p\u00fablicas, sistemas PBX e outros pontos finais SIP.<\/p>\n<p>Outra capacidade importante \u00e9 a introdu\u00e7\u00e3o de prompts reutiliz\u00e1veis. Agora, desenvolvedores podem salvar e reutilizar prompts, que consistem em mensagens de desenvolvedores, ferramentas, vari\u00e1veis e exemplos de mensagens de usu\u00e1rios\/assistentes, em sess\u00f5es da API Realtime.<\/p>\n<p>Essa funcionalidade simplifica o processo de desenvolvimento, permitindo que configura\u00e7\u00f5es eficazes sejam aplicadas em m\u00faltiplas intera\u00e7\u00f5es.<\/p>\n<p>Al\u00e9m disso, a API Realtime incorpora v\u00e1rias camadas de salvaguardas e mitiga\u00e7\u00f5es para ajudar a prevenir usos indevidos. Isso inclui classificadores ativos que podem interromper conversas que violam diretrizes de conte\u00fado nocivo.<\/p>\n<p>Os desenvolvedores tamb\u00e9m t\u00eam a flexibilidade de adicionar suas pr\u00f3prias barreiras de seguran\u00e7a usando o Agents SDK.<\/p>\n<p>Essas capacidades adicionais tornam a API Realtime uma ferramenta robusta e segura para a cria\u00e7\u00e3o de agentes de voz que podem operar de maneira eficaz e \u00e9tica em uma variedade de contextos de produ\u00e7\u00e3o.<\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>API Realtime da OpenAI agora suporta servidores MCP e chamadas SIP.<\/p>\n","protected":false},"author":6,"featured_media":39369,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[],"class_list":["post-39371","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia-e-inovacoes"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39371","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/comments?post=39371"}],"version-history":[{"count":1,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39371\/revisions"}],"predecessor-version":[{"id":39515,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/posts\/39371\/revisions\/39515"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media\/39369"}],"wp:attachment":[{"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/media?parent=39371"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/categories?post=39371"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.solucoesindustriais.com.br\/news\/wp-json\/wp\/v2\/tags?post=39371"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}