Stability AI e Arm Lançam Modelo de Áudio Generativo para Smartphones

Carlos Aono 16 de maio de 2025

0 121 2 minutos lidos

Áudio Gerativo: Parceria Transforma Smartphones em Ferramentas Criativas

A Stability AI, em parceria com a Arm, lançou o Stable Audio Open Small, um modelo de áudio gerativo com 341 milhões de parâmetros, otimizado para smartphones. Ele permite a geração rápida de áudio estéreo em dispositivos móveis, sem a necessidade de hardware potente.

A parceria entre Stability AI e Arm trouxe o áudio gerativo para smartphones, permitindo a criação diretamente no dispositivo. Com o lançamento do Stable Audio Open Small, um modelo de texto para áudio otimizado para rodar em CPUs Arm, é possível gerar amostras de áudio curtas rapidamente. Essa inovação facilita a produção de áudio em tempo real em dispositivos móveis.

Avanços Técnicos e Benefícios

O Stable Audio Open Small representa um marco significativo no campo do áudio gerativo em dispositivos móveis.

Este modelo, desenvolvido em colaboração com a Arm, é otimizado para rodar em CPUs Arm, que equipam 99% dos smartphones globalmente.

Com 341 milhões de parâmetros, ele é menor e mais rápido que seu antecessor, o Stable Audio Open, que possui 1,1 bilhão de parâmetros.

Entre as melhorias técnicas, destaca-se a capacidade do modelo de gerar áudio estéreo em menos de 8 segundos, tornando-o ideal para aplicações que exigem rapidez e eficiência.

Além disso, o modelo é projetado para ser eficiente, aproveitando as bibliotecas KleidiAI da Arm para operar de forma mais eficaz na borda, reduzindo custos de tempo de computação e proporcionando resultados mais rápidos aos usuários.

Essas características tornam o Stable Audio Open Small uma solução acessível, sem a necessidade de hardware pesado, permitindo que desenvolvedores e criadores de conteúdo explorem novas possibilidades criativas diretamente em seus dispositivos móveis.

A capacidade de gerar amostras de áudio curtas, como loops de bateria, efeitos sonoros e texturas ambientais, amplia o leque de aplicações possíveis, desde a produção musical até o design de som para jogos e aplicativos.

Como Utilizar o Stable Audio Open Small

O Stable Audio Open Small foi projetado para ser utilizado de forma prática e eficiente em diversos cenários. Para começar, o modelo está disponível gratuitamente para uso comercial e não comercial sob a licença comunitária da Stability AI.

Isso significa que qualquer desenvolvedor ou entusiasta pode acessar e implementar o modelo em seus projetos sem custos adicionais.

Para facilitar o uso, a Stability AI disponibilizou o caminho de aprendizado da Arm, que oferece um guia prático sobre como implantar o Stable Audio Open Small em hardware da Arm.

Este recurso é valioso para aqueles que desejam integrar o áudio gerativo em seus aplicativos móveis ou dispositivos de borda, aproveitando ao máximo as capacidades do modelo.

Os desenvolvedores podem baixar os pesos do modelo no Hugging Face e acessar o código no GitHub, permitindo personalizações e ajustes conforme necessário.

Além disso, a documentação técnica e o blog da comunidade Arm oferecem uma visão detalhada sobre como o modelo foi otimizado para desempenho em dispositivos móveis, garantindo que os usuários possam explorar todo o potencial do Stable Audio Open Small em suas criações.