Stability AI e Arm Lançam Modelo de Áudio Generativo para Smartphones
A Stability AI, em parceria com a Arm, lançou o Stable Audio Open Small, um modelo de áudio gerativo com 341 milhões de parâmetros, otimizado para smartphones. Ele permite a geração rápida de áudio estéreo em dispositivos móveis, sem a necessidade de hardware potente.
A parceria entre Stability AI e Arm trouxe o áudio gerativo para smartphones, permitindo a criação diretamente no dispositivo. Com o lançamento do Stable Audio Open Small, um modelo de texto para áudio otimizado para rodar em CPUs Arm, é possível gerar amostras de áudio curtas rapidamente. Essa inovação facilita a produção de áudio em tempo real em dispositivos móveis.
Avanços Técnicos e Benefícios
O Stable Audio Open Small representa um marco significativo no campo do áudio gerativo em dispositivos móveis.
Este modelo, desenvolvido em colaboração com a Arm, é otimizado para rodar em CPUs Arm, que equipam 99% dos smartphones globalmente.
Com 341 milhões de parâmetros, ele é menor e mais rápido que seu antecessor, o Stable Audio Open, que possui 1,1 bilhão de parâmetros.
Entre as melhorias técnicas, destaca-se a capacidade do modelo de gerar áudio estéreo em menos de 8 segundos, tornando-o ideal para aplicações que exigem rapidez e eficiência.
Além disso, o modelo é projetado para ser eficiente, aproveitando as bibliotecas KleidiAI da Arm para operar de forma mais eficaz na borda, reduzindo custos de tempo de computação e proporcionando resultados mais rápidos aos usuários.
Essas características tornam o Stable Audio Open Small uma solução acessível, sem a necessidade de hardware pesado, permitindo que desenvolvedores e criadores de conteúdo explorem novas possibilidades criativas diretamente em seus dispositivos móveis.
A capacidade de gerar amostras de áudio curtas, como loops de bateria, efeitos sonoros e texturas ambientais, amplia o leque de aplicações possíveis, desde a produção musical até o design de som para jogos e aplicativos.
Como Utilizar o Stable Audio Open Small
O Stable Audio Open Small foi projetado para ser utilizado de forma prática e eficiente em diversos cenários. Para começar, o modelo está disponível gratuitamente para uso comercial e não comercial sob a licença comunitária da Stability AI.
Isso significa que qualquer desenvolvedor ou entusiasta pode acessar e implementar o modelo em seus projetos sem custos adicionais.
Para facilitar o uso, a Stability AI disponibilizou o caminho de aprendizado da Arm, que oferece um guia prático sobre como implantar o Stable Audio Open Small em hardware da Arm.
Este recurso é valioso para aqueles que desejam integrar o áudio gerativo em seus aplicativos móveis ou dispositivos de borda, aproveitando ao máximo as capacidades do modelo.
Os desenvolvedores podem baixar os pesos do modelo no Hugging Face e acessar o código no GitHub, permitindo personalizações e ajustes conforme necessário.
Além disso, a documentação técnica e o blog da comunidade Arm oferecem uma visão detalhada sobre como o modelo foi otimizado para desempenho em dispositivos móveis, garantindo que os usuários possam explorar todo o potencial do Stable Audio Open Small em suas criações.



