A Cohere lançou o Command A Vision, um modelo visual otimizado para empresas que utiliza apenas duas GPUs, superando concorrentes em benchmarks visuais. Essa solução acessível e sustentável reduz custos e aumenta a eficiência na análise de dados visuais em ambientes corporativos.
A Cohere lançou um novo modelo visual que está chamando a atenção no mundo da inteligência artificial empresarial. Com a capacidade de operar com apenas duas GPUs, o modelo visual da Cohere supera outros modelos de linguagem visual (VLMs) em tarefas complexas. Essa inovação representa um avanço significativo para empresas que buscam eficiência e precisão em análise de dados visuais.
Modelo visual otimizado para empresas
A Cohere introduziu o Command A Vision, um modelo visual inovador projetado especificamente para atender às necessidades das empresas.
Este modelo é baseado na arquitetura do Command A e foi otimizado para casos de uso empresariais, incluindo reconhecimento óptico de caracteres (OCR) e análise de imagens.
Com 112 bilhões de parâmetros, ele promete extrair insights valiosos de dados visuais, permitindo decisões precisas e orientadas por dados.
O Command A Vision é particularmente eficaz em interpretar manuais de produtos com diagramas complexos e analisar fotografias de cenários reais para detecção de riscos.
Isso o torna uma ferramenta poderosa para empresas que lidam com grandes volumes de documentos gráficos e imagens, como gráficos, diagramas e PDFs escaneados.
Além disso, o modelo retém as capacidades textuais do Command A, permitindo a leitura de palavras em imagens e suportando pelo menos 23 idiomas.
Isso não apenas amplia seu alcance, mas também aumenta sua aplicabilidade em um ambiente corporativo globalizado.
Ao reduzir o custo total de propriedade e otimizar o uso de GPUs, o Command A Vision torna-se uma escolha econômica e eficiente para empresas que buscam avançar em suas capacidades de análise visual.
Desempenho superior em benchmarks visuais
O Command A Vision da Cohere demonstrou desempenho excepcional em vários benchmarks visuais, superando modelos renomados como o GPT 4.1 da OpenAI e o Llama 4 Maverick da Meta.
Em testes rigorosos, como ChartQA, OCRBench, AI2D e TextVQA, o Command A Vision obteve uma pontuação média de 83,1%, destacando-se com uma margem significativa sobre seus concorrentes.
Esses resultados são particularmente impressionantes considerando que o modelo utiliza apenas duas GPUs para operar, enquanto muitos de seus rivais exigem infraestruturas mais robustas e dispendiosas.
Essa eficiência não só reduz os custos operacionais para as empresas, mas também acelera a implementação de soluções de IA em ambientes corporativos.
A capacidade do Command A Vision de lidar com tarefas multimodais complexas, como a interpretação de gráficos e a análise de textos em imagens, reforça seu status como uma ferramenta de ponta para empresas que buscam otimizar seus processos de análise visual.
Ao oferecer um desempenho superior em benchmarks, o modelo da Cohere estabelece um novo padrão para o que é possível em termos de precisão e eficiência na análise de dados visuais.
