Cohere lança Command A Vision para análise visual empresarial

Carlos Aono 5 de agosto de 2025

0 108 2 minutos lidos

Modelo Visual da Cohere Supera VLMs com Apenas 2 GPUs

A Cohere lançou o Command A Vision, um modelo visual otimizado para empresas que utiliza apenas duas GPUs, superando concorrentes em benchmarks visuais. Essa solução acessível e sustentável reduz custos e aumenta a eficiência na análise de dados visuais em ambientes corporativos.

A Cohere lançou um novo modelo visual que está chamando a atenção no mundo da inteligência artificial empresarial. Com a capacidade de operar com apenas duas GPUs, o modelo visual da Cohere supera outros modelos de linguagem visual (VLMs) em tarefas complexas. Essa inovação representa um avanço significativo para empresas que buscam eficiência e precisão em análise de dados visuais.

Modelo visual otimizado para empresas

A Cohere introduziu o Command A Vision, um modelo visual inovador projetado especificamente para atender às necessidades das empresas.

Este modelo é baseado na arquitetura do Command A e foi otimizado para casos de uso empresariais, incluindo reconhecimento óptico de caracteres (OCR) e análise de imagens.

Com 112 bilhões de parâmetros, ele promete extrair insights valiosos de dados visuais, permitindo decisões precisas e orientadas por dados.

O Command A Vision é particularmente eficaz em interpretar manuais de produtos com diagramas complexos e analisar fotografias de cenários reais para detecção de riscos.

Isso o torna uma ferramenta poderosa para empresas que lidam com grandes volumes de documentos gráficos e imagens, como gráficos, diagramas e PDFs escaneados.

Além disso, o modelo retém as capacidades textuais do Command A, permitindo a leitura de palavras em imagens e suportando pelo menos 23 idiomas.

Isso não apenas amplia seu alcance, mas também aumenta sua aplicabilidade em um ambiente corporativo globalizado.

Ao reduzir o custo total de propriedade e otimizar o uso de GPUs, o Command A Vision torna-se uma escolha econômica e eficiente para empresas que buscam avançar em suas capacidades de análise visual.

Desempenho superior em benchmarks visuais

O Command A Vision da Cohere demonstrou desempenho excepcional em vários benchmarks visuais, superando modelos renomados como o GPT 4.1 da OpenAI e o Llama 4 Maverick da Meta.

Em testes rigorosos, como ChartQA, OCRBench, AI2D e TextVQA, o Command A Vision obteve uma pontuação média de 83,1%, destacando-se com uma margem significativa sobre seus concorrentes.

Esses resultados são particularmente impressionantes considerando que o modelo utiliza apenas duas GPUs para operar, enquanto muitos de seus rivais exigem infraestruturas mais robustas e dispendiosas.

Essa eficiência não só reduz os custos operacionais para as empresas, mas também acelera a implementação de soluções de IA em ambientes corporativos.

A capacidade do Command A Vision de lidar com tarefas multimodais complexas, como a interpretação de gráficos e a análise de textos em imagens, reforça seu status como uma ferramenta de ponta para empresas que buscam otimizar seus processos de análise visual.

Ao oferecer um desempenho superior em benchmarks, o modelo da Cohere estabelece um novo padrão para o que é possível em termos de precisão e eficiência na análise de dados visuais.