DeepSeek-OCR propõe nova era para modelos de IA

Carlos Aono 21 de outubro de 2025

0 103 1 minuto de leitura

Descubra como a DeepSeek AI está Transformando o Mercado de IA

O DeepSeek-OCR inaugura uma nova etapa no desenvolvimento de inteligências artificiais mais eficientes. Com compressão visual em 2D, o sistema consegue interpretar documentos extensos mantendo altos níveis de precisão.

A DeepSeek AI apresentou o DeepSeek-OCR, um sistema que propõe uma maneira mais eficiente de processar textos longos em modelos de linguagem. A tecnologia utiliza reconhecimento visual em duas dimensões para transformar documentos em representações compactas, reduzindo a quantidade de dados processados sem comprometer a precisão.

Avanço em eficiência e novas aplicações do DeepSeek-OCR

O DeepSeek-OCR foi desenvolvido com foco na redução do consumo de recursos e no aumento da velocidade de leitura e interpretação de textos.

A arquitetura é composta pelo DeepEncoder, que realiza a compressão visual, e pelo DeepSeek3B-MoE-A570M, responsável por decodificar as informações compactadas.

O resultado é uma eficiência inédita: o modelo mantém mais de 96% de precisão em compressões de dez vezes e cerca de 60% quando o volume de dados é reduzido em até vinte vezes.

Essa eficiência permite que o sistema processe centenas de milhares de páginas diariamente em apenas uma GPU e chegue a dezenas de milhões quando distribuído em rede.

Esse desempenho cria novas possibilidades para a digitalização de acervos, a análise automatizada de documentos e a geração de dados de treinamento para modelos de linguagem de última geração.

O DeepEncoder foi projetado para operar em múltiplas resoluções e otimizar o uso de memória, o que permite lidar com textos, gráficos e fórmulas em diferentes formatos e idiomas.

O decodificador, baseado em uma estrutura de mistura de especialistas, distribui o processamento entre módulos especializados, garantindo alta precisão e menor custo computacional.

Com o lançamento em código aberto, a DeepSeek AI pretende incentivar a colaboração acadêmica e acelerar a adoção da tecnologia por pesquisadores e empresas.

O DeepSeek-OCR reforça a ideia de que a visão pode ser uma ferramenta fundamental para lidar com contextos complexos, transformando imagens em um meio eficiente de compressão textual e abrindo um novo caminho para o desenvolvimento de modelos de linguagem mais rápidos, acessíveis e sustentáveis.