Python/ django

🐋 DeepSeek выпустили DeepSeek-OCR 2 - новое поколение OCR с SOTA качеством

DeepSeek представили DeepSeek-OCR 2 - 3B модель для продвинутого понимания изображений, документов и OCR, которая выходит на уровень SOTA.

Ключевая новинка - DeepEncoder V2.

В отличие от классических vision LLM, которые «читают» картинку как сетку (слева-направо, сверху-вниз), DeepEncoder V2 работает ближе к тому, как читает человек:

- Сначала формируется глобальное понимание изображения
- Затем модель определяет логический порядок чтения — что важно первым, что дальше

Что это даёт на практике

📄 Лучше работает со сложными макетами документов
📊 Корректно читает таблицы
🧾 Связывает подписи и значения
📰 Понимает колонки и структурированный текст
🔀 Надёжнее обрабатывает смесь текста и визуальной структуры

По качеству

- Обходит Gemini 3 Pro на ряде бенчмарков
- Даёт >4% прироста по сравнению с прошлой версией DeepSeek-OCR

И это при размере модели всего 3B параметров.

Можно запускать и дообучать

Теперь DeepSeek-OCR 2 можно удобно запускать и fine-tune через Unsloth по готовому гайду.

🔗 Guide: https://unsloth.ai/docs/models/deepseek-ocr-2
🔗 Model: https://huggingface.co/deepseek-ai/DeepSeek-OCR-2

@ai_machinelearning_big_data

#DeepSeek #ocr #opensource

❤16👍6🔥5

5.06K views07:39

Python/ django

🚀 DeepSeek-V4 ломает рынок: 1M контекста стал нормой

DeepSeek выкатили V4 и сделали то, к чему все шли последние два года. Длинный контекст больше не фича для демо. Теперь это базовый уровень.

V4-Pro выглядит как заявка на прямую конкуренцию с закрытыми моделями. 49B активных параметров дают уровень reasoning, который раньше был доступен только в дорогих API. Агентные задачи закрываются на уровне SOTA среди open-source.

V4-Flash почти не отстает по качеству, зато быстрее и заметно дешевле. Это уже не про исследования. Это про продакшен, где важна цена за каждый запрос.

Новый attention с компрессией токенов и sparse-подходом делает 1M контекста не просто возможным, а экономически адекватным. Раньше длинный контекст стоил как эксперимент. Теперь это рабочий инструмент.

DeepSeek явно ставит ставку на агентов. Интеграция с Claude Code, OpenClaw и другими системами показывает, куда они целятся. Не чат. Автоматизация процессов, цепочки действий, реальные workflow.

И еще один важный момент. Теперь есть выбор между thinking и non-thinking режимами. Можно управлять тем, тратить ли ресурсы на глубокое рассуждение или получать быстрый ответ.

В итоге меняется базовая логика рынка. Если раньше ты выбирал между качеством и ценой, то теперь появляется третья точка. Длинный контекст плюс агентность при адекватной стоимости.
Это новый baseline, под который придется перестраиваться всем.

📄 Tech Report: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
🤗 Open Weights: https://huggingface.co/collections/deepseek-ai/deepseek-v4

@pythonl

#DeepSeek

❤15🔥3👍1

3.66K views04:45

About

Blog

Apps

Platform