Главное:
• 32B base - сильная base-модель, которая работает на уровне Qwen 2.5 и опережает на ряде бенчмарков Google Gemma 3.
• 7B instruct и 7B reasoning - лучшие среди западных моделей
• 32B Think - полностью открытая 32B-модель для сложных рассуждений (почти на уровне Qwen 3 8B/32B)
Все данные, код, чекпоинты в открытом доступе.
Olmo 3 32B - закрыла важный пробел, так как у Qwen нет открытой 32B base-версии.
32B спокойно запускаестя на одной 80GB-GPU или даже на мощном ноутбуке.
@ai_machinelearning_big_data
#Olmo #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤33🔥17👍12🥰9🦄2😁1