This media is not supported in your browser
VIEW IN TELEGRAM
Бесплатная тулза, которая помогает понять, какой GPU нужен под конкретную задачу до того как потрачен бюджет
Выбираете параметры инференса: архитектуру модели, тип квантования, sequence length и batch size, указываете спеки железа и получаете стату, распределение памяти, примерные метрики производительности и энергопотребления. Есть даже эмуляция скорости инференса с TTFT.
Параметры расчета дообучения учитывают: конфиг датасета (количество сэмплов, среднее токенов на сэмпл, эпохи) и использование оптимизаторов. Плюс, еще посчитает время обучения.
Цифры часто получаются чуть выше реального потребления (что даже хорошо), но точности до гигабайта ждать не стоит.
Для грубой прикидки перед закупкой или деплоем - отличная вещь.
@ai_machinelearning_big_data
#AI #ML #LLM #VRAMCalculator
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111❤26🤨17🔥12🤔8👏2😁1