Андрюша Карпатый снова навалил базы: nanochat miniseries v1 Андрей Карпатый не перестаёт радовать нас годным контентом. Он выкатил жирный апдейт в своём репозитории nanochat - проекте, который учит создавать свой ChatLGBT с полного нуля.
Если раньше мы просто учились запускать пайплайн, чтобы оно работало, то теперь Андрюха погружает нас именно в сам процесс обучения. Главный вопрос апдейта: как тратить вычислительные ресурсы (бабосиксаны) максимально эффективно?
Разбираем, что там внутри:
Для многих новичков подбор параметров модели звучит как что-то непонятное, но Карпатый показывает, что это - строгая и понятная математика. Суть проста: хватит гадать на кофейной гуще, какую архитектуру выбрать и сколько данных скормить. Бро использует законы масштабирования.
Эксперимент: Карпатый запустил серию обучений (miniseries) с фиксированным бюджетом (~$100 на H100) и потратил его по-разному:
Результат: Все модели стоили одинаково, но одна конкретная конфигурация дала лучшее качество
Вы не играете в казик, когда запускаете обучение. Вы можете провести дешёвые эксперименты за сотку баксов, найти идеальную формулу, а затем просто увеличить масштаб (вложить $100k или $1M) и гарантированно получить ожидаемый прирост качества. Инженеры OpenAI/Anthropic не тыкают пальцем в небо, они так считает деньги и масштабы
В первой версии nanochat фишкой был «полный цикл» до веб-интерфейса. В miniseries v1 акцент сместился на Pretraining. Запомните: именно здесь закладывается фундамент интеллекта. Если вы обосрались на претрейне, то никакой файн-тюн (SFT/RLHF) это уже не исправит
Что с этим делать? Если хотите реально понимать, как работают LLM , а не просто импортировать либы:
• Залетайте в обсуждение: github.com/karpathy/nanochat/discussions/420
• Смотрите на графики Loss vs Compute
• Ковыряйте код скрипта miniseries.sh - это эталон того, как нужно организовывать эксперименты
Итог
Масштабирование - это сплошная инженерка. Андрюха дал вам песочницу, чтобы освоить её за копейки, прежде чем лезть в серьёзные бюджеты. Поэтому тыкаем это обсуждение с ЛЛМ-кой, чтобы понять его
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤8❤🔥3🍌2
Data Science умирает? Вся правда о рынке 2026 годаГоворят, что ЧатЛГБТ заменит программистов, а джунам больше нет места в IT. Многие думают: «Не поздно ли я собрался?». Спойлер: Халява действительно закончилась. Эпоха «легкого входа» через курсы прошла, и рынок перестал принимать типов после яндекс практикума. Но для профессионалов сейчас открывается самое денежное время
В этом видео я продам вам идею, почему 2026 год - исторически лучший момент для старта в Data Science, если вы готовы играть по-взрослому
В выпуске:
- Причина №1: Почему бизнес - от заводов до пиццерий - готов платить любые деньги за Прикладной ИИ?
- Причина №2: Как высокий порог входа отсеял конкурентов и почему это вам на руку.
- Причина №3: Зарплатный лифт: как быстро проскочить путь от стажёра/джунишки до сеньора.
- Причина №4: Эпоха LLM: как учиться в 10 раз быстрее и не попасть в ловушку «вечного студента».
- Причина №5: Как ваш прошлый опыт (юриста, врача, менеджера) делает вас «Единорогом» с зарплатой х3 к рынку при правильном подходе
СсылОЧКА на видосик:
https://youtu.be/dDJaX9MnO4w
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Data Science умирает? Вся правда о рынке 2026 года
🎁 ЗАБИРАЙ ГАЙД ПО РЕЗЮМЕ БЕСПЛАТНО В моем Telegram-канале лежит инструкция, как составить резюме, чтобы тебя хантили даже на CEO-позиции. 👉 https://xn--r1a.website/eboutdatascience/263
Говорят, что ЧатЛГБТ заменит программистов, а джунам больше нет места в IT. Многие…
Говорят, что ЧатЛГБТ заменит программистов, а джунам больше нет места в IT. Многие…
❤9🔥6🤣5😍2🍌1
Из Фронтендера в NLP-Гигачада за месяц: Как мы залутали два оффера по 300к Многие дрочат курсы годами, смотрят видосы на ютубе и думают, что оффер свалится с неба. Но на деле получают болт и отказы из-за нерелевантного опыта. Лично мне - это знакомая история
Сегодня расскажу про кейс моего слона Тимура (два оффера на 300к). Он больше года пытался вкатиться в ML из Фронтенда. Ботал теорию всю подряд, смотрел записи чужих собесов, но рынок его тупо игнорил. Резюме было мёртвым: 1-2 приглашения в месяц и постоянные отказы на скринингах из-за фильтров по опыту. Парень просто упёрся в стену и топтался на месте
И тут самое лучшее ментосртво начало уничтожать
Мы созвонились на бесплатной консультации, разобрали его ситуацию, выбрали вектор развития (он выбрал разъебать в NLP), по итогу он залетел на пакет до оффера.
Что мы сделали:
Итог:
Вот так работает системный подход: пока одни плаки-плаки, что рынок перегрет и джуны никому не нужны, мои слоны забирают самые жирные офферы. Тимур - огромный красавчик, горжусь!
Больше отзывов тут. А вам предлагаю тебе залететь на бесплатную консультацию с моей командой, на которой поможем тебе построить твой маршрут до оффера. Пиши на @savelkoteam
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥13❤10🔥5🍌2🥰1😁1🤔1
Cursor vs Claude Code: Кто кого уничтожит?Сейчас активно погружаюсь в хайп-кодинг, поэтому стало интересно чем отличается claude code от cursor`а? С cursor я дружу, но никогда не щупал claude code, но многие о нём очень часто говорили и именно его чаще всего юзают. Поэтому давайте разбираться, в чем принципиальная разница между ними?
Глобальная философия: Accelerator vs Delegator
С технической точки зрения Cursor работает как акселератор - он ускоряет микро-действия разработчика. Claude Code работает как делегатор - он забирает на себя целый пласт работы, выполняя её последовательно и автономно. Один требует вашего постоянного внимания и кликов, второй - чёткого ТЗ и бюджета на токены.
Где подвох?
Cursor работает по подписке: ты платишь фикс (20$ в месяц + платишь за дополнительные токены) и понимаешь, сколько у тебя запросов. Claude Code - это пылесос для денег, он работает через подписку Claude Pro ($20/месяц) или
Итог для слоняр:
Не надо выбирать, надо комбинировать. Гигачады используют гибридный подход: Claude Code загоняют в терминал для глобальных архитектурных изменений и черновых работ, а в Cursor полируют результат и пишут фичи в реальном времени. Cursor - чтобы летать, Claude - чтобы копать и сиять
Вот такой ресёрч я провёл, такие выводы сделал, а вы уже щупали Claude Code или сидите на Cursor? 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19🔥11❤🔥5🍌2🥰1🙈1