Forwarded from Take Friends to Luna Park
Лунапарк проводит конкурс — напишите вакансию в нашем стиле и получите $1000! 💵
Участвуйте сами и расскажите своим техническим друзьям и подругам, которые офигенно пишут! Нет, правда, перешлите друзьям с похожими на нас вайбами этот пост (или его короткую версию), пусть прикупят себе гпу.
Правила очень простые:
⏺️ по ссылке — всё, что вам нужно знать про вакансию, о которой необходимо написать пост
⏺️ пост должен быть: в стиле нашего канала @hrlunapark; интересным для клёвых инженеров; экспертным и технически корректным; привлекающим подходящих под вакансию людей; по возможности отсеивающим неподходящих людей
⏺️ один участник может отправить один текст
⏺️ автор лучшего по нашему мнению текста получит $1000
⏺️ второе и третье место получат $300 и $100 соответственно
⏺️ лучших авторов мы можем позвать писать к нам тексты на парт-тайм! ⭐️
У нас можно быть прогером и прикольно писать для самой сильной русскоязычной айти аудитории про лучшие в мире стартапы. Мы рассказывали об Anthropic, Perplexity и Neon задолго до того, как о них узнали все. Хотим найти человека, которому будет в кайф парт-таймово тусить с нами и вместе делать уникальный жанр — вакансии, интересные умным людям, даже не ищущим работу🥂
Для конкурса мы советуем хорошенько вдохновиться нашими постами в канале @hrlunapark — например, бывает так, так и даже так :)
Ждём ваши тексты в формочке до воскресенья, 13 июля, 23:59 по GMT.
Участвуйте сами и расскажите своим техническим друзьям и подругам, которые офигенно пишут! Нет, правда, перешлите друзьям с похожими на нас вайбами этот пост (или его короткую версию), пусть прикупят себе гпу.
Правила очень простые:
У нас можно быть прогером и прикольно писать для самой сильной русскоязычной айти аудитории про лучшие в мире стартапы. Мы рассказывали об Anthropic, Perplexity и Neon задолго до того, как о них узнали все. Хотим найти человека, которому будет в кайф парт-таймово тусить с нами и вместе делать уникальный жанр — вакансии, интересные умным людям, даже не ищущим работу
Для конкурса мы советуем хорошенько вдохновиться нашими постами в канале @hrlunapark — например, бывает так, так и даже так :)
Ждём ваши тексты в формочке до воскресенья, 13 июля, 23:59 по GMT.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9 3👎2🔥1
Forwarded from Kali Novskaya
🌸Спидраним NanoGPT агентами: новый бенчмарк🌸
#nlp #про_nlp #nlp_papers
На днях мы с коллегами опубликовали новую статью и бенчмарк для агентов, сделанный на основе NanoGPT speedrun от Карпаты:
The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements
NanoGPT speedrun — это открытый репозиторий, где сообщество соревнуется в оптимизации обучения мини-GPT2 модели. Бейзлайн — llm.c от Карпаты, написанный в рамках туториала на чистой C/CUDA.
У спидрана Карпаты есть публичный лидерборд с историей рекордов, кратким описанием изменений и кодом (сейчас их 21).
Все это делает его идеальным исходником для оценки агентов: смогут ли они воспроизвести и улучшить результаты?
🌸Дизайн бенчмарка:
В бенчмарке две основные группы задач:
🟣 воспроизводимость — агенту нужно воспроизвести рекорд R+1, когда рекорд R дается в качестве бейзлайна для итерирования, со всей информацией об основных нововведениях.
🟣 оптимизация — агенту нужно улучшить бейзлайн R, но безо всяких подсказок. Основная метрика — нормализованное улучшение рантайма обучения в среднем по всем попыткам.
Scaffold агента ученого реализует цикл экспериментирования, состоящий из нескольких этапов:
Можно использовать агентов с любыми скаффолдами, но в рамках работы мы продемонстрировали результаты на нескольких SOTA-бейзлайнах, включая AIDE и multi-AIDE. У каждого скаффолда есть циклы решений, состояние из
1) Идеации: генерации новых идей для проверки гипотез (в нашем случае идеи предоставляются непосредственно из задачи).
2) Реализация эксперимента: кодирование экспериментов, которые проверяют идеи, полученные на этапе формирования идей.
3) Выполнение эксперимента: запуск кода
4) Анализ результатов: извлечение идей из результатов
🌸Основные итоги:
Мы провели большое количество аблейшенов с разными моделями, чтобы сравнить, как scaffold и разные типы подсказок могут повлиять на качество агента.
Лучше всего показывают себя скаффолд Multi-AIDE, полный набор подсказок из псевдокода и текстового саммари. В редких случаях, агент достигает 100% или даже 120% от существующего решения, но в большинстве случаев результат сильно ниже.
Все модели, включая топовые, со state-of-the-art scaffold, все равно испытывают трудности при воспроизведении результатов.
И даже больше, пока что существенная разница сохраняется, когда агентам дается максимально полная информация о том, что надо сделать, и псевдокод. Хорошее качество воспроизводимости — из статей, репозиториев, инструкций — должно быть пререквизитом на пути к надежной и воспроизводимой автоматизации науки агентами.
🟣 Статья https://arxiv.org/abs/2506.22419
🟣 Бенчмарк https://github.com/facebookresearch/llm-speedrunner
#nlp #про_nlp #nlp_papers
На днях мы с коллегами опубликовали новую статью и бенчмарк для агентов, сделанный на основе NanoGPT speedrun от Карпаты:
The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements
NanoGPT speedrun — это открытый репозиторий, где сообщество соревнуется в оптимизации обучения мини-GPT2 модели. Бейзлайн — llm.c от Карпаты, написанный в рамках туториала на чистой C/CUDA.
У спидрана Карпаты есть публичный лидерборд с историей рекордов, кратким описанием изменений и кодом (сейчас их 21).
Все это делает его идеальным исходником для оценки агентов: смогут ли они воспроизвести и улучшить результаты?
🌸Дизайн бенчмарка:
В бенчмарке две основные группы задач:
Scaffold агента ученого реализует цикл экспериментирования, состоящий из нескольких этапов:
Можно использовать агентов с любыми скаффолдами, но в рамках работы мы продемонстрировали результаты на нескольких SOTA-бейзлайнах, включая AIDE и multi-AIDE. У каждого скаффолда есть циклы решений, состояние из
1) Идеации: генерации новых идей для проверки гипотез (в нашем случае идеи предоставляются непосредственно из задачи).
2) Реализация эксперимента: кодирование экспериментов, которые проверяют идеи, полученные на этапе формирования идей.
3) Выполнение эксперимента: запуск кода
4) Анализ результатов: извлечение идей из результатов
🌸Основные итоги:
Мы провели большое количество аблейшенов с разными моделями, чтобы сравнить, как scaffold и разные типы подсказок могут повлиять на качество агента.
Лучше всего показывают себя скаффолд Multi-AIDE, полный набор подсказок из псевдокода и текстового саммари. В редких случаях, агент достигает 100% или даже 120% от существующего решения, но в большинстве случаев результат сильно ниже.
Все модели, включая топовые, со state-of-the-art scaffold, все равно испытывают трудности при воспроизведении результатов.
И даже больше, пока что существенная разница сохраняется, когда агентам дается максимально полная информация о том, что надо сделать, и псевдокод. Хорошее качество воспроизводимости — из статей, репозиториев, инструкций — должно быть пререквизитом на пути к надежной и воспроизводимой автоматизации науки агентами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥4❤3
Forwarded from N айтишниц заходят в бар
🎙Мы обещали больше прямых эфиров, и они будут!
Сегодня у нас в гостях Борис Цейтлин. Так как перечисление всех достижений Бориса потянет на целую простыню текста, обобщим: человек, побывавший по все стороны машинного обучения - рисерч, продакшен и преподавание.
А еще почти каждый знаком с его гайдом по найму.
🗓 Подключайтесь к прямому эфиру 04.07.25 в 20.00 по Москве и задавайте вопросы!
Сегодня у нас в гостях Борис Цейтлин. Так как перечисление всех достижений Бориса потянет на целую простыню текста, обобщим: человек, побывавший по все стороны машинного обучения - рисерч, продакшен и преподавание.
А еще почти каждый знаком с его гайдом по найму.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤4 2
Сегодня я буду в гостях у целых N айтишниц, присоединяйтесь :)
Будем обсуждать карьерные кулстори в ML/DS
Важно: эфир будет всего 30 минут, а не как обычно!
Будем обсуждать карьерные кулстори в ML/DS
Важно: эфир будет всего 30 минут, а не как обычно!
Forwarded from N айтишниц заходят в бар
🎙Как обещали – запись прямого эфира с Борисом Цейтлиным в рубрике #Типичный_айтишник.
Для всех кто не смог подключиться – не расстраивайтесь, выйдет и пост в традиционном тесктовом формате!
Для всех кто не смог подключиться – не расстраивайтесь, выйдет и пост в традиционном тесктовом формате!
🔥17
Сотрудники META Superintelligence Team такие типа:
x < $171 million - лютейшая нищета на грани выживания.
$171 million < x < $456 million - обычная нищета, ипотека на 20 лет, кино и рестораны раз в неделю, еда из Wallmart.
$456 million < x < $799 million - нормальная жизнь, ипотека на 10 лет, Тесла средней комплектации.
$799 million < x < $1.14 billion - хорошая жизнь, ипотека на 5 лет, путешествия, aderall.
x > $1.14 billion - достаточно хорошая жизнь, ипотека на 2 года, машина бизнес класса, девушка, кокаин.
На июль 2025, на руки в год, только кеш. Не забывайте. А лучше распечатайте и повесьте на стену у рабочего места.
Будет постоянная мотивация. Только так можно выбраться из нищеты.
x < $171 million - лютейшая нищета на грани выживания.
$171 million < x < $456 million - обычная нищета, ипотека на 20 лет, кино и рестораны раз в неделю, еда из Wallmart.
$456 million < x < $799 million - нормальная жизнь, ипотека на 10 лет, Тесла средней комплектации.
$799 million < x < $1.14 billion - хорошая жизнь, ипотека на 5 лет, путешествия, aderall.
x > $1.14 billion - достаточно хорошая жизнь, ипотека на 2 года, машина бизнес класса, девушка, кокаин.
На июль 2025, на руки в год, только кеш. Не забывайте. А лучше распечатайте и повесьте на стену у рабочего места.
Будет постоянная мотивация. Только так можно выбраться из нищеты.
Forwarded from Bluedrop Space 💧
Как поработать со мной этим летом? 🌞
Меня зовут Дана. Я преподаю английский 5+ лет, нежно люблю этот язык и знаю его на уровне С2 (подтверждено кембриджским CPE/C2 Proficiency).
У меня есть профильное образование (иняз Мориса Тореза) и CELTA —
международный сертификат, с которым ты можешь преподавать в любой стране мира. 🌏
Также у меня есть корпоративный опыт (Kaspersky, Студия Лебедева), который я использую в работе.
Занятия проходят на платформе ProgressMe. Уроки адаптируются под запрос студента и состоят из хорошей грамматической базы и аутентичных видео/статей/подкастов.
В карточках — возможные форматы.❤️ А на канале — полезные и интересные посты и анонсы разговорных клубов.
Записаться: @jordanks
Меня зовут Дана. Я преподаю английский 5+ лет, нежно люблю этот язык и знаю его на уровне С2 (подтверждено кембриджским CPE/C2 Proficiency).
У меня есть профильное образование (иняз Мориса Тореза) и CELTA —
международный сертификат, с которым ты можешь преподавать в любой стране мира. 🌏
Также у меня есть корпоративный опыт (Kaspersky, Студия Лебедева), который я использую в работе.
Занятия проходят на платформе ProgressMe. Уроки адаптируются под запрос студента и состоят из хорошей грамматической базы и аутентичных видео/статей/подкастов.
В карточках — возможные форматы.
Записаться: @jordanks
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👎5😢3👍2🔥2
Как ни странно английский это топ 1 проблема тех, кто обращается ко мне за консультациями по поиску работы за рубежом. В отличие от навыка проходить собеседования это дело быстро не нагоняется. Мы с Даной недавно развиртуализировались на прикольной встрече и теперь я вам по-дружески (бесплатно 😱 ) рекомендую её как преподавателя английского
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12🔥7👎1
# Как распознать AI-generated текст в 2025
Сгенерированный нейросетями текст может быть очень похожим на человеческий, но есть способы быстро его определить.
Признаки AI текста:
1. Использование длинного тире (–).
2. Частое использование ненумерованных списков.
3. Нет грамматических ошибок и ошибок в пунктуации.
4. Используются деепричастные обороты и другие сложные конструкции.
5. Богатый словарный запас, мелодичный язык.
6. Нет лишних слов и повторов.
7. Связанное и последовательное повествование.
8. Текст приятно читать.
9. Здравые предложения и идеи.
Сохрани, чтобы не потерять!
#щитпостинг
Сгенерированный нейросетями текст может быть очень похожим на человеческий, но есть способы быстро его определить.
Признаки AI текста:
1. Использование длинного тире (–).
2. Частое использование ненумерованных списков.
3. Нет грамматических ошибок и ошибок в пунктуации.
4. Используются деепричастные обороты и другие сложные конструкции.
5. Богатый словарный запас, мелодичный язык.
6. Нет лишних слов и повторов.
7. Связанное и последовательное повествование.
8. Текст приятно читать.
9. Здравые предложения и идеи.
Сохрани, чтобы не потерять!
Я хотел бы, чтобы это было шуткой. Владелец бара где я выступаю, он же бармен и MC шоу, вайбкодит между сетами и приготовлением коктейлей.
Говорит типа, да ладно, там только тесты поправить, а, блин, опять сломалось, подожди.
Я хочу его способность к мультитаскингу (он еще EM, у него 20+ человек в подчинении).
Что прямо сейчас мешает тебе устроиться барменом параллельно с работой программистом? Бесплатное удвоение зп.
Говорит типа, да ладно, там только тесты поправить, а, блин, опять сломалось, подожди.
Я хочу его способность к мультитаскингу (он еще EM, у него 20+ человек в подчинении).
Что прямо сейчас мешает тебе устроиться барменом параллельно с работой программистом? Бесплатное удвоение зп.
https://www.astralcodexten.com/p/now-i-really-won-that-ai-bet
Хорошая ретроспектива развития способностей к композиции у генераторов картинок
Хорошая ретроспектива развития способностей к композиции у генераторов картинок
Astralcodexten
Now I Really Won That AI Bet
...
❤12👍2
Forwarded from ЦДО “Моноид”
Интенсив: Нейросети из первых принципов
📅 Когда: 09.08 с 15:30 до 20:30
📍 Где: Москва, ЦДО «Моноид»
🎙️ Преподаватель: Михаил Селезнёв
🧍 Ассистенты и оргкоманда: Иван Хахалин, Роман Малов
💰 Стоимость:
· 6000 р — базовая цена
· 4000 р — по абонементу на коворкинг
· Бесплатно — для участников и выпускников наших курсов
Купить билет на интенсив и найти подробную информацию можно на нашем сайте
Как насчёт посвятить день тому, чтобы своими руками разобраться, как работают ИИ — от самых базовых принципов до финального результата?
На интенсиве вы напишете простую нейросеть, которая сможет различать рукописные цифры. Да, мы говорим про MNIST-классификатор. Писать простенькие нейросети, чтобы разобраться — довольно популярный формат. Потому что это формирует стойкие интуиции о том, как эти нейросети вообще работают.
🔘 О чем речь?
⭕️ На Python
⭕️ Без TensorFlow, PyTorch и других библиотек, которые прячут под ковер все шестеренки механизма машинного обучения
⭕️ С использованием только numpy, pandas и matplotlib
⭕️ С написанием почти всех функций для обучения своими руками
⭕️ Предварительно выведя алгоритм из первых принципов
Что вас ждёт:
1️⃣ Лекция: Как устроены нейроны, параметры, градиентный спуск и backpropagation? Что это за штуки? Почему они работают именно так?
2️⃣ Практическая часть: Практическая часть: Захватите ноутбук. Специального ПО не нужно, достаточно браузера и способности подключится к WiFi
3️⃣ Финал: Q&A, подведение итогов и разговор о том, что дальше
💬 Какие знания нужны на входе?
Примерно уровень первокурсника технического\естественно-научного факультета. А именно:
• чуточку линала (что такое матрицы и как на них умножать)
• чуточку матана (что такое функция и её производная)
• синтаксис питона и базовые способности писать на нем
🔘 Минутка честного маркетинга
Давайте начистоту: вся информация, которую мы будем рассказывать - есть в открытом доступе и найти её совсем не сложно. Но сесть, отобрать понятное, обдумать, получить ответы на свои вопросы и закончить всё это готовой нейросетью - как раз то, что люди раз за разом откладывают на потом.
Собственно, мы и предлагаем способ не прокрастинировать эту задачу: формат интенсива "Сделайте меня разобравшимся со всем этим. Под ключ"
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
· 6000 р — базовая цена
· 4000 р — по абонементу на коворкинг
· Бесплатно — для участников и выпускников наших курсов
Купить билет на интенсив и найти подробную информацию можно на нашем сайте
Как насчёт посвятить день тому, чтобы своими руками разобраться, как работают ИИ — от самых базовых принципов до финального результата?
На интенсиве вы напишете простую нейросеть, которая сможет различать рукописные цифры. Да, мы говорим про MNIST-классификатор. Писать простенькие нейросети, чтобы разобраться — довольно популярный формат. Потому что это формирует стойкие интуиции о том, как эти нейросети вообще работают.
Что вас ждёт:
Примерно уровень первокурсника технического\естественно-научного факультета. А именно:
• чуточку линала (что такое матрицы и как на них умножать)
• чуточку матана (что такое функция и её производная)
• синтаксис питона и базовые способности писать на нем
Давайте начистоту: вся информация, которую мы будем рассказывать - есть в открытом доступе и найти её совсем не сложно. Но сесть, отобрать понятное, обдумать, получить ответы на свои вопросы и закончить всё это готовой нейросетью - как раз то, что люди раз за разом откладывают на потом.
Собственно, мы и предлагаем способ не прокрастинировать эту задачу: формат интенсива "Сделайте меня разобравшимся со всем этим. Под ключ"
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18👎17❤6