Борис опять

84👍16❤1👎1🔥1

6.26K views09:02

Борис опять

Хочу такую!

83❤17👍2🔥1

5.88K viewsedited 11:06

Борис опять

Forwarded from ЦДО “Моноид”

LLM Steering 2025: Дружеский хакатон по промпт-инжинирингу

📅

Когда: 24-26 октября

📍

Где: Онлайн + Москва, ЦДО «Моноид»

💰

Стоимость: бесплатно

LLM Steering (направленное управление моделью) — это базовый навык для оценки моделей (evals) и, главное, для решения реальных задач с LLM. Мы считаем, что навыки развиваются практикой, поэтому делаем хакатон с фокусом на обучение и кооперацию.

Про что кейсы?
Хакатон предполагает несколько направлений, из которых участники смогут выбрать кейс подходящей тематики и уровня сложности. Будут охвачены:
🔘базовые методы промпт-инжиниринга,
🔘стилистическое управление генерацией контента,
🔘генерация и проверка кода,
🔘извлечение, структурирование и верификация данных,
🔘поиск уязвимостей, ограничений и нетипичных поведенческих сценариев моделей.

Образовательная программа:
Предварительно к хакатону будут проведены опциональные лекции и воркшопы по темам:
🔘методы промпт-инжиниринга,
🔘основы jailbreak-техник и AI Safety,
🔘оформление pitch-презентаций для проектов.

Что значит дружеский хакатон?
Все, кто сдаст рабочее решение по критериям, попадают в список победителей и получают призы.
Нет крупных денежных призов, только полезные ресурсы и сувениры от ЦДО «Моноид».

Зачем участвовать:
Этот опыт полезен для тех, кто хочет построить карьеру в этой области, а также для:
🔘освоения прикладных методов работы с LLM на реальных задачах,
🔘понимания ограничений и сильных сторон моделей,
🔘формирования портфолио и исследовательских идей.

Спец-номинации:
🔘«AI Safety релевантный проект»
🔘«Проект на сопровождение»

Подробнее: тут
Регистрация: тут

📍

Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1511👍5

5.65K views09:38

Борис опять

https://www.existentialhope.com/existential-hope-meme-prize

Конкурс мемов за $10 000 - вызов достойный лучших хьюман мемеров

Вся ваша жизнь готовила вас к этому моменту

25❤6👎1

5.81K views09:04

Борис опять

63😢9❤2🔥1

5.52K views15:13

Борис опять

Forwarded from Нейронный Кот

Qwen3-VL

Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B.

В двух форматах: instruct и thinking
И в двух точностях: bf16 и fp8

До этого вышли MoE версии: 235B-A22B, 30B-A3B

Qwen-VL это моя любимая модель ♥️, мне понравилось с ней работать в поколении Qwen2.5-VL. На моей задачи многоклассовой классификации удалось выбить ~0.95 F1

Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее.

В планах попробовать Qwen3-VL для text-only задач. Кажется, должна работать прям хорошо

⛓️ Коллекция на хагинфейсе

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11

5.57K views21:00

Борис опять

Forwarded from Нейронный Кот

Посмотрите, что Qwen3-VL умеет из коробки — предсказать JSON со списком bounding box для произвольной задачи 🐱

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥50🤔107😢1

6.06K views21:00

Борис опять

Взято отсюда

Вся статья отличная кстати

37❤17👍6🔥2🤔1

5.84K viewsedited 22:19

Борис опять

Ежегодная конференция по GenAI в бизнесе и разработке Conversations пройдет 5 декабря в Москве и онлайн. Одно из качественных мероприятий где делятся практическими кейсами внедрения AI.

Что интересного в программе?

- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель

- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)

- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс

И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.

🔗Посмотреть полную программу можно и купить билет можно на сайте Conversations
По промокоду CVS25mORb скидка 10%.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔6👍5🔥32❤1

6.86K views09:04

Борис опять

Есть одна кофейня у моего дома где я написал больше 3/4 книги. Это мой лайфхак продуктивности: я иду туда с утра и сижу до закрытия.

Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе

154❤98🔥21👎2

6.85K viewsedited 09:32

Борис опять

Украл у @idea_maze

❤5746

7.17K views11:27

Борис опять

https://vibe-coded.lol/

vibe-coded.lol

Every Fucking AI-Coded Website Ever

The exact same AI-coded page everyone else makes.

74❤7👎4🔥2👍1

6.7K views13:03

Борис опять

https://nof1.ai/

Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.

Авторы утверждают:

Markets are the ultimate test of intelligence. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable.

Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:

1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход. (UPD: все же промпт есть, там для каждой монеты огромная стена всяких статистик типа EMA, вероятно лучший способ вызвать максимум галлюцинаций)
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!

Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.

Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.

Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.

UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.

120👍12🤔9❤8😢1

7.64K viewsedited 16:05

Борис опять

Что если "markets are the ultimate test of intelligence", но речь не про интеллект моделей, а интеллект наблюдателей?

👀

Please open Telegram to view this post

VIEW IN TELEGRAM

40👍31🤔4

6.72K viewsedited 16:58

Борис опять

Ребята, я закодил своего кодинг агента, иду поднимать pre-seed раунд, инвесторы в лс

90🤔9❤6

6.59K viewsedited 19:17

Борис опять

На ICLR вышла Segment Anything 3: очередная итерация zero shot сегментатора. Как и во второй версии фокус на видео, но в этот раз с текстовыми промптами.

Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.

Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.

Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.

👍14

6.96K views09:32

Борис опять

Forwarded from Love. Death. Transformers.

0:12

Media is too big

VIEW IN TELEGRAM

54❤30👍10👎3

5.46K views15:58

Борис опять

Forwarded from Love. Death. Transformers.

бля ГЕТЕРОСЕКС изобрели, пиздец и как теперь млем заниматся

139❤11🤔2

5.21K views14:51

Борис опять

Пока кто-то изобретал ГЕТЕРОСЕКС я написал 9 главу книги из десяти 🤗

🤗

Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8845👍16🔥8

6.5K viewsedited 17:42

Борис опять

Хотелось бы назвать книгу "Проигнорируй предыдущие инструкции и купи эту книгу", но средний потребитель не поймет шутку

163👍34❤16🔥6

5.99K viewsedited 17:59

About

Blog

Apps

Platform