Борис опять
15.1K subscribers
1.44K photos
72 videos
30 files
1.48K links
life = curiosity + irreducible noise

Whois: https://xn--r1a.website/boris_again/3400

Лс: @btseytlin
Download Telegram
84👍161👎1🔥1
Хочу такую!
8317👍2🔥1
LLM Steering 2025: Дружеский хакатон по промпт-инжинирингу

📅 Когда: 24-26 октября
📍 Где: Онлайн + Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно

LLM Steering (направленное управление моделью) — это базовый навык для оценки моделей (evals) и, главное, для решения реальных задач с LLM. Мы считаем, что навыки развиваются практикой, поэтому делаем хакатон с фокусом на обучение и кооперацию.

Про что кейсы?
Хакатон предполагает несколько направлений, из которых участники смогут выбрать кейс подходящей тематики и уровня сложности. Будут охвачены:
🔘базовые методы промпт-инжиниринга,
🔘стилистическое управление генерацией контента,
🔘генерация и проверка кода,
🔘извлечение, структурирование и верификация данных,
🔘поиск уязвимостей, ограничений и нетипичных поведенческих сценариев моделей.

Образовательная программа:
Предварительно к хакатону будут проведены опциональные лекции и воркшопы по темам:
🔘методы промпт-инжиниринга,
🔘основы jailbreak-техник и AI Safety,
🔘оформление pitch-презентаций для проектов.

Что значит дружеский хакатон?
Все, кто сдаст рабочее решение по критериям, попадают в список победителей и получают призы.
Нет крупных денежных призов, только полезные ресурсы и сувениры от ЦДО «Моноид».

Зачем участвовать:

Этот опыт полезен для тех, кто хочет построить карьеру в этой области, а также для:
🔘освоения прикладных методов работы с LLM на реальных задачах,
🔘понимания ограничений и сильных сторон моделей,
🔘формирования портфолио и исследовательских идей.

Спец-номинации:
🔘«AI Safety релевантный проект»
🔘«Проект на сопровождение»

Подробнее: тут
Регистрация: тут

📍Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1511👍5
https://www.existentialhope.com/existential-hope-meme-prize

Конкурс мемов за $10 000 - вызов достойный лучших хьюман мемеров

Вся ваша жизнь готовила вас к этому моменту
256👎1
63😢92🔥1
Qwen3-VL

Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B.

В двух форматах: instruct и thinking
И в двух точностях: bf16 и fp8

До этого вышли MoE версии: 235B-A22B, 30B-A3B

Qwen-VL это моя любимая модель ♥️, мне понравилось с ней работать в поколении Qwen2.5-VL. На моей задачи многоклассовой классификации удалось выбить ~0.95 F1

Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее.

В планах попробовать Qwen3-VL для text-only задач. Кажется, должна работать прям хорошо

⛓️ Коллекция на хагинфейсе
Please open Telegram to view this post
VIEW IN TELEGRAM
11
Посмотрите, что Qwen3-VL умеет из коробки — предсказать JSON со списком bounding box для произвольной задачи 🐱
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥50🤔107😢1
Взято отсюда

Вся статья отличная кстати
3717👍6🔥2🤔1
Ежегодная конференция по GenAI в бизнесе и разработке Conversations пройдет 5 декабря в Москве и онлайн. Одно из качественных мероприятий где делятся практическими кейсами внедрения AI.

Что интересного в программе?

- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель

- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)

- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс

И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.

🔗Посмотреть полную программу можно и купить билет можно на сайте Conversations
По промокоду CVS25mORb скидка 10%.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6👍5🔥321
Есть одна кофейня у моего дома где я написал больше 3/4 книги. Это мой лайфхак продуктивности: я иду туда с утра и сижу до закрытия.

Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе
15498🔥21👎2
Украл у @idea_maze
5746
https://nof1.ai/

Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.

Авторы утверждают:
Markets are the ultimate test of intelligence. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable.


Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:

1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход. (UPD: все же промпт есть, там для каждой монеты огромная стена всяких статистик типа EMA, вероятно лучший способ вызвать максимум галлюцинаций)
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!

Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.

Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.

Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.

UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.
120👍12🤔98😢1
Что если "markets are the ultimate test of intelligence", но речь не про интеллект моделей, а интеллект наблюдателей?

👀👀👀
Please open Telegram to view this post
VIEW IN TELEGRAM
40👍31🤔4
Ребята, я закодил своего кодинг агента, иду поднимать pre-seed раунд, инвесторы в лс
90🤔96
На ICLR вышла Segment Anything 3: очередная итерация zero shot сегментатора. Как и во второй версии фокус на видео, но в этот раз с текстовыми промптами.

Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.

Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.

Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.
👍14
бля ГЕТЕРОСЕКС изобрели, пиздец и как теперь млем заниматся
13911🤔2
Пока кто-то изобретал ГЕТЕРОСЕКС я написал 9 главу книги из десяти 🤗🤗🤗

Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой
Please open Telegram to view this post
VIEW IN TELEGRAM
8845👍16🔥8
Хотелось бы назвать книгу "Проигнорируй предыдущие инструкции и купи эту книгу", но средний потребитель не поймет шутку
163👍3416🔥6