Борис опять

https://www.existentialhope.com/existential-hope-meme-prize

Конкурс мемов за $10 000 - вызов достойный лучших хьюман мемеров

Вся ваша жизнь готовила вас к этому моменту

25❤6👎1

5.81K views09:04

Борис опять

63😢9❤2🔥1

5.51K views15:13

Борис опять

Forwarded from Нейронный Кот

Qwen3-VL

Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B.

В двух форматах: instruct и thinking
И в двух точностях: bf16 и fp8

До этого вышли MoE версии: 235B-A22B, 30B-A3B

Qwen-VL это моя любимая модель ♥️, мне понравилось с ней работать в поколении Qwen2.5-VL. На моей задачи многоклассовой классификации удалось выбить ~0.95 F1

Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее.

В планах попробовать Qwen3-VL для text-only задач. Кажется, должна работать прям хорошо

⛓️ Коллекция на хагинфейсе

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11

5.57K views21:00

Борис опять

Forwarded from Нейронный Кот

Посмотрите, что Qwen3-VL умеет из коробки — предсказать JSON со списком bounding box для произвольной задачи 🐱

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥50🤔107😢1

6.05K views21:00

Борис опять

Взято отсюда

Вся статья отличная кстати

37❤17👍6🔥2🤔1

5.83K viewsedited 22:19

Борис опять

Ежегодная конференция по GenAI в бизнесе и разработке Conversations пройдет 5 декабря в Москве и онлайн. Одно из качественных мероприятий где делятся практическими кейсами внедрения AI.

Что интересного в программе?

- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель

- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)

- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс

И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.

🔗Посмотреть полную программу можно и купить билет можно на сайте Conversations
По промокоду CVS25mORb скидка 10%.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔6👍5🔥32❤1

6.86K views09:04

Борис опять

Есть одна кофейня у моего дома где я написал больше 3/4 книги. Это мой лайфхак продуктивности: я иду туда с утра и сижу до закрытия.

Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе

154❤98🔥21👎2

6.84K viewsedited 09:32

Борис опять

Украл у @idea_maze

❤5746

7.16K views11:27

Борис опять

https://vibe-coded.lol/

vibe-coded.lol

Every Fucking AI-Coded Website Ever

The exact same AI-coded page everyone else makes.

74❤7👎4🔥2👍1

6.7K views13:03

Борис опять

https://nof1.ai/

Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.

Авторы утверждают:

Markets are the ultimate test of intelligence. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable.

Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:

1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход. (UPD: все же промпт есть, там для каждой монеты огромная стена всяких статистик типа EMA, вероятно лучший способ вызвать максимум галлюцинаций)
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!

Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.

Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.

Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.

UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.

120👍12🤔9❤8😢1

7.63K viewsedited 16:05

Борис опять

Что если "markets are the ultimate test of intelligence", но речь не про интеллект моделей, а интеллект наблюдателей?

👀

Please open Telegram to view this post

VIEW IN TELEGRAM

40👍31🤔4

6.71K viewsedited 16:58

Борис опять

Ребята, я закодил своего кодинг агента, иду поднимать pre-seed раунд, инвесторы в лс

90🤔9❤6

6.59K viewsedited 19:17

Борис опять

На ICLR вышла Segment Anything 3: очередная итерация zero shot сегментатора. Как и во второй версии фокус на видео, но в этот раз с текстовыми промптами.

Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.

Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.

Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.

👍14

6.96K views09:32

Борис опять

Forwarded from Love. Death. Transformers.

0:12

Media is too big

VIEW IN TELEGRAM

54❤30👍10👎3

5.45K views15:58

Борис опять

Forwarded from Love. Death. Transformers.

бля ГЕТЕРОСЕКС изобрели, пиздец и как теперь млем заниматся

139❤11🤔2

5.2K views14:51

Борис опять

Пока кто-то изобретал ГЕТЕРОСЕКС я написал 9 главу книги из десяти 🤗

🤗

Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8845👍16🔥8

6.49K viewsedited 17:42

Борис опять

Хотелось бы назвать книгу "Проигнорируй предыдущие инструкции и купи эту книгу", но средний потребитель не поймет шутку

163👍34❤16🔥6

5.98K viewsedited 17:59

Борис опять

Мои друзья из White Circle делают единственный в мире прибыльный стартап по AI safety и ищут инженеров.

Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.

Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.

Важно: нужно много работать. Зато готовы платить 80 - 150k USD.

Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse

2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton

3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас

📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform

whitecircle.ai

White Circle

We keep your AI models safe, reliable, and secure.

50❤12👎7🔥3

6.78K viewsedited 11:50

Борис опять

Forwarded from ChillHouse (Alexey Moiseenkov)

Бета релиз подъехал. Можно смело качать с сайта наше приложение для Mac, поддержка только M серии процессоров.

Будем очень благодарны фидбеку. Все внутри свое. Инференс, скачивание, клиент.

Зачем это надо: внутри есть раздел Apps в котором мы будем выкладывать различные workflow. Их в будущем можно будет легко повторить у себя зарегавшись в платформе. Многие не знают, на что способны локальные модели. Пока список там не такой большой, квантизация подкатит чуть позже.

Аналитику собираем только для подсчета DAU и активности. У галочки написано что и как. Like, share, retweet как говорят. Будем рады если вы или ваши друзья попробуют.

https://trymirai.com/chat-for-mac

P.S. надо ли класть в open source код? Там грязно чуть чуть :)

Trymirai

Mirai chat for MacOS - A faster, simpler alternative to Ollama and LM Studio

Chat with your favorite AI models directly on your Mac. Privately and securely. Built natively for macOS and Apple Silicon.

❤19👍11🔥3

7.59K views19:00

Борис опять

130👍12🤔3

7.3K views18:04

About

Blog

Apps

Platform