https://www.existentialhope.com/existential-hope-meme-prize
Конкурс мемов за $10 000 - вызов достойный лучших хьюман мемеров
Вся ваша жизнь готовила вас к этому моменту
Конкурс мемов за $10 000 - вызов достойный лучших хьюман мемеров
Вся ваша жизнь готовила вас к этому моменту
Forwarded from Нейронный Кот
Qwen3-VL
Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B.
В двух форматах: instruct и thinking
И в двух точностях: bf16 и fp8
До этого вышли MoE версии: 235B-A22B, 30B-A3B
Qwen-VL это моя любимая модель♥️ , мне понравилось с ней работать в поколении Qwen2.5-VL. На моей задачи многоклассовой классификации удалось выбить ~0.95 F1
Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее.
В планах попробовать Qwen3-VL для text-only задач. Кажется, должна работать прям хорошо
⛓️ Коллекция на хагинфейсе
Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B.
В двух форматах: instruct и thinking
И в двух точностях: bf16 и fp8
До этого вышли MoE версии: 235B-A22B, 30B-A3B
Qwen-VL это моя любимая модель
Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее.
В планах попробовать Qwen3-VL для text-only задач. Кажется, должна работать прям хорошо
⛓️ Коллекция на хагинфейсе
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11
Forwarded from Нейронный Кот
Посмотрите, что Qwen3-VL умеет из коробки — предсказать JSON со списком bounding box для произвольной задачи 🐱
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥50🤔10 7😢1
Ежегодная конференция по GenAI в бизнесе и разработке Conversations пройдет 5 декабря в Москве и онлайн. Одно из качественных мероприятий где делятся практическими кейсами внедрения AI.
Что интересного в программе?
- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель
- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)
- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс
И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.
🔗 Посмотреть полную программу можно и купить билет можно на сайте Conversations
По промокоду CVS25mORb скидка 10%.
Что интересного в программе?
- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель
- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)
- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс
И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.
По промокоду CVS25mORb скидка 10%.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6👍5🔥3 2❤1
Есть одна кофейня у моего дома где я написал больше 3/4 книги. Это мой лайфхак продуктивности: я иду туда с утра и сижу до закрытия.
Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе
Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе
https://nof1.ai/
Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.
Авторы утверждают:
Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:
1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход.(UPD: все же промпт есть, там для каждой монеты огромная стена всяких статистик типа EMA, вероятно лучший способ вызвать максимум галлюцинаций)
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!
Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.
Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.
Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.
UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.
Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.
Авторы утверждают:
Markets are the ultimate test of intelligence. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable.
Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:
1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход.
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!
Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.
Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.
Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.
UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.
Что если "markets are the ultimate test of intelligence", но речь не про интеллект моделей, а интеллект наблюдателей?
👀 👀 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
На ICLR вышла Segment Anything 3: очередная итерация zero shot сегментатора. Как и во второй версии фокус на видео, но в этот раз с текстовыми промптами.
Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.
Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.
Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.
Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.
Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.
Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.
👍14
Forwarded from Love. Death. Transformers.
бля ГЕТЕРОСЕКС изобрели, пиздец и как теперь млем заниматся
Пока кто-то изобретал ГЕТЕРОСЕКС я написал 9 главу книги из десяти 🤗 🤗 🤗
Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой
Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой
Please open Telegram to view this post
VIEW IN TELEGRAM
❤88 45👍16🔥8
Хотелось бы назвать книгу "Проигнорируй предыдущие инструкции и купи эту книгу", но средний потребитель не поймет шутку
Мои друзья из White Circle делают единственный в мире прибыльный стартап по AI safety и ищут инженеров.
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
whitecircle.ai
White Circle
We keep your AI models safe, reliable, and secure.
Forwarded from ChillHouse (Alexey Moiseenkov)
Бета релиз подъехал. Можно смело качать с сайта наше приложение для Mac, поддержка только M серии процессоров.
Будем очень благодарны фидбеку. Все внутри свое. Инференс, скачивание, клиент.
Зачем это надо: внутри есть раздел Apps в котором мы будем выкладывать различные workflow. Их в будущем можно будет легко повторить у себя зарегавшись в платформе. Многие не знают, на что способны локальные модели. Пока список там не такой большой, квантизация подкатит чуть позже.
Аналитику собираем только для подсчета DAU и активности. У галочки написано что и как. Like, share, retweet как говорят. Будем рады если вы или ваши друзья попробуют.
https://trymirai.com/chat-for-mac
P.S. надо ли класть в open source код? Там грязно чуть чуть :)
Будем очень благодарны фидбеку. Все внутри свое. Инференс, скачивание, клиент.
Зачем это надо: внутри есть раздел Apps в котором мы будем выкладывать различные workflow. Их в будущем можно будет легко повторить у себя зарегавшись в платформе. Многие не знают, на что способны локальные модели. Пока список там не такой большой, квантизация подкатит чуть позже.
Аналитику собираем только для подсчета DAU и активности. У галочки написано что и как. Like, share, retweet как говорят. Будем рады если вы или ваши друзья попробуют.
https://trymirai.com/chat-for-mac
P.S. надо ли класть в open source код? Там грязно чуть чуть :)
Trymirai
Mirai chat for MacOS - A faster, simpler alternative to Ollama and LM Studio
Chat with your favorite AI models directly on your Mac. Privately and securely. Built natively for macOS and Apple Silicon.
❤19👍11🔥3