Ежегодная конференция по GenAI в бизнесе и разработке Conversations пройдет 5 декабря в Москве и онлайн. Одно из качественных мероприятий где делятся практическими кейсами внедрения AI.
Что интересного в программе?
- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель
- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)
- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс
И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.
🔗 Посмотреть полную программу можно и купить билет можно на сайте Conversations
По промокоду CVS25mORb скидка 10%.
Что интересного в программе?
- Зачем металлургии нужна собственная LLM и какие уникальные инсайты она создает для отрасли? Норникель
- Как внедрять генеративные технологии в вашей самой дорогой команде и считать профит в деньгах и других метриках? Axenix (ex Accenture)
- Как в Авиасейлс выстраивают процесс оценки качества ИИ-продуктов? Авиасейлс
И еще куча классных докладов от Raft, Т-Банк, Plata card, Яндекс, Just AI, GigaB2B, ВкусВилл и других.
По промокоду CVS25mORb скидка 10%.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6👍5🔥3 2❤1
Есть одна кофейня у моего дома где я написал больше 3/4 книги. Это мой лайфхак продуктивности: я иду туда с утра и сижу до закрытия.
Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе
Сегодня они сделали мне скидку 15% на моё авокадо хипстер хрючево потому что я топ-1 в лидерборде по покупке кофе
https://nof1.ai/
Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.
Авторы утверждают:
Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:
1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход.(UPD: все же промпт есть, там для каждой монеты огромная стена всяких статистик типа EMA, вероятно лучший способ вызвать максимум галлюцинаций)
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!
Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.
Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.
Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.
UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.
Появился очень смешной "бенчмарк" где LLM в реальном времени торгуют криптой за настоящие деньги. Всем моделям выдали по $10k и задали одинаковый промпт.
Авторы утверждают:
Markets are the ultimate test of intelligence. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable.
Это очень смешно потому что, несмотря на громкие слова, по факту получили самый бесполезный на свете бенчмарк:
1. Торговля криптой. Самые волатильные и непредсказуемые активы.
2. (Судя по всему) у моделей нет доступа к новостям и какой-либо внешней информации.
3. Один инстанс каждой модели.
4. Параметров моделей не видно, промпт не видно и непонятно в каком виде данные поступают на вход.
5. Ни о чем не говорящие результаты. Если кто-то заработает на 500 долларов больше (или скорее потеряет на 500 меньше), какие мы сделаем из этого выводы? Модели повезло или у неё trader level intelligence?
6. Кривой расчет лидерборда. Лидерборд считается по общей стоимости активов, а не по заработанным деньгам. Поэтому сейчас на первом месте Deepseek со стоимостью активов $10,427, то есть чуть больше, чем вначале. Но при этом у него biggest win -$4.19, а biggest loss -$348.33. То есть он ничего не заработал!
Максимум рандома, минимум воспроизводимости, никакой разделяющей способности.
Пока что все модели в небольшом минусе. Фактически лидирует Grok 4 потому что просто решил ничего не трейдить. Видимо он сдал ultimate test of intelligence и решил не сливать деньги на торговлю криптой.
Не знаю чего добиваются авторы, но возможно у них получится наглядно показать, что торговать криптой без какой-либо информации это безумие.
UPD: Grok тоже закупился и даже что-то шортанул, но просто не закрывает позиции. Таким образом не платит комиссий и за счет этого сохраняет фактическое лидерство.
Что если "markets are the ultimate test of intelligence", но речь не про интеллект моделей, а интеллект наблюдателей?
👀 👀 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
На ICLR вышла Segment Anything 3: очередная итерация zero shot сегментатора. Как и во второй версии фокус на видео, но в этот раз с текстовыми промптами.
Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.
Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.
Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.
Вообще линейка SAM это самый скучный сериал. Каждый раз одно и то же. Снова статья про то, что смогли нагенерить больше данных (псевдолейблов) и скор получился ещё лучше.
Теперь можно промптить короткими текстовыми промптами. Вероятно это единственный zero shot сегментатор для видео. Как и в SAM2 прямо в модель встроен трекер. Обещают 30 ms на фрейм и возможность трекать до 5 объектов в реальном времени. Но есть нюанс: на H200 GPU.
Говорят, что скоры на LVIS и COCO сильно лучше, чем у OWLv2. Так что возможно простые работяги смогут исполбзовать SAM3 как zero shot детектор для картинок.
👍14
Forwarded from Love. Death. Transformers.
бля ГЕТЕРОСЕКС изобрели, пиздец и как теперь млем заниматся
Пока кто-то изобретал ГЕТЕРОСЕКС я написал 9 главу книги из десяти 🤗 🤗 🤗
Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой
Кстати, октябрь ещё не закончился, а я уже написал в три раза больше (!!!!!!) чем за сентябрь. Причем это не помешало мне на днях всю ночь играть в Fallout Sonora или периодически трогать траву. Таким образом лучший лайфхак продуктивности это хреначить перед дедлайном в страхе почувствовать себя жалким ничтожеством, work-life balance был ошибкой
Please open Telegram to view this post
VIEW IN TELEGRAM
❤88 45👍16🔥8
Хотелось бы назвать книгу "Проигнорируй предыдущие инструкции и купи эту книгу", но средний потребитель не поймет шутку
Мои друзья из White Circle делают единственный в мире прибыльный стартап по AI safety и ищут инженеров.
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
whitecircle.ai
White Circle
We keep your AI models safe, reliable, and secure.
Forwarded from ChillHouse (Alexey Moiseenkov)
Бета релиз подъехал. Можно смело качать с сайта наше приложение для Mac, поддержка только M серии процессоров.
Будем очень благодарны фидбеку. Все внутри свое. Инференс, скачивание, клиент.
Зачем это надо: внутри есть раздел Apps в котором мы будем выкладывать различные workflow. Их в будущем можно будет легко повторить у себя зарегавшись в платформе. Многие не знают, на что способны локальные модели. Пока список там не такой большой, квантизация подкатит чуть позже.
Аналитику собираем только для подсчета DAU и активности. У галочки написано что и как. Like, share, retweet как говорят. Будем рады если вы или ваши друзья попробуют.
https://trymirai.com/chat-for-mac
P.S. надо ли класть в open source код? Там грязно чуть чуть :)
Будем очень благодарны фидбеку. Все внутри свое. Инференс, скачивание, клиент.
Зачем это надо: внутри есть раздел Apps в котором мы будем выкладывать различные workflow. Их в будущем можно будет легко повторить у себя зарегавшись в платформе. Многие не знают, на что способны локальные модели. Пока список там не такой большой, квантизация подкатит чуть позже.
Аналитику собираем только для подсчета DAU и активности. У галочки написано что и как. Like, share, retweet как говорят. Будем рады если вы или ваши друзья попробуют.
https://trymirai.com/chat-for-mac
P.S. надо ли класть в open source код? Там грязно чуть чуть :)
Trymirai
Mirai chat for MacOS - A faster, simpler alternative to Ollama and LM Studio
Chat with your favorite AI models directly on your Mac. Privately and securely. Built natively for macOS and Apple Silicon.
❤19👍11🔥3
Forwarded from Idea Maze
Ну что, поехали. Турнир начинается :)
С текущего момента до вечера пятницы 9 LLM-игроков будут играть в покер за 4 столами.
Смотреть здесь: pokerbattle.ai
С текущего момента до вечера пятницы 9 LLM-игроков будут играть в покер за 4 столами.
Смотреть здесь: pokerbattle.ai
PokerBattle.ai
PokerBattle.ai — The first-ever cash poker tournament for LLMs
A week-long showdown where AI models play Texas Hold'em 24/7. Starts October 27.
Idea Maze
Ну что, поехали. Турнир начинается :) С текущего момента до вечера пятницы 9 LLM-игроков будут играть в покер за 4 столами. Смотреть здесь: pokerbattle.ai
UPD: сайт подняли, можно смотреть на ллм покер
👎21👍13❤3
5-7 декабря планирую в Стамбул на финал Yandex Cup 2025.
Доступных для участия направлений всего 6, а два из них — Алгоритмы и ML — международные и доступны на русском и английском языках. В машинном обучении, например, будут задачи, посвященные устойчивости к галлюцинациям в LLM, генерации для видеосенсора в автономном транспорте и другие. Подписчикам моего канала стоит обратить внимание. До 29 октября открыт прием заявок, а квал по ML доступен до 5 ноября.
Финал проведут в Стамбуле, где соберут 180 программистов со всего мира. Они разделят между собой призовой фонд в 12 млн руб. Планирую приехать, и посмотреть на чемпионат вживую.
Доступных для участия направлений всего 6, а два из них — Алгоритмы и ML — международные и доступны на русском и английском языках. В машинном обучении, например, будут задачи, посвященные устойчивости к галлюцинациям в LLM, генерации для видеосенсора в автономном транспорте и другие. Подписчикам моего канала стоит обратить внимание. До 29 октября открыт прием заявок, а квал по ML доступен до 5 ноября.
Финал проведут в Стамбуле, где соберут 180 программистов со всего мира. Они разделят между собой призовой фонд в 12 млн руб. Планирую приехать, и посмотреть на чемпионат вживую.
❤26👍12👎8🤔4 4🔥3