This media is not supported in your browser
VIEW IN TELEGRAM
Вайбкодер собрал полноценную браузерную MMORPG в духе World of Warcraft с помощью Claude Fable 5.
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
🤣25❤15👍9🔥7💊2
Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
👍18❤10🔥5🤣5
Ищем Senior Computer Vision Engineer в 2ГИС
Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.
В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.
Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.
Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее
Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD
Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.
В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.
Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.
Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее
Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD
👍6🥰2❤1
Sakana AI представила свой первый коммерческий продукт, и это не очередной чат-бот для быстрых ответов. Новый инструмент называется Sakana Marlin. Компания описывает его как виртуального CSO, то есть автономного помощника для стратегических исследований в бизнесе.
Работает идея просто. Вы даёте тему исследования, а дальше Marlin сам уходит в работу примерно на 8 часов. Он формирует гипотезы, собирает информацию, проверяет выводы и в итоге возвращает не короткую выжимку, а полноценный результат: структурированные слайды и большой исследовательский отчёт на десятки страниц.
По сути, Sakana пытается автоматизировать тот тип работы, на который директор по стратегии и небольшая команда могли бы потратить недели. Например, анализ нового рынка, поиск точек роста, оценку конкурентов, разбор технологического тренда или подготовку стратегического решения для компании.
Главная мысль здесь в том, что ИИ начинает выходить за пределы формата «спросил и получил ответ за 30 секунд». Marlin рассчитан на длинное рассуждение, где модель не просто генерирует текст, а долго уточняет, сравнивает, проверяет и собирает материал в связную картину.
В основе продукта лежат исследования Sakana AI в области long-horizon reasoning и AB-MCTS. Это подход, где несколько моделей координируются между собой и помогают друг другу рассуждать эффективнее. Но важнее другое: Marlin вырос не только из лабораторных экспериментов, а из реального опыта внедрения AI-агентов в японских компаниях.
Доступ уже открыт. Есть оплата за использование без ежемесячной подписки, а также тарифы Pro, Team и Enterprise.
Интересно, что Sakana AI явно показывает направление рынка. Следующий этап ИИ-продуктов может быть не в том, чтобы отвечать быстрее, а в том, чтобы уметь работать дольше, глубже и автономнее.
Marlin: https://sakana.ai/marlin
Блог: https://sakana.ai/marlin-release/#English
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4🤣4🔥2
Как сегодня создают эффективные ML-системы
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
❤🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали open-source гуманоидного робота, который всего за 7 дней научился ходить, бегать, держать баланс и даже выполнять движения из K-pop танцев 🤯
ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.
Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.
ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.
Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.
🔥20👍4❤3🥱3
Tensordyne анонсировала прорывную систему для inference.
Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.
Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.
За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.
Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.
Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.
https://x.com/TensordyneInc/status/2066567307984531834
Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.
Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.
За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.
Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.
Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.
https://x.com/TensordyneInc/status/2066567307984531834
🔥27👍5❤2🤔2
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
🫡6👍4🆒4❤1
Forwarded from AI VK Hub
This media is not supported in your browser
VIEW IN TELEGRAM
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
В программе:
#aivkhub #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5🔥4🥴3
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
ASOF JOIN, SAMPLE BY и LATEST ON.- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
❤12👍5🥰2
Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
❤7👍7🔥3