Machine learning Interview

Вайбкодер собрал полноценную браузерную MMORPG в духе World of Warcraft с помощью Claude Fable 5.

Проект называется World of ClaudeCraft.

Внутри уже есть:

* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код

Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.

Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.

Играть здесь: https://worldofclaudecraft.com/

GitHub: https://github.com/levy-street/world-of-claudecraft

🤣25❤15👍9🔥7💊2

3.62K views21:09

Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.

VibeThinker-3B набирает:

* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests

Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:

* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage

Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.

Фронтирные модели всё ещё нужны для

https://arxiv.org/abs/2606.16140

👍18❤10🔥5🤣5

3.01K views13:15

Machine learning Interview

Ищем Senior Computer Vision Engineer в 2ГИС

Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.

В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.

Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.

Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее

Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD

👍6🥰2❤1

2.33K views14:04

Machine learning Interview

✔️

Sakana AI выпустила виртуального директора по стратегии, который сам пишет исследование за 8 часов

Sakana AI представила свой первый коммерческий продукт, и это не очередной чат-бот для быстрых ответов. Новый инструмент называется Sakana Marlin. Компания описывает его как виртуального CSO, то есть автономного помощника для стратегических исследований в бизнесе.

Работает идея просто. Вы даёте тему исследования, а дальше Marlin сам уходит в работу примерно на 8 часов. Он формирует гипотезы, собирает информацию, проверяет выводы и в итоге возвращает не короткую выжимку, а полноценный результат: структурированные слайды и большой исследовательский отчёт на десятки страниц.

По сути, Sakana пытается автоматизировать тот тип работы, на который директор по стратегии и небольшая команда могли бы потратить недели. Например, анализ нового рынка, поиск точек роста, оценку конкурентов, разбор технологического тренда или подготовку стратегического решения для компании.

Главная мысль здесь в том, что ИИ начинает выходить за пределы формата «спросил и получил ответ за 30 секунд». Marlin рассчитан на длинное рассуждение, где модель не просто генерирует текст, а долго уточняет, сравнивает, проверяет и собирает материал в связную картину.

В основе продукта лежат исследования Sakana AI в области long-horizon reasoning и AB-MCTS. Это подход, где несколько моделей координируются между собой и помогают друг другу рассуждать эффективнее. Но важнее другое: Marlin вырос не только из лабораторных экспериментов, а из реального опыта внедрения AI-агентов в японских компаниях.

Доступ уже открыт. Есть оплата за использование без ежемесячной подписки, а также тарифы Pro, Team и Enterprise.

Интересно, что Sakana AI явно показывает направление рынка. Следующий этап ИИ-продуктов может быть не в том, чтобы отвечать быстрее, а в том, чтобы уметь работать дольше, глубже и автономнее.

Marlin: https://sakana.ai/marlin
Блог: https://sakana.ai/marlin-release/#English

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🤣4🔥2

2.31K views17:01

Machine learning Interview

Как сегодня создают эффективные ML-системы

Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.

Будет три потока докладов:

— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.

Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.

Регистрируйся заранее и зови коллег

❤‍🔥3

2.4K views17:34

Machine learning Interview

1:10

This media is not supported in your browser

VIEW IN TELEGRAM

Исследователи создали open-source гуманоидного робота, который всего за 7 дней научился ходить, бегать, держать баланс и даже выполнять движения из K-pop танцев 🤯

ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.

Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.

🔥20👍4❤3🥱3

2.48K views19:31

Machine learning Interview

Tensordyne анонсировала прорывную систему для inference.

Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.

Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.

За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.

Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.

Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.

https://x.com/TensordyneInc/status/2066567307984531834

🔥27👍5❤2🤔2

2.78K views06:09

Machine learning Interview

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905

🫡6👍4🆒4❤1

2.01K views10:02

Machine learning Interview

Forwarded from AI VK Hub

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

📢

Открыта регистрация на RecSys Meetup от AI VK

1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.

Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK

В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности

➡️

Регистрация по ссылке

Количество мест ограничено, трансляции не будет.

📍1 июля, ДК «Кристалл», Москва

#aivkhub #recsys

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍5🔥4🥴3

1.74K views11:48

Machine learning Interview

QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb

❤12👍5🥰2

2.14K views13:37

Machine learning Interview

Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.

Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.

Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.

Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.

Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.

И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.

Оставшаяся слабость контекстная.

Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.

Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.

В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.

Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193

❤7👍7🔥3

1.79K views13:26

Machine learning Interview

Боевые Вайбкодинг-машины

❤19👍6😁4

1.46K views16:14

About

Blog

Apps

Platform