Machine learning Interview
30.1K subscribers
1.72K photos
152 videos
13 files
1.17K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @workakkk

РКН: clck.ru/3FmwRz
Download Telegram
Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.

VibeThinker-3B набирает:

* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests

Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:

* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage

Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.

Фронтирные модели всё ещё нужны для

https://arxiv.org/abs/2606.16140
👍1910🤣6🔥5
Ищем Senior Computer Vision Engineer в 2ГИС

Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.

В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.

Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.

Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее

Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD
👍6🥰21
✔️ Sakana AI выпустила виртуального директора по стратегии, который сам пишет исследование за 8 часов

Sakana AI представила свой первый коммерческий продукт, и это не очередной чат-бот для быстрых ответов. Новый инструмент называется Sakana Marlin. Компания описывает его как виртуального CSO, то есть автономного помощника для стратегических исследований в бизнесе.

Работает идея просто. Вы даёте тему исследования, а дальше Marlin сам уходит в работу примерно на 8 часов. Он формирует гипотезы, собирает информацию, проверяет выводы и в итоге возвращает не короткую выжимку, а полноценный результат: структурированные слайды и большой исследовательский отчёт на десятки страниц.

По сути, Sakana пытается автоматизировать тот тип работы, на который директор по стратегии и небольшая команда могли бы потратить недели. Например, анализ нового рынка, поиск точек роста, оценку конкурентов, разбор технологического тренда или подготовку стратегического решения для компании.

Главная мысль здесь в том, что ИИ начинает выходить за пределы формата «спросил и получил ответ за 30 секунд». Marlin рассчитан на длинное рассуждение, где модель не просто генерирует текст, а долго уточняет, сравнивает, проверяет и собирает материал в связную картину.

В основе продукта лежат исследования Sakana AI в области long-horizon reasoning и AB-MCTS. Это подход, где несколько моделей координируются между собой и помогают друг другу рассуждать эффективнее. Но важнее другое: Marlin вырос не только из лабораторных экспериментов, а из реального опыта внедрения AI-агентов в японских компаниях.

Доступ уже открыт. Есть оплата за использование без ежемесячной подписки, а также тарифы Pro, Team и Enterprise.

Интересно, что Sakana AI явно показывает направление рынка. Следующий этап ИИ-продуктов может быть не в том, чтобы отвечать быстрее, а в том, чтобы уметь работать дольше, глубже и автономнее.

Marlin: https://sakana.ai/marlin
Блог: https://sakana.ai/marlin-release/#English
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍5🤣4🔥3
Как сегодня создают эффективные ML-системы

Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.

Будет три потока докладов:

— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.

Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.

Регистрируйся заранее и зови коллег
❤‍🔥4🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали open-source гуманоидного робота, который всего за 7 дней научился ходить, бегать, держать баланс и даже выполнять движения из K-pop танцев 🤯

ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.

Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.
🔥214👍4🥱3
Tensordyne анонсировала прорывную систему для inference.

Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.

Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.

За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.

Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.

Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.

https://x.com/TensordyneInc/status/2066567307984531834
🔥31👍62🤔2
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
🫡7👍6🆒54
Forwarded from AI VK Hub
This media is not supported in your browser
VIEW IN TELEGRAM
📢 Открыта регистрация на RecSys Meetup от AI VK

1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.

Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK

В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности

➡️Регистрация по ссылке
Количество мест ограничено, трансляции не будет.
📍1 июля, ДК «Кристалл», Москва


#aivkhub #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🔥4🥴4
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb
15👍7🥰4
Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.

Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.

Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.

Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.

Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.

И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.

Оставшаяся слабость контекстная.

Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.

Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.

В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.

Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
14👍9🔥5
Боевые Вайбкодинг-машины
36👍9😁8
DeepSeek-V4-Flash открыли бесплатно: тестируем без оплаты токенов

Что можно тестировать:

• генерацию кода и автоматизацию;• агентные сценарии и ботов;• анализ данных и технические задачи;• быстрые прототипы без расходов на API;• игровые серверы, ассистентов и нестандартные AI-проекты.

Отличный вариант, чтобы быстро проверить идею, не сливая бюджет на эксперименты.

Забираем бесплатно здесь:

https://www.openmodel.ai/event
🔥16👍65
This media is not supported in your browser
VIEW IN TELEGRAM
forkd - это runtime для sandbox-окружений AI-агентов на базе Firecracker microVM.

Он помогает быстрее ветвить и распараллеливать задачи: сначала один раз запускается «прогретый» родительский microVM, а затем дочерние окружения создаются из copy-on-write снапшотов памяти вместо холодного запуска каждой VM.

Ключевые возможности:

- Forking от прогретого родителя - дочерние окружения наследуют уже загруженные импорты, зависимости, JIT-состояние, веса моделей и кэши
- KVM-изолированные microVM — каждый дочерний sandbox работает как отдельный процесс Firecracker с собственной изоляцией
- Live BRANCH, можно поставить работающий sandbox на паузу, снять снапшот состояния «на лету» и продолжить выполнение. Для v0.4 заявлено p50-окно паузы исходного окружения 56 мс
- Цепочки diff-снапшотов — можно накладывать runtime-слои вроде numpy → pandas → sklearn без повторного копирования одного и того же базового образа
- Удобная daemon-поверхность, REST API, Python/TypeScript/MCP-клиенты, метрики Prometheus, JSON audit log и поддержка systemd

Проект open-source и распространяется под лицензией Apache License 2.0.

Ссылка в ответе 👇

https://github.com/deeplethe/forkd
🔥85🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Вопрос «использовать ИИ или нет» уже давно закрыт. Теперь осталось понять, как делать это с пользой для бизнеса, команды и собственной карьеры.

26–27 июня в Казани пройдёт ТАТАР САН — главная конференция Татарстана про искусственный интеллект и его практическое применение. Сбер выступает генеральным партнёром конференции и примет активное участие в деловой программе. Соберутся разработчики, дизайнеры, HR-спецы, руководители и все, кто хочет разобраться в главной трансформации последних лет.

В программе:

🔵Реальные кейсы внедрения ИИ от экспертов из Сбера, МТС, Альфа-Инвестиций и других компаний
🔵 Пять тематических треков: от трансформации ролей и найма до дизайна и инженерных практик
🔵 Хедлайнеры — Вячеслав Дубынин из МГУ и Владимир Пирожков из Сбера
🔵 Нетворкинг, конкурс «Королева кода» и афтерпати с секретными гостями на сцене.

Фиксируйте в календаре: 26 и 27 июня, Казань, ТАТАР САН. Вся программа и билеты на сайте конференции.

26–27 июня // ИТ-парк им. Б. Рамеева // Казань
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥32
Интересный релиз Qwen3.6-35B-A3B-StyleTune!

Эта мощная модель точечно перестраивает текст так, чтобы полностью убрать роботизированные клише и повторяющиеся тропы, при этом сохраняя рассуждение и логику Qwen3.6 на 100%.

https://huggingface.co/Gryphe/Qwen3.6-35B-A3B-StyleTune
🔥237
🚨 MICRON ОБЪЯВЛЯЕТ О СТРАТЕГИЧЕСКОЙ СДЕЛКЕ С ANTHROPIC

* Многолетнее соглашение по HBM, DRAM и SSD
* Совместная разработка памяти и хранилищ под нагрузки Claude
* Claude внедряется внутри Micron
* Micron инвестировала в раунд Anthropic Series H

Теперь Micron для Anthropic одновременно инвестор, клиент, партнёр и поставщик.
🔥19👍6💊54😁3🤗2🗿1