Новости подкинули интересный кейс от Ozon Tech: команда проводит хакатон Робозон с призовым фондом 15 млн рублей и задачами на основе реальных данных. Интересно, что требуется не «научить сеть детектировать 100 классов», а встроить ML в реальный сортировочный цикл с ограничениями по железу. Тут, вероятно, пригодится умение ужать модель до разумных FPS и не потерять в точности на скользких кейсах. Финалистов везут на E-CODE.
Скорее всего, мероприятие может быть интересно для тех, кто может воспроизвести стенд (хотя бы симуляционно).
Ссылка на задачи в посте.
Скорее всего, мероприятие может быть интересно для тех, кто может воспроизвести стенд (хотя бы симуляционно).
Ссылка на задачи в посте.
👍11❤6🤣4❤🔥3💊2
Forwarded from Machinelearning
Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.
С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.
Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.
Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.
ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.
Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.
Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.
Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.
ИИ в чужих руках может стать инструментом авторитаризма.
Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.
Тут ИИ сравнивается по значимости с ядерным оружием.
Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.
Подводя итог, Амодеи называет текущий момент окном возможностей
Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.
Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴9❤6🔥3🤔3🥰2
MiniMax M3 выложили на Hugging Face
MiniMax открыла веса M3 - модели с архитектурой MoE, где общий размер около 428B параметров, но на один токен активируется примерно 23B.
Это важный момент: модель выглядит «огромной» по общему числу параметров, но инференс считается не как у плотной 428B-модели. За счёт разреженной активации работает только часть экспертов, поэтому можно держать высокий запас знаний и возможностей без полного вычислительного удара на каждый токен.
Что интересно:
- веса уже доступны на Hugging Face
- примерно 428B параметров всего
- примерно 23B активных параметров на токен
- используется MiniMax Sparse Attention
- фокус на длинный контекст, агентные сценарии и кодинг
- модель можно изучать, дообучать и запускать вне закрытого API
Веса: https://huggingface.co/MiniMaxAI/MiniMax-M3
MiniMax Sparse Attention:
https://huggingface.co/papers/2606.13392
MiniMax открыла веса M3 - модели с архитектурой MoE, где общий размер около 428B параметров, но на один токен активируется примерно 23B.
Это важный момент: модель выглядит «огромной» по общему числу параметров, но инференс считается не как у плотной 428B-модели. За счёт разреженной активации работает только часть экспертов, поэтому можно держать высокий запас знаний и возможностей без полного вычислительного удара на каждый токен.
Что интересно:
- веса уже доступны на Hugging Face
- примерно 428B параметров всего
- примерно 23B активных параметров на токен
- используется MiniMax Sparse Attention
- фокус на длинный контекст, агентные сценарии и кодинг
- модель можно изучать, дообучать и запускать вне закрытого API
Веса: https://huggingface.co/MiniMaxAI/MiniMax-M3
MiniMax Sparse Attention:
https://huggingface.co/papers/2606.13392
👍15🔥8❤4🥱2
Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
🤣31🔥5❤4👍4
По данным источника агентства, среди тех, кто поднимал вопрос перед высокопоставленными чиновниками, был CEO Amazon Энди Джесси. Внутри Amazon исследователи прогнали Fable 5 через серию промптов и якобы смогли добиться ответов с информацией, которая может помогать в кибератаках.
История важна не только из-за самой уязвимости. Она показывает, как быстро frontier-модели превращаются из продукта в объект национальной безопасности. Один крупный партнёр находит обход защиты, доносит это до Белого дома, а дальше вопрос уже не про релиз, а про экспортный контроль, доступ иностранцев и политическое давление на AI-лаборатории.
Для Anthropic это особенно болезненно, компания годами строила образ самой осторожной AI-лаборатории, но теперь именно её модели стали поводом для жёсткой реакции регуляторов.
reuters.com/business/retail-consumer/amazon-voiced-concerns-about-anthropic-ai-models-before-us-governments-crackdown-2026-06-13/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤7👍6😁4🤪2
This media is not supported in your browser
VIEW IN TELEGRAM
Вайбкодер собрал полноценную браузерную MMORPG в духе World of Warcraft с помощью Claude Fable 5.
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
🤣25❤15👍9🔥7💊2
Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
👍18❤10🔥5🤣5
Ищем Senior Computer Vision Engineer в 2ГИС
Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.
В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.
Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.
Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее
Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD
Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.
В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.
Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.
Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее
Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD
👍6🥰2❤1
Sakana AI представила свой первый коммерческий продукт, и это не очередной чат-бот для быстрых ответов. Новый инструмент называется Sakana Marlin. Компания описывает его как виртуального CSO, то есть автономного помощника для стратегических исследований в бизнесе.
Работает идея просто. Вы даёте тему исследования, а дальше Marlin сам уходит в работу примерно на 8 часов. Он формирует гипотезы, собирает информацию, проверяет выводы и в итоге возвращает не короткую выжимку, а полноценный результат: структурированные слайды и большой исследовательский отчёт на десятки страниц.
По сути, Sakana пытается автоматизировать тот тип работы, на который директор по стратегии и небольшая команда могли бы потратить недели. Например, анализ нового рынка, поиск точек роста, оценку конкурентов, разбор технологического тренда или подготовку стратегического решения для компании.
Главная мысль здесь в том, что ИИ начинает выходить за пределы формата «спросил и получил ответ за 30 секунд». Marlin рассчитан на длинное рассуждение, где модель не просто генерирует текст, а долго уточняет, сравнивает, проверяет и собирает материал в связную картину.
В основе продукта лежат исследования Sakana AI в области long-horizon reasoning и AB-MCTS. Это подход, где несколько моделей координируются между собой и помогают друг другу рассуждать эффективнее. Но важнее другое: Marlin вырос не только из лабораторных экспериментов, а из реального опыта внедрения AI-агентов в японских компаниях.
Доступ уже открыт. Есть оплата за использование без ежемесячной подписки, а также тарифы Pro, Team и Enterprise.
Интересно, что Sakana AI явно показывает направление рынка. Следующий этап ИИ-продуктов может быть не в том, чтобы отвечать быстрее, а в том, чтобы уметь работать дольше, глубже и автономнее.
Marlin: https://sakana.ai/marlin
Блог: https://sakana.ai/marlin-release/#English
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4🤣4🔥2
Как сегодня создают эффективные ML-системы
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
❤🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали open-source гуманоидного робота, который всего за 7 дней научился ходить, бегать, держать баланс и даже выполнять движения из K-pop танцев 🤯
ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.
Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.
ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.
Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.
🔥20👍4❤3🥱3
Tensordyne анонсировала прорывную систему для inference.
Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.
Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.
За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.
Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.
Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.
https://x.com/TensordyneInc/status/2066567307984531834
Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.
Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.
За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.
Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.
Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.
https://x.com/TensordyneInc/status/2066567307984531834
🔥27👍5❤2🤔2
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
🫡6👍4🆒4❤1
Forwarded from AI VK Hub
This media is not supported in your browser
VIEW IN TELEGRAM
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
В программе:
#aivkhub #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5🔥4🥴3
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
ASOF JOIN, SAMPLE BY и LATEST ON.- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
❤12👍5🥰2
Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
❤7👍7🔥3