Machine learning Interview

OpenAI рассматривает возможность резко снизить цены для пользователей, чтобы переманить клиентов у конкурента Anthropic.

По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов.

Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.

❤22👍5😁4🔥3

3.53K views13:36

Machine learning Interview

Новости подкинули интересный кейс от Ozon Tech: команда проводит хакатон Робозон с призовым фондом 15 млн рублей и задачами на основе реальных данных. Интересно, что требуется не «научить сеть детектировать 100 классов», а встроить ML в реальный сортировочный цикл с ограничениями по железу. Тут, вероятно, пригодится умение ужать модель до разумных FPS и не потерять в точности на скользких кейсах. Финалистов везут на E-CODE.

Скорее всего, мероприятие может быть интересно для тех, кто может воспроизвести стенд (хотя бы симуляционно).
Ссылка на задачи в посте.

👍11❤6🤣4❤‍🔥3💊2

3.09K views12:44

Machine learning Interview

Forwarded from Machinelearning

📌

Дарио Амодеи предложил политику регулирования ИИ

Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.

С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.

🟡

Регулирование и безопасность

Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.

Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.

🟡

Экономика

ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.

Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.

🟡

Польза от ИИ

Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.

Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.

🟡

Государство

ИИ в чужих руках может стать инструментом авторитаризма.

Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.

🟡

Лидерство демократий

Тут ИИ сравнивается по значимости с ядерным оружием.

Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.

Подводя итог, Амодеи называет текущий момент окном возможностей

Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.

Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🥴9❤6🔥3🤔3🥰2

2.48K views14:34

Machine learning Interview

MiniMax M3 выложили на Hugging Face

MiniMax открыла веса M3 - модели с архитектурой MoE, где общий размер около 428B параметров, но на один токен активируется примерно 23B.

Это важный момент: модель выглядит «огромной» по общему числу параметров, но инференс считается не как у плотной 428B-модели. За счёт разреженной активации работает только часть экспертов, поэтому можно держать высокий запас знаний и возможностей без полного вычислительного удара на каждый токен.

Что интересно:

- веса уже доступны на Hugging Face
- примерно 428B параметров всего
- примерно 23B активных параметров на токен
- используется MiniMax Sparse Attention
- фокус на длинный контекст, агентные сценарии и кодинг
- модель можно изучать, дообучать и запускать вне закрытого API

Веса: https://huggingface.co/MiniMaxAI/MiniMax-M3

MiniMax Sparse Attention:
https://huggingface.co/papers/2606.13392

👍15🔥8❤4🥱2

3.86K views16:39

Machine learning Interview

Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.

Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.

Доступ ко всем остальным моделям Claude не затронут.

Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.

https://www.anthropic.com/news/fable-mythos-access

🤣31🔥5❤4👍4

3.88K views02:05

Machine learning Interview

✔️

Reuters пишет, что Amazon заранее предупредила администрацию Трампа о рисках вокруг новых моделей Anthropic.

По данным источника агентства, среди тех, кто поднимал вопрос перед высокопоставленными чиновниками, был CEO Amazon Энди Джесси. Внутри Amazon исследователи прогнали Fable 5 через серию промптов и якобы смогли добиться ответов с информацией, которая может помогать в кибератаках.

История важна не только из-за самой уязвимости. Она показывает, как быстро frontier-модели превращаются из продукта в объект национальной безопасности. Один крупный партнёр находит обход защиты, доносит это до Белого дома, а дальше вопрос уже не про релиз, а про экспортный контроль, доступ иностранцев и политическое давление на AI-лаборатории.

Для Anthropic это особенно болезненно, компания годами строила образ самой осторожной AI-лаборатории, но теперь именно её модели стали поводом для жёсткой реакции регуляторов.

reuters.com/business/retail-consumer/amazon-voiced-concerns-about-anthropic-ai-models-before-us-governments-crackdown-2026-06-13/

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥12❤7👍6😁4🤪2

8.57K views12:55

Machine learning Interview

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Вайбкодер собрал полноценную браузерную MMORPG в духе World of Warcraft с помощью Claude Fable 5.

Проект называется World of ClaudeCraft.

Внутри уже есть:

* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код

Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.

Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.

Играть здесь: https://worldofclaudecraft.com/

GitHub: https://github.com/levy-street/world-of-claudecraft

🤣25❤15👍9🔥7💊2

3.59K views21:09

Machine learning Interview

Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.

VibeThinker-3B набирает:

* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests

Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:

* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage

Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.

Фронтирные модели всё ещё нужны для

https://arxiv.org/abs/2606.16140

👍18❤10🔥5🤣5

2.9K views13:15

Machine learning Interview

Ищем Senior Computer Vision Engineer в 2ГИС

Мы решаем задачи компьютерного зрения сразу в двух направлениях: работаем с пользовательскими фото и видео, а также помогаем поддерживать актуальность карты с помощью спутниковых снимков и данных дорожной инфраструктуры.

В команде занимаются фото-поиском, модерацией контента, image retrieval, извлечением данных из изображений, распознаванием объектов на спутниковых снимках и задачами 3D-реконструкции.

Будет интересно, если есть опыт с CV-моделями, большими визуальными датасетами, CLIP, DINO, SAM или другими foundation-моделями, а также желание решать прикладные задачи, результат которых увидят миллионы пользователей.

Удалённо из РФ или из офисов 2ГИС.
ДМС, обучение, конференции и сильная команда ML-инженеров рядом.
Подробнее

Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD

👍6🥰2❤1

2.31K views14:04

Machine learning Interview

✔️

Sakana AI выпустила виртуального директора по стратегии, который сам пишет исследование за 8 часов

Sakana AI представила свой первый коммерческий продукт, и это не очередной чат-бот для быстрых ответов. Новый инструмент называется Sakana Marlin. Компания описывает его как виртуального CSO, то есть автономного помощника для стратегических исследований в бизнесе.

Работает идея просто. Вы даёте тему исследования, а дальше Marlin сам уходит в работу примерно на 8 часов. Он формирует гипотезы, собирает информацию, проверяет выводы и в итоге возвращает не короткую выжимку, а полноценный результат: структурированные слайды и большой исследовательский отчёт на десятки страниц.

По сути, Sakana пытается автоматизировать тот тип работы, на который директор по стратегии и небольшая команда могли бы потратить недели. Например, анализ нового рынка, поиск точек роста, оценку конкурентов, разбор технологического тренда или подготовку стратегического решения для компании.

Главная мысль здесь в том, что ИИ начинает выходить за пределы формата «спросил и получил ответ за 30 секунд». Marlin рассчитан на длинное рассуждение, где модель не просто генерирует текст, а долго уточняет, сравнивает, проверяет и собирает материал в связную картину.

В основе продукта лежат исследования Sakana AI в области long-horizon reasoning и AB-MCTS. Это подход, где несколько моделей координируются между собой и помогают друг другу рассуждать эффективнее. Но важнее другое: Marlin вырос не только из лабораторных экспериментов, а из реального опыта внедрения AI-агентов в японских компаниях.

Доступ уже открыт. Есть оплата за использование без ежемесячной подписки, а также тарифы Pro, Team и Enterprise.

Интересно, что Sakana AI явно показывает направление рынка. Следующий этап ИИ-продуктов может быть не в том, чтобы отвечать быстрее, а в том, чтобы уметь работать дольше, глубже и автономнее.

Marlin: https://sakana.ai/marlin
Блог: https://sakana.ai/marlin-release/#English

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🤣4🔥2

2.28K views17:01

Machine learning Interview

Как сегодня создают эффективные ML-системы

Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.

Будет три потока докладов:

— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.

Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.

Регистрируйся заранее и зови коллег

❤‍🔥3

2.38K views17:34

Machine learning Interview

1:10

This media is not supported in your browser

VIEW IN TELEGRAM

Исследователи создали open-source гуманоидного робота, который всего за 7 дней научился ходить, бегать, держать баланс и даже выполнять движения из K-pop танцев 🤯

ROBOTIS AI Sapiens использует NVIDIA Isaac Sim для обучения, motion retargeting для переноса человеческих движений на робота и reinforcement learning, чтобы доработать навыки перед запуском в реальном мире.

Робот работает на NVIDIA Jetson Orin NX и новых актуаторах DYNAMIXEL-Q. Благодаря этому гуманоид может учиться сложным движениям всего тела в симуляции, а затем выполнять их физически.

🔥20👍4❤3🥱3

2.46K views19:31

Machine learning Interview

Tensordyne анонсировала прорывную систему для inference.

Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.

Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.

За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.

Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.

Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.

https://x.com/TensordyneInc/status/2066567307984531834

🔥27👍5❤2🤔2

2.74K views06:09

Machine learning Interview

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905

🫡6👍4🆒4❤1

1.97K views10:02

Machine learning Interview

Forwarded from AI VK Hub

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

📢

Открыта регистрация на RecSys Meetup от AI VK

1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.

Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK

В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности

➡️

Регистрация по ссылке

Количество мест ограничено, трансляции не будет.

📍1 июля, ДК «Кристалл», Москва

#aivkhub #recsys

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍5🔥4🥴3

1.69K views11:48

Machine learning Interview

QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb

❤12👍5🥰2

2.05K views13:37

Machine learning Interview

Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.

Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.

Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.

Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.

Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.

И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.

Оставшаяся слабость контекстная.

Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.

Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.

В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.

Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193

❤7👍6🔥3

1.51K views13:26

About

Blog

Apps

Platform