Machine learning Interview
30.1K subscribers
1.72K photos
152 videos
13 files
1.17K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @workakkk

РКН: clck.ru/3FmwRz
Download Telegram
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb
15👍7🥰4
Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.

Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.

Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.

Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.

Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.

И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.

Оставшаяся слабость контекстная.

Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.

Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.

В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.

Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
14👍9🔥5
Боевые Вайбкодинг-машины
36👍9😁8
DeepSeek-V4-Flash открыли бесплатно: тестируем без оплаты токенов

Что можно тестировать:

• генерацию кода и автоматизацию;• агентные сценарии и ботов;• анализ данных и технические задачи;• быстрые прототипы без расходов на API;• игровые серверы, ассистентов и нестандартные AI-проекты.

Отличный вариант, чтобы быстро проверить идею, не сливая бюджет на эксперименты.

Забираем бесплатно здесь:

https://www.openmodel.ai/event
🔥16👍65
This media is not supported in your browser
VIEW IN TELEGRAM
forkd - это runtime для sandbox-окружений AI-агентов на базе Firecracker microVM.

Он помогает быстрее ветвить и распараллеливать задачи: сначала один раз запускается «прогретый» родительский microVM, а затем дочерние окружения создаются из copy-on-write снапшотов памяти вместо холодного запуска каждой VM.

Ключевые возможности:

- Forking от прогретого родителя - дочерние окружения наследуют уже загруженные импорты, зависимости, JIT-состояние, веса моделей и кэши
- KVM-изолированные microVM — каждый дочерний sandbox работает как отдельный процесс Firecracker с собственной изоляцией
- Live BRANCH, можно поставить работающий sandbox на паузу, снять снапшот состояния «на лету» и продолжить выполнение. Для v0.4 заявлено p50-окно паузы исходного окружения 56 мс
- Цепочки diff-снапшотов — можно накладывать runtime-слои вроде numpy → pandas → sklearn без повторного копирования одного и того же базового образа
- Удобная daemon-поверхность, REST API, Python/TypeScript/MCP-клиенты, метрики Prometheus, JSON audit log и поддержка systemd

Проект open-source и распространяется под лицензией Apache License 2.0.

Ссылка в ответе 👇

https://github.com/deeplethe/forkd
🔥85🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Вопрос «использовать ИИ или нет» уже давно закрыт. Теперь осталось понять, как делать это с пользой для бизнеса, команды и собственной карьеры.

26–27 июня в Казани пройдёт ТАТАР САН — главная конференция Татарстана про искусственный интеллект и его практическое применение. Сбер выступает генеральным партнёром конференции и примет активное участие в деловой программе. Соберутся разработчики, дизайнеры, HR-спецы, руководители и все, кто хочет разобраться в главной трансформации последних лет.

В программе:

🔵Реальные кейсы внедрения ИИ от экспертов из Сбера, МТС, Альфа-Инвестиций и других компаний
🔵 Пять тематических треков: от трансформации ролей и найма до дизайна и инженерных практик
🔵 Хедлайнеры — Вячеслав Дубынин из МГУ и Владимир Пирожков из Сбера
🔵 Нетворкинг, конкурс «Королева кода» и афтерпати с секретными гостями на сцене.

Фиксируйте в календаре: 26 и 27 июня, Казань, ТАТАР САН. Вся программа и билеты на сайте конференции.

26–27 июня // ИТ-парк им. Б. Рамеева // Казань
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥32
Интересный релиз Qwen3.6-35B-A3B-StyleTune!

Эта мощная модель точечно перестраивает текст так, чтобы полностью убрать роботизированные клише и повторяющиеся тропы, при этом сохраняя рассуждение и логику Qwen3.6 на 100%.

https://huggingface.co/Gryphe/Qwen3.6-35B-A3B-StyleTune
🔥237
🚨 MICRON ОБЪЯВЛЯЕТ О СТРАТЕГИЧЕСКОЙ СДЕЛКЕ С ANTHROPIC

* Многолетнее соглашение по HBM, DRAM и SSD
* Совместная разработка памяти и хранилищ под нагрузки Claude
* Claude внедряется внутри Micron
* Micron инвестировала в раунд Anthropic Series H

Теперь Micron для Anthropic одновременно инвестор, клиент, партнёр и поставщик.
🔥19👍6💊54😁3🤗2🗿1
🔥 Три разных человека. Три разных проекта. Один и тот же подход.

— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес
— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска
— Аня без кода запустила AI-бота для изучения английского → первые ~$200 уже в 1 месяц

Разные результаты. Разный масштаб. Но общие правила:

1. не придумывать «гениальную идею», а брать существующий спрос
2. делать простой MVP и быстро запускаться
3. докручивать монетизацию и продукт по факту использования

Ребята сделали всё без команды, без инвестиций, а самое главное — без ожидания «идеального момента». Да, не у всех получается сразу. И не у всех выходит на $10K. Но если системно идти по схеме выше — появляется первый доход с продукта, а дальше уже есть что масштабировать.

В комьюнити разбираем такие кейсы регулярно: @its_capitan. Что сработало, что нет, и почему.

Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqusRoPF
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5🥴4🗿3👌2😴21
SpaceX подписала соглашение с open-source AI-стартапом Reflection AI на сумму до $6,3 млрд до 2029 года.

Reflection получит немедленный доступ к чипам Nvidia GB300 в дата-центре Colossus 2.

Платежи начнутся 1 июля 2026 года и составят $150 млн в месяц.

При этом любая из сторон сможет расторгнуть соглашение с уведомлением за 90 дней после первых трёх месяцев.

Также SpaceX уже заключила compute-соглашения с Anthropic, Google и Cursor.
🔥142👍2
Anthropic вместе с Frontend Masters выкатили бесплатный курс по Claude Code.

И это не поверхностный обзор, а нормальный разбор инструмента для тех, кто хочет реально прокачать вайбкодинг и работу с AI-агентами.

Курс ведёт Lydia Hallie из Anthropic.

Внутри:

• основы Claude Code
• skills
• hooks
• sub-agents
• MCP
• плагины
• Agent SDK
• продвинутые сценарии работы

Хороший вход для тех, кто хочет не просто “просить ИИ написать код”, а собирать нормальный рабочий процесс вокруг Claude Code.

Ссылка:
http://frontendmasters.com/courses/claude-code
🔥18👍65
GLM-5.2 набрала 22,8% на ARC-AGI-2 при стоимости $0,25 за задачу.

Важно отметить: примерно в мае 2025 года лучшие верифицированные модели на ARC-AGI-2 показывали всего около 3,0%.

То есть GLM-5.2 всё ещё сильно отстаёт от GPT-5.5 с результатом 85%, но при этом примерно в 7,6 раза превосходит лучший frontier-результат мая 2025 года.

И ещё она примерно в 7,5 раза дешевле за задачу, чем запуск GPT-5.5 за $1,87.

https://x.com/arcprize/status/2069845152773099854
🔥17
This media is not supported in your browser
VIEW IN TELEGRAM
Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.

Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.

🔗Выбирай удобный формат и регистрируйся по ссылке
 
📍Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
SpaceX и xAI постепенно превращаются в новоый Oracle.

Сообщается, что Reflection получит быстрый доступ к чипам Nvidia GB300 через SpaceX.

За это компания будет платить $150 млн в месяц, начиная с 1 июля 2026 года.

Если сделка продлится до 2029 года, её общая стоимость может достичь примерно $6,3 млрд.

У кого есть GPU, энергия и дата-центры, тот фактически становится новым облачным гигантом.

https://www.cnbc.com/2026/06/22/spacex-ai-colossus-data-center-reflection.html
6👍4🔥4
В Китае, по сообщениям, вырос чёрный рынок токенов для Claude.

Пользователям продают доступ почти на 93% дешевле, чем у Anthropic. Но такая скидка появляется не из воздуха.

Схема держится на трёх вещах.

Первая - дробление аккаунтов.

Продавцы массово создают платные аккаунты с большими лимитами и делят их между клиентами по часовым квотам. Один аккаунт превращается в пул для десятков или сотен пользователей.

Вторая - подмена модели.

Человек думает, что общается с Claude Opus, а на деле ему может отвечать более дешёвая Claude Haiku или вообще другая модель вроде Qwen.

Третья - перепродажа данных.

Самая опасная часть - логи чатов. Там могут быть код, документы, рабочие переписки, личные данные, пароли, API-ключи и коммерческая информация.

Эти данные могут уходить компаниям для обучения моделей или попадать к мошенникам. Дальше - спам, фишинг, шантаж и другие неприятные истории.

Всё это существует, несмотря на блокировку Claude в Китае.

Для обхода используют Transfer Stations - прокси-площадки, через которые чат-боты получают доступ к токенам. Поставщиков выбирают по цене, стабильности и аптайму.

Отдельная часть схемы - аккаунты и KYC. По сообщениям, для верификации используют купленные данные людей из бедных регионов Азии, Африки и Латинской Америки, а также синтетические AI-личности.

Трафик часто гонят через страны, где Claude доступен, например через Сингапур.

Ирония в том, что из-за таких схем маленький Сингапур внезапно стал одним из лидеров по использованию Claude на душу населения.

Главная мысль простая: подозрительно дешёвый доступ к топовой модели может стоить не $5.

Он может стоить ваших данных.

https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in
👍14🤣9🤔21😁1
🚨 Alibaba, как утверждается, не взламывала Claude.

Схема была другой - и куда опаснее.

По данным Anthropic, с 22 апреля по 5 июня 2026 года операторы, связанные с Alibaba/Qwen, создали около 25 000 фейковых аккаунтов и прогнали через Claude 28,8 млн диалогов.

Зачем?

Не чтобы просто пользоваться моделью.

А чтобы собрать её ответы и обучать на них свои системы.

Это называется model distillation.

Смысл простой: не нужно красть код модели. Достаточно массово задавать ей вопросы, сохранять ответы и потом учить другую модель повторять похожее поведение.

Anthropic называет это одной из крупнейших атак такого типа против компании.

И масштаб растёт.

Ранее Anthropic уже указывала на похожие случаи:

→ DeepSeek - 150 000 взаимодействий
→ Moonshot AI - 3,4 млн
→ Alibaba/Qwen - 28,8 млн

Разница уже не в процентах, а в порядке величин.

По версии Anthropic, цель таких схем - перенести возможности западных frontier-моделей в китайские системы быстрее и дешевле, чем обучать всё с нуля.

Именно поэтому история вышла за рамки обычной конкуренции.

После письма Anthropic в Сенат США тема быстро стала вопросом национальной безопасности. А доступ к самым продвинутым моделям вроде Mythos и Fable, по сообщениям, начали ограничивать.

Теперь это технологическая война, где «кража» может выглядеть не как взлом сервера, а как миллионы обычных запросов к чат-боту.

https://x.com/Polymarket/status/2069892570214179081
19🥱10👍6🔥4😢3
В показаниях Дарио Амодеи в Сенате в 2023 году есть кусок, который сейчас читается совсем иначе.

Он прямо писал, что государство может обязать все AI-модели проходить тесты и соответствовать стандартам до деплоя. И отдельно признавал, что такие правила могут привести к «существенному замедлению разработки AI».

То есть замедление не выглядит случайным побочным эффектом. В этой рамке оно становится допустимой ценой регулирования.

Амодеи писал, что открытые модели нормальны «до определённого масштаба». Но если достаточно мощная open-source модель становится доступной, плохие акторы могут её переиспользовать.

Для рынка это тревожный сигнал.

Как только открытая модель начинает приближаться к frontier-уровню и угрожать бенчмаркам закрытых лабораторий, её можно переопределить из исследовательского артефакта в объект национальной безопасности.

GLM 5.2, Qwen, DeepSeek, Llama, Mistral и любые будущие сильные open-weight модели попадают ровно в эту зону риска.

Закрытую модель можно ограничить API, KYC, rate limits, географией, контрактами и правительственными требованиями. Open-weight модель после релиза уже не вернуть обратно. Её скачали, скопировали, дообучили, запустили локально, разнесли по зеркалам.

С точки зрения регулятора это может выглядеть как «неконтролируемый экспорт frontier AI».

Поэтому следующий удар, вероятно, будет не по чат-ботам, а по инфраструктуре вокруг открытых моделей: доступ к весам, хостинг, compute, дата-центры, экспорт GPU, облачные аккаунты, публикация чекпойнтов.

Формально всё будет называться безопасностью цепочки поставок AI.

На практике это может стать механизмом, который отделит допустимый open source от слишком сильного open source.

https://x.com/AndrewCurran_/status/2070244303923007831
20🤔11👍3🤣32🤪2😁1😱1😢1
Google Cloud показал reference architecture для multi-tenant AI-агентов.

Смысл простой: в компании может быть много агентов для разных команд, но каждый должен видеть только свои данные, свои tools и свои правила доступа.

Архитектура строится по hub-and-spoke модели.

В центре - routing, IAM, security, логи и мониторинг.

По краям - отдельные tenant projects для бизнес-юнитов: поддержка, финансы, продажи, аналитика.

Запрос проходит через Load Balancer, Cloud Armor, IAP и Model Armor, затем уходит в нужный tenant.

Внутри tenant-а агент работает через Agent Runtime, ADK, MCP-серверы и свой datastore, например BigQuery или AlloyDB.

Ключевая деталь - изоляция.

Principal Access Boundary Policy не даёт агенту одного tenant-а лезть в данные другого.

Model Armor проверяет prompt injection, PII и опасный контент.

Это хороший шаблон для enterprise AI: не один общий агент на всю компанию, а управляемая система с границами доступа, аудитом и безопасностью.

Документация:
https://docs.cloud.google.com/architecture/multi-tenant-agentic-ai-system
8👍3🔥2