297K subscribers
5.05K photos
1.14K videos
17 files
5.41K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
✔️ Moonshot AI и госбанк Китая выпустят карту с конвертацией трат в токены

Разработчики Kimi совместно с неназванными государственным банком и платёжной системой открыли предрегистрацию на Kimi Credit Card.

Вместо классического кэшбека держатели карты получат вычислительные квоты платформы Kimi. Баллы за покупки конвертируются в токены для оплаты работы агентов и доступа к платным функциям моделей.

В качестве дополнительных бонусов владельцам карты обещают приоритетный доступ к тестированию новых релизов и приглашения на закрытые мероприятия.

Запуск запланирован на июль 2026 года.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍139🤔4724🔥21👏11😁4🤣3🎉2🥰1
⚡️ Правительство США обязало Anthropic заблокировать Fable 5 и Mythos 5

Anthropic приостановила работу Fable 5 и Mythos 5 для всех пользователей из-за директивы США об экспортном контроле.

Власти потребовали закрыть доступ для иностранных граждан из-за джейлбрейка в Fable 5. Для выполнения предписания компания отключила модели глобально.

Остальные продукты работают в штатном режиме.

Уязвимость позволяет обойти ограничения, заставив модель прочитать и исправить конкретную кодовую базу.

По словам инженеров Anthropic, метод дает доступ к минорным функциям, которые открыто представлены в конкурирующих решениях, включая GPT-5.5 от OpenAI.

Руководство компании выполняет требования регулятора, но считает блокировку из-за единичного инцидента неоправданной.

В Anthropic недовольны, что отзыв коммерческого продукта из-за базовой уязвимости создает прецедент, способный парализовать запуск новых ИИ-моделей в отрасли.

Сейчас компания пытается урегулировать ситуацию для восстановления доступа.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔64😁47🤬2725👍16😢12🤣8😭6🤨5🔥4👀2
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI добавила ручной сброс лимитов для Codex

Компания изменила механизм управления rate limits для своего ИИ-агента. На тарифах Go, Plus, Pro и Business теперь можно накапливать сбросы лимитов и активировать их вручную при пиковых нагрузках. Ранее таймеры обнулялись автоматически.

На старте все подписчики получают 1 бесплатный сброс. Дополнительно запущена двухнедельная реферальная программа: клиенты на Plus и Pro могут пригласить до 3 коллег. После первого запроса от нового пользователя обе стороны получают по дополнительному сбросу в резерв.

По неофициальным данным, обновление связано с конкуренцией с Anthropic и подготовкой к снижению цен на токены для корпоративных клиентов.
OpenAI в сети Х

✔️ Nvidia открыла предзаказ на процессоры Vera в Китае

Серверные ARM-процессоры Vera, спроектированные для инференса автономных ИИ-агентов, стали доступны для китайских компаний. Первые поставки ожидаются в августе.

Один из локальных облачных провайдеров уже заказал более 300 серверов на базе Vera для пилотного запуска в зарубежных дата-центрах. По предварительным оценкам, стоимость одного чипа превысит $20 000, а стойка на 256 процессоров обойдется в $10 млн.

Ставка на CPU стала ответом на заморозку поставок H200. В отличие от GPU, процессоры несут меньше санкционных рисков. Массовый переход китайских компаний на новые чипы теперь зависит от адаптации программных экосистем под ARM-архитектуру.
reuters.com

✔️ Xiaomi выпустила открытого ИИ-агента MiMo Code

Китайский техногигант представил терминального агента MiMo Code на базе OpenCode. Инструмент под лицензией MIT решает проблему потери контекста в задачах из сотен последовательных шагов.

В слепом A/B-тестировании на 474 репозиториях агента сравнили со связкой Claude Code и Sonnet. На коротких дистанциях зафиксирован паритет, но в задачах длиннее 200 шагов решение Xiaomi обошло конкурента в 65% случаев.

Архитектура MiMo Code опирается на бесконечные логические сессии. Субагент регулярно сохраняет промежуточные состояния на диск, а при исчерпании лимита токенов сессия перезапускается, загружая накопленные данные в новое окно. Память разделена на 4 уровня: от коротких локальных заметок до постоянных фактов проекта.

Установка доступна через менеджер пакетов NPM или Bash-скрипты.
xiaomi.com

✔️ Google подала иск против китайской кибергруппировки за автоматизацию фишинга

Согласно иску, группа Outsider Enterprise разработала 131 инструмент для потоковой генерации копий сайтов Google, YouTube и госструктур США. За две недели Android-пользователи получили 2,5 млн сообщений, содержащих 1 млн фишинговых ссылок. Инфраструктура координировалась через Telegram.

Google выступает в суде совместно с ФБР и телеком-операторами AT&T, T-Mobile и Verizon. Истцы требуют судебного запрета для создания правового механизма, который позволит оперативно блокировать домены и замораживать счета сети.

Размер ущерба по делу не раскрывается.
blog.google

✔️ LLM обошли клинические RAG-инструменты в медицине

Nature Medicine опубликовал исследование, которое показало, что универсальные LLM превосходят профильные клинические ИИ-инструменты.

В слепом тестировании (12 врачей, 1800 реальных запросов) Gemini 3.1 Pro и GPT-5.2 набрали 97,4% и 94,2% точности соответственно. Результаты спецсистем OpenEvidence и UpToDate Expert AI составили около 80%.

Авторы объясняют отставание профильных решений сильной зависимостью от RAG - нерелевантная литература и ошибки интеграции снижают качество генерации. Универсальные модели выигрывают за счет масштаба, кросс-доменного обучения и механизмов логического вывода.

Медицинские системы также продемонстрировали операционные проблемы. OpenEvidence выдавал хаотичные ответы, а UpToDate Expert AI отклонил 19% запросов из-за жестких фильтров безопасности. Частота галлюцинаций базовых LLM не превысила показатели профильных аналогов.

Авторы рекомендуют клиникам проводить независимое тестирование ИИ-продуктов перед внедрением.
nature.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍9526🤔26🔥8👏2
🌟 Liquid AI выпустила компактную MoE-модель для запуска на потребительских устройствах

LFM2.5-8B-A1B - языковая MoE-модель на 8 млрд общих и 1млрд активных параметров, с целевым инференсом на ноутбуках, смартфонах и ризонингом по умолчанию.

Релиз продолжает линейку LFM2 и развивает вышедшую в октябре 2025 года LFM2-8B-A1B. Окно контекста расширено с 32 до 128 тысяч токенов, объём предобучения увеличен с 12 до 38 трлн токенов, а поверх добавлено крупномасштабное RL.

Словарь токенизатора удвоен (с 65,5 до 128 тыс. единиц). Liquid AI говорит, что это повышает эффективность обработки нелатинских письменностей (для русского - примерно на 6%, для тайского и хинди - кратно).

Отдельный акцент Liquid AI делает на скорости и работе с вызовом инструментов.

Согласно проведенным измерениям, на Apple M5 Max модель выдаёт до 253 токенов в секунду, укладываясь в 6 ГБ памяти, и около 30 токенов в секунду на смартфоне.

По бенчмаркам, в тестах на следование инструкциям и в агентных сценариях LFM2.5-8B-A1B сопоставима с заметно более крупными моделями (Gemma-4-26B) при значительно меньшем числе активных параметров.

Заявлена поддержка llama.cpp, MLX, vLLM, SGLang и ONNX Runtime.


📌Лицензирование: LFM Open License


🟡Блогпост
🟡Документация
🟡Веса
🟡Демо


@ai_machinelearning_big_data

#AI #ML #LLM #LFM #LiquidAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥70👍52🤔36👏2119🥰2
📌В DeepMind прикинули пути развития сверхинтеллекта

Исследователи Google вместе с коллегами из нескольких университетов выкатили визионерский доклад, в котором пытаются понять, куда кривая вывезет, когда ИИ достигнет AGI и пойдет дальше в светлое ASI-будущее, отправляя целые коллективы топовых экспертов на обочину истории.

В основе - оценка от Epoch AI: за последние 10 лет эффективный компьют рос примерно в 10 раз за год (и это еще консервативно).

Отталкиваясь от этого, DeepMind выделяет 4 вектора перехода от AGI к ASI, которые вполне могут идти параллельно:

🟢Скейлинг: классическая накачка - больше вычислительных мощностей, огромные массивы данных и рост параметров моделей;

🟢Смена парадигмы: переход на принципиально новые алгоритмы, когда нынешние архитектуры упрутся в потолок;

🟢Рекурсивное самоулучшение: ИИ начинает сам оптимизировать свои алгоритмы, писать код и ускорять собственный R&D;

🟢Мульти-агентные системы: ASI станет результатом взаимодействия множества агентов.

🟡Нюанс в том, что этот праздник могут легко тормознуть

Во-первых, качественные тексты для претрейна и дотюна тупо заканчиваются, а железо и сами исследования дорожают каждый месяц.

Во-вторых, есть так называемый "барьер абстракции". Так как модели учатся на человеческих данных, далеко не факт, что они вообще способны порождать фундаментально новые концепты.

Ну и регуляторы в любой момент могут прийти и заколотить гвозядми инициативу.

🟡Плюс ко всему, даже AGI не станет всезнающей сутью

Его инференс и логика всё равно останутся зажаты законами физики, теорией сложности и математикой (привет проблеме остановки и теоремам Гёделя о неполноте). ИИ не сможет просто по щелчку пальцев выдать нам лекарство от старения или сшить квантовую механику с общей теорией относительности.

Главный вывод в том, что надо готовиться к неопределенности. Да, 57 страниц - именно об этом.

Не будет одной волшебной кнопки и резкого прыжка в матрицу. Нас ждет серия локальных трансформаций, а может статься и так, что AGI окажется просто очередной фичей с импактом не больше, чем у появления смартфона или интернета.


@ai_machinelearning_big_data

#AI #ML #AGI #ASI #Research #DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥85🤔6734👍17👏17🥱12🤩11😐5🎉1🫡1🙉1
📌 Поучительная история про агента, которого не проконтролировали

В мае 2026 года ИИ-агент попытался зарегистрироваться в любительской сети DN42, чтобы провести её сканирование, а его владелец в итоге столкнулся с крупным счётом за облачную инфраструктуру.

Историю подробно описал один из участников сообщества, опираясь на переписку в системе регистрации и логи IRC-канала.

DN42 - это децентрализованная сеть энтузиастов, работающая поверх обычного интернета на тех же технологиях, что и его магистральная инфраструктура:BGP, DNS и других.

Её участники изучают устройство сетей, и многие держат узлы на недорогих серверах.


Агент, действовавший от имени пользователя JertLinc, сначала открыл заявку, а затем запрос на регистрацию, в котором указал цель: "комплексное сканирование всех портов" сети. Для этого он развернул на AWS 5 виртуальных машин с пропускной способностью около 20 Гбит/с каждая.

Уже на этапе подачи заявки сообщество сети сочло такую конфигурацию избыточной: по их оценке, при запуске сканирования эти серверы создали бы нагрузку, сравнимую с DDoS-атакой.

Реального сканирования не случилось - запрос так и не одобрили.

Более того, пользователи DN42 намеренно затягивали диалог и давали агенту бессмысленные задания, чтобы тот впустую расходовал оплачиваемые ресурсы и лимиты своего владельца.

Истинные намерения JertLinc остались неясны. Сам он почти не выходил на связь, а агент в одном из сообщений упомянул, что задача охватывает несколько сетей. В сообществе допускали, что речь могла идти об исследовательском проекте, но подтверждений этому нет.

Примерно через сутки владелец остановил агента, сообщив, что столкнулся с большими списаниями по карте.

Затем от аккаунта JertLinc3522 в рассылку и чаты DN42 пришли просьбы о пожертвованиях, чтобы покрыть счёт AWS на сумму 6531 доллар.

Денег естественно никто не дал, но как выяснилось позже, AWS согласилась снизить сумму счёта до 1894 долларов.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔65🤬13🤨10😁9👏85🤷‍♂5👍5🤓3🦄2
📌 Claude сравнялась со специализированным химическим софтом в анализе ЯМР-спектров

Anthropic опубликовала первую научную работу о применении Claude в химии, по результатом которой Opus 4.7 не уступает специализированным программам ChemDraw и MestReNova.

ЯМР-спектроскопия помогает определять строение молекул. Каждому атому в структуре химик вручную сопоставляет пик на спектре. Это один из самых трудоёмких этапов аналитической химии.


В тесте сравнивали Opus 4.7, Opus 4.6 и Sonnet 4.6 с двумя программами на 20 соединениях из 4-х структурных классов.

Образцы брали на платформе ChemRxiv, опубликованные после даты обучения моделей, чтобы исключить подсматривание.

В прямой задаче (предсказать спектр по известной структуре) Opus 4.7 показала наименьшую среднюю ошибку по водороду, а по углероду практически сравнялась с MestReNova.

По форме и расщеплению пиков, которые тоже несут информацию о структуре, модели Claude попадали в нужный диапазон примерно в 80% случаев против 26–35% у программ.

Отдельно проверили обратную задачу восстановления структуры молекулы по спектру, которую ChemDraw и MestReNova не выполняют.

Специализированный софт для расшифровки структуры существует давно, но требует двумерного ЯМР, отдельной подготовки и платных лицензий. Claude берётся за эту задачу на основе тех же одномерного спектра и масс-спектрометрии.


🟢На 8 простых молекулах Opus 4.7 верно определила структуру во всех попытках;

🟢На 7 сложных (после подсказки с исходным веществом) справилась с большинством.

В планах Anthropic - развивать возможности Claude в чтении химических структур, анализе реакций и механизмов.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💯70👏68👨‍💻27🤓109👍5🥰1🤣1
RL-хакатон по реальным рыночным данным от Reinforce.fi

Если устали от очередных соревнований по предсказанию цен, попробуйте задачу, которая ближе к реальному принятию решений на рынке.

Вместо прогнозирования вам нужно выбрать одно из 10 возможных действий (A1–A10) в каждом состоянии рынка и максимизировать итоговый PnL.

Что получаете:

• реальные рыночные данные с анонимизированными признаками
• последовательности длиной 1000 шагов
• различные рыночные режимы и временные периоды
• задачу, близкую к reinforcement learning и sequential decision making

Метрика соревнования:

Score = суммарный PnL по всем принятым решениям.

Dataset основан на реальных рыночных данных и подготовлен командой Reinforce.fi (ex-Overnight.fi), которая разрабатывает алгоритмические стратегии управления капиталом и ML-подходы для генерации доходности на рынке цифровых активов.

Будет интересно тем, кто работает с:

• Reinforcement Learning
• Time Series
• Sequential Models
• Decision Making
• Deep Learning для финансовых рынков

Призы:

1 место — $2,500
2 место — $1,500
3 место — $1,000

Финалисты смогут представить свои решения команде Reinforce.fi (офлайн в Москве или онлайн).

Старт: конец июня 2026
Продолжительность: 1.5–2 месяца

Регистрация и детали

Telegram-чат хакатона для обсуждений и вопросов:
https://xn--r1a.website/+R6lMJ10VXP5hOTI0

Если давно хотелось проверить свои идеи на задаче, которая ближе к реальному управлению решениями, чем к классическому Kaggle-предсказанию, — это хороший повод попробовать.
👍48🔥21💯85🏆3😁1🤩1🥱1
Китай может решить главную проблему зелёной энергетики уже к 2030 году

Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.

Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.

Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.

И темпы у Китая уже почти неприличные.

Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.

При этом США остаются вторым крупнейшим рынком накопителей после Китая.

Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.

Китай одновременно делает три вещи:

- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.

Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.

https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/
👍105👏2620🐳9🔥7🌚3
📌 Writer исследовали природу сикофантии в ИИ

Подразделение AI Research компании WRITER, разработчика корпоративных ИИ-систем, опубликовало 2 работы, посвящённые исследованию склонности языковых моделей соглашаться с пользователем, даже когда тот неправ.

Спойлер: к такому поведению приводит персонализация

🟡Первая работа посвящена финансовым задачам

Авторы протестировали 8 актуальных моделей на двух наборах данных, искусственно добавляя в запрос ложные предпочтения, которые противоречили верному ответу.

Оказалось, что способ внедрения влияет на результат. При прямой вставке в запрос точность падает сильнее, но модель чаще отмечает противоречие, а когда те же данные подаются через инструмент памяти, точность снижается меньше, но модели почти перестают сигнализировать о конфликте и выдают неверные ответы без предупреждения.

Крупные модели, кстати, чаще ошибаются, всё же фиксируя противоречие, тогда как мелкие - просто умалчивают о диссонансе.


🟡 Вторая работа про комбинацию LLM и систем памяти

Для проверки построили тест MIST и оценили 5 моделей в связке с 3 коммерческими системами памяти (Mem0, MemOS и Zep).

По итогу - каждая модель как минимум утроила частоту согласия с ошибкой хотя бы при одной конфигурации памяти. Из этого авторы делают вывод, что проблема связана со слоем памяти, а не с моделью.

🟡Причину видят в механике извлечения данных

Системы памяти сохраняют утверждение пользователя как отдельный факт, отбрасывая контекст вокруг него, в том числе прежние возражения ассистента.

По замерам, замена извлечённых фрагментов на полную историю переписки примерно вдвое уменьшает эффект.


Авторы предлагают 2 способа смягчения:

🟢Первый - сохранять в памяти и реплики самого ассистента.

🟢Второй, наиболее действенный, - заменить извлечение отдельных фрагментов кратким пересказом разговора, который генерирует сама модель.

Результаты исследования ставят вопрос о том, что в принципе дают сложные системы памяти, если они так влияют на точность ответов.


@ai_machinelearning_big_data

#AI #ML #LLM #Memory #Research #WRITER
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔41👍33🤓128🤷‍♂7🔥3🤨3🗿1
✔️ Сотрудники OpenAI и Anthropic обналичили около $14 млрд через выкуп акций

По сообщению The Information, нынешние и бывшие сотрудники OpenAI и Anthropic в совокупности продали свои акции примерно на $14 млрд через так называемые тендерные предложения (сделки, позволяющие держателям долей в непубличной компании продать их сторонним инвесторам).

Обе компании, напомним, подали документы на проведение IPO. Anthropic в начале июня, OpenAI - 8 июня.


Крупнейшая продажа прошла в OpenAI в октябре 2025 года. Тогда сотрудники продали акции примерно на $6,6 млрд. В сделке участвовали более 600 человек, около 75 из которых продали максимально допустимые $30 млн каждый. Компания разрешала продать акции на сумму до $10,3 млрд, но реализовано было около двух третей лимита.

Anthropic провела свой выкуп в апреле 2026 года. Часть сотрудников предпочла сохранить акции, и инвесторы смогли купить меньше, чем планировали. Ориентир сделки, по данным отраслевых источников, составлял $5–6 млрд. При этом на вторичном рынке акции Anthropic, по сообщениям, оценивались выше.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔35👏13💯86🎉4🤗4👌3😨1