378K subscribers
4.36K photos
830 videos
17 files
4.85K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️

Модель 100 B параметров, но задействовано всего ≈6.1B активных, что делает модель очень экономной.

🚀 Чем хороша Ling-flash-2.0
- Обучена на более чем 20 триллионах токенов с до-обучением и RL-этапами.
- Демонстрирует state-of-the-art производительность среди плотных моделей до 40B параметров.
- Особенно хороша в сложном рассуждении, генерации кода и задачах с фронтендом.

⚙️ Архитектура и эффективность
- MoE-архитектура с активированием лишь части параметров (activation ratio 1/32).
- Много технических фишек: продвинутое распределение экспертов, баланс внимания, схема маршрутизации без вспомогательных потерь и др.
- На железе H20 модель генерирует 200+ токенов в секунду - в 3× быстрее по сравнению с плотной моделью 36B.
- Поддерживает контексты до 128K токенов (с YaRN).

https://huggingface.co/inclusionAI/Ling-flash-2.0

@ai_machinelearning_big_data


#moe #llm #ml #ai #opensource
👍32550👏26🔥21🎉16😁10🤩8🥰7😢5😍5🏆5
✔️ DeepSeek-R1: прорыв в обучении ИИ рассуждению без человеческих примеров

В журнале Nature опубликована работа о новой модели DeepSeek-R1, которая показывает, что LLM можно научить рассуждать без заранее подготовленных человеческих подсказок. Обычно для обучения таким системам используют «цепочки мыслей» — примеры пошагового рассуждения, составленные людьми. В DeepSeek-R1 от этого отказались: модель получает единственную награду — правильный конечный ответ.

Для обучения применили алгоритм Group Relative Policy Optimization (GRPO). С его помощью базовая версия, названная DeepSeek-R1-Zero, постепенно сама научилась стратегиям проверки своих решений, рефлексии и смены подхода в зависимости от задачи. Иными словами, система начала вырабатывать собственные приёмы мышления, а не копировать человеческие.

Результаты впечатляют. На математическом бенчмарке AIME точность выросла с 15% на старте до 78% после обучения, а с использованием механизма самопроверки — до 87%. Это выше среднего результата реальных участников. В задачах программирования и тестах по STEM-дисциплинам DeepSeek-R1 также обогнал сопоставимые по размеру модели и даже приблизился к гораздо более крупным системам. Более компактные версии, созданные методом дистилляции, сохраняют большую часть этих возможностей.

Есть и недостатки: модель иногда пишет менее читаемые ответы, смешивает языки и пока что хуже работает в областях за пределами логики и математики. Но сам подход доказывает: ИИ способен учиться рассуждать без дорогой и трудоёмкой разметки данных.

Этот прорыв открывает новый этап развития искусственного интеллекта. В будущем такие модели смогут самостоятельно находить эффективные пути решения задач, что особенно важно для науки, инженерии и образования. DeepSeek-R1 показывает, что «чистое подкрепление» может стать реальной альтернативой традиционному обучению с человеческими примерами.
nature

✔️ OpenAI и Google показали рекордные результаты на ICPC Programming Contest

Сразу две компании — OpenAI и Google — сообщили о победах на престижном международном соревновании по программированию ICPC. По данным инсайдов, их модели впервые показали уровень, сопоставимый с лучшими командами из людей, и даже превзошли их.

Команда OpenAI заявила, что их модель решила 12 из 12 задач. Из них GPT-5 с первой попытки справился с 11 заданиями, а самое сложное было закрыто с помощью ещё не представленной reasoning-модели, которая также направляла решения по другим задачам. Это фактически идеальный результат, который ранее был недостижим даже для лучших университетских команд.

Google выступил с собственным достижением: продвинутая версия Gemini 2.5 Deep Think решила 10 из 12 задач и, по заявлениям компании, справилась хотя бы с одной задачей, которую не смогла решить ни одна из команд людей. Это указывает на то, что новые архитектуры начинают находить нестандартные ходы, которые выходят за пределы привычного человеческого опыта.

Если данные подтвердятся, ICPC 2025 войдёт в историю как момент, когда модели искусственного интеллекта впервые официально обошли лучшие команды программистов-людей в соревновании мирового уровня. Это событие может стать переломным: теперь ИИ рассматривается не просто как ассистент, а как полноценный участник и даже лидер в задачах, требующих абстрактного мышления, алгоритмического анализа и математической строгости.

Такие достижения поднимают новые вопросы: стоит ли ИИ допускать к соревнованиям наравне с людьми, как использовать его для обучения программистов и где пройдёт граница между «человеческой» и «машинной» интеллектуальной работой. Одно ясно — в мире алгоритмов начинается новая эра, и ICPC стал её яркой отправной точкой.

✔️ IBM выпустила Granite-Docling-258M — «швейцарский нож» для работы с документами

IBM представила granite-docling-258M — компактную модель, которая совмещает несколько функций: это не только конвертер документов, но и система для вопросно-ответных задач по содержимому файлов. Модель поддерживает несколько языков и распространяется под лицензией Apache 2.0.
HF

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍118🤩59🔥2915😁10👏6🤗4🙏3🕊1💘1
🦠 AI научился создавать вирусы, убивающие бактерии

Учёные из Stanford и Arc Institute показали, что генеративные модели способны проектировать полноценные геномы вирусов. И не просто на бумаге - синтезированные последовательности успешно заразили бактерии.

🧬 Впервые ИИ доказал, что может предлагать не только отдельные мутации или белки, а целые геномные архитектуры с рабочими генами и правильным порядком их расположения.

Как это получилось:
- Обучили Evo-модель на 2 млн геномов фагов.
- Модель научилась распознавать закономерности, при которых генетический набор остаётся жизнеспособным.
- Вместо копирования известных решений ИИ предлагал новые комбинации: добавленные или усечённые гены, перемешанный порядок.
- Синтезированные цепочки внедрили в E. coli, и те показали классический результат заражения - «пятна» на бактериальной культуре.

Проектирование целых геномов - крайне сложная задача. Большинство случайных вариантов нежизнеспособны, ведь нужно учесть промоторы, кодирующие области, рамки считывания и правила упаковки.

🟠Что дальше:
- В краткосрочной перспективе такой подход может ускорить разработку фаготерапии и векторов для генной терапии.
- Но масштабирование до клеточных организмов будет намного сложнее - ДНК E. coli в 1000 раз больше, а запуск клетки с «голой ДНК» невозможен.

Один из авторов, студент Samuel King, предупреждает:
>
«У этой технологии огромный потенциал. Но любые эксперименты с опасными вирусами вроде оспы или сибирской язвы вызывают серьёзные опасения».


🟢 Подробнее: https://www.technologyreview.com/2025/09/17/1123801/ai-virus-bacteriophage-life/

@ai_machinelearning_big_data


#ai #ml #biotech
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤓96🔥48😨2614👍12🤔12👏6🕊2
🎓 ChatGPT для студентов

В одном месте собрано всё самое нужное в разделе “for Students”.

Это готовые промпты и чаты в ChatGPT, которые помогают учиться, готовиться к экзаменам и даже строить карьеру.

Что внутри:
- Более 100 готовых шаблонов для колледжа и университета.
- Категории: Учёба, Карьера, Жизнь.
- Практика: редактировать курсовые, делать конспекты, готовить планы к экзаменам.
- Карьера: советы по резюме, подготовка к собеседованиям.
- Организация: составление расписания и чек-листов.

🟠Попробовать можно здесь
https://chatgpt.com/use-cases/students

@ai_machinelearning_big_data


#ChatGPT #Students #Учёба
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24039🤔16🎉15🔥14😐10🤩6👌41😁1
🖥 Большая сделка $NVDA и $INTC

NVIDIA и Intel объявили о стратегическом партнёрстве сразу на несколько поколений продуктов.

NVIDIA инвестирует $5 млрд в акции Intel по $23.28 за штуку, а совместные решения будут объединять x86-CPU от Intel и RTX-GPU от NVIDIA через NVLink.

🔹 ПК
- Intel выпустит x86 SoC с интегрированными GPU-чиплетами NVIDIA RTX.
- Это даст более плотную связку CPU+GPU, чем PCIe (Peripheral Component Interconnect Express) - это высокоскоростная шина, которая используется для соединения различных компонентов компьютера)

🔹 Дата-центры
- Intel создаст кастомные x86-CPU специально для NVIDIA.
- NVIDIA будет предлагать клиентам выбор: ARM или x86 в своих AI-платформах.
- Это усиливает позиции NVIDIA и даёт Intel шанс вернуться в топ.

💰 Финансовая часть
- NVIDIA покупает пакет акций Intel на $5 млрд.
- Сделка - про продуктовую коллаборацию, а не про производство GPU на Intel Foundry.

⚡️ Почему это интересно:
- Windows-ПК могут превратиться в полноценные AI-машины.
- Для дата-центров появится выбор CPU-архитектуры, что расширяет рынок NVIDIA.
- Для Intel — шанс доказать, что её CPU могут конкурировать в ключевых сегментах на рынке.

Что остаётся за непонятным:
- Когда именно выйдут продукты и на каких процессах их будут делать.
- Детали NVLink: пропускная способность, топология памяти (DRAM HBM).
- Как будет выглядеть софт: CUDA/драйверы на Windows/x86, поддержка Linux.
- Как посчитают выручку: RTX-чиплеты в Intel-SoC и CPU в NVIDIA-платформах.

Это огромный плюс для Intel и стратегическое расширение для NVIDIA.

Если сделка произойдет, рынок ПК и дата-центров ждёт новая волна AI-систем.

А вот $AMD и $ARM теперь будет куда сложнее конкурировать.

После объявления о сделке акции Intel полетели вверх на безумные 30%.

@ai_machinelearning_big_data

#NVIDIA #Intel #NVDA #INTC #AI #GPU
Please open Telegram to view this post
VIEW IN TELEGRAM
👍77👨‍💻74🔥2917🤔13👏8🤬4
Media is too big
VIEW IN TELEGRAM
🤖 Demis Hassabis (Google DeepMind) о будущем робототехники

⦿ Гуманойдные формы могут оказаться ключевыми для повседневного и персонального использования — там, где среда создана под людей.
А вот специализированные роботы будут незаменимы на производстве и в лабораториях.

⦿ В ближайшие пару лет нас ждёт «вау-момент» в робототехнике.
Но фундаментальные модели пока требуют доработки: надёжности и более глубокого понимания реального мира.

⦿ DeepMind работает сразу в двух направлениях:
- как с Android для роботов — универсальный слой ОС, совместимый с любым роботом;
- и с вертикальной интеграцией - разработка конкретных роботов «под ключ».

Идея проста: скоро роботы будут не только на заводах, но и рядом с нами — а управлять ими станет так же привычно, как смартфоном.

🟢Полное интервью: https://www.youtube.com/watch?v=Kr3Sh2PKA8Y

@ai_machinelearning_big_data


#DeepMind #Google #DemisHassabis #Robotics
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔90👍3419👀9🎉8🤬3🔥2👏2
🎥 Ray3 — новая модель генерации видео от Luma AI

Это первая reasoning-модель для видео: она не только генерирует контент, но и «понимает» задачи, анализирует, исправляет себя и создаёт генерации студийного уровня.

Можно попробовать бесплатно в Dream Machine.

🔥 Что умеет Ray3:
- Черновой режим (Draft Mode) - позволяет быстро создавай креативы и генерирвать сцены, а потом выводить их в 4K HDR.
- Reasoning — модель хорошо понимает промпты и визуальные команды, строит логику движения и компоновки, умеет «думать» о том, что генерирует.
- Визуальные пометки - можно нарисовать стрелку или кружок на кадре, и Ray3 поймёт, куда двигать камеру или объект.
- Физика и реализм — симуляции движения, толпы, анатомия, свет, отражения, размытость в движении.
- HDR-видео — вывод в 10, 12 и 16-бит HDR с яркими цветами, деталями в тенях и бликах, экспорт в EXR для пост-продакшна.

🟠 Подробнее:
http://lumalabs.ai/ray3

@ai_machinelearning_big_data

#Ray3 #LumaAI #AIVideo #GenerativeAI #ReasoningAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍352🔥45😐3418🤔16👌13😍12👏9🎉8🤨6😴5
✔️ Google представил обновлённый Chrome с искусственным интеллектом, и теперь браузер перестаёт быть просто окном в интернет.

Главное новшество - Gemini внутри Chrome. Ассистент понимает, что у вас открыто, и помогает быстро найти нужное среди вкладок, упростить работу с большим количеством информации и не потеряться в хаосе открытых страниц.

Вторая фишка - AI прямо в адресной строке. Больше не нужно открывать отдельный поиск: теперь можно задать вопрос прямо в omnibox и сразу получить осмысленный ответ, а не просто список ссылок.

Еще ИИ анализирует сайты и предупреждает о подозрительных страницах, защищает пароли и блокирует спам-уведомления, делая интернет-серфинг заметно безопаснее.

Пока обновление доступно только в США на Windows и Mac, и работает на английском языке. Но уже очевидно, что Google планирует расширить географию и языковую поддержку.
Google

✔️ DeepMind открыла новый путь в изучении загадок гидродинамики

Учёные из Google DeepMind применили искусственный интеллект, чтобы разобраться с задачами, над которыми математики спорят уже больше века. Речь идёт о «сингулярностях» - моментах, когда уравнения движения жидкости начинают давать бессмысленные ответы вроде «бесконечной скорости» или «бесконечного давления».

Такие сбои возникают, например, в уравнениях Буссинеска (описывают движение тёплой или холодной жидкости, учитывая разницу в плотности) и IPM-уравнениях (движение жидкости в пористых материалах). Эти модели помогают объяснять процессы от океанских течений до фильтрации нефти, но давно оставались загадочными.

С помощью нейросетей PINNs (Physics-Informed Neural Networks) исследователи нашли новые типы этих «сбоев» и закономерности в том, как они развиваются. Точность вычислений оказалась почти идеальной - сравнимой с машинными расчетами.

Главный вывод: ИИ может стать инструментом для решения фундаментальных проблем физики и математики, включая знаменитые уравнения Навье-Стокса, за разгадывание которых назначена премия в миллион долларов.
Deepmind

✔️ Compute as Teacher: новый способ обучать модели без «правильных ответов»

Исследователи представили метод Compute as Teacher (CaT), который позволяет улучшать языковые модели, даже если у задачи нет готового эталонного ответа.

Идея проста - вместо того чтобы искать «истину», модель сама становится своим учителем. Для этого она многократно решает одну и ту же задачу, создавая разные варианты ответа. Затем специальный механизм выбирает из этих вариантов наиболее обоснованный - и использует его как новую цель для обучения.

Метод работает в двух сценариях. Для задач, где результат можно проверить программно (например, в математике), CaT автоматически оценивает правильность. Для более сложных случаев используется другая LLM-судья, которая задаёт правила оценки (rubrics).

Результаты впечатляют: точность на математическом бенчмарке MATH-500 выросла на +27%, а на HealthBench - на +12%. В дообученной версии CaT-RL улучшения достигли +30–33%.

Главное - CaT снижает зависимость от больших размеченных датасетов и открывает путь к более универсальному и доступному обучению моделей. Это шаг к тому, чтобы ИИ сам помогал себе становиться умнее.
alphaxiv

✔️Команда Magistral представила обновлённые версии своих моделей — Magistral Small 1.2 и Magistral Medium 1.2.

Это эволюция прошлой линейки 1.1 с акцентом на мультимодальность и практическую производительность.

Теперь модели умеют работать не только с текстом, но и с изображениями благодаря встроенному vision-энкодеру.
Рост точности прирост +15% на бенчмарке по математике и коде (AIME 24/25 и LiveCodeBench v5/v6).

Улучшена работа с веб-поиском, интерпретатором кода и генерацией изображений.
Стиль ответов - более естественный тон, ясность изложения и улучшенное форматирование.

Magistral продолжает развивать свои открытые модели, предлагая всё более удобные и универсальные инструменты для работы с текстом, кодом и картинками. Обновление 1.2 делает их ещё ближе к «швейцарскому ножу» в мире ИИ.
HF

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14543🔥28🥰11👏5🤩5🤬2🦄2😁1🤔1🎉1
🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization

Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch.

• Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов
• Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы
• Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности)
• robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM

Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях ❗️

Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные.

К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться.

Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике.

🟢Github: https://github.com/SakanaAI/robust-kbench
🟢Статья: https://arxiv.org/abs/2509.14279

@ai_machinelearning_big_data


#AI #CUDA #PyTorch #SakanaAI #LLM #Optimizatio
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍139🤔10425🔥16🤩12🎉10👏5😢4💘1😎1
🧬🤖 Paper2Agent: оживляем научные статьи
Open-source инструмент от исследователей из Stanford, который превращает статические статьи в интерактивных AI-ассистентов.

📌 Как это работает:
- Paper2MCP анализирует статью и её код( если есть), извлекает ключевые методы и превращает их в инструменты внутри MCP-сервера.
- Agent layer подключает этот сервер к чат-агенту (например, Claude Code или Chatgpt).

Поле чего, у каждой статьи появляется свой ИИ-ассистент, который:
- объясняет папиру на простом языке;
- запускает код без ручного копания в репозиториях, зависимостях и API-ключах;
- объединяет данные и пайплайны из разных работ.

Каждый MCP-сервер включает:
- Tools — функции (например, прогноз изменения экспрессии генов).
- Resources — текст, код, датасеты.
- Prompts — шаблоны для пошаговых сценариев.

Фактически Paper2Agent помогает конвертировать научные работы в полноценные рабочие инструменты.


Чтобы повторить методы их статьи, приходилось вручную ставить окружения, импортировать десятки модулей и гадать с входными данными. Paper2Agent позволяет это сделать через диалоговый интерфейс.

🟠Github

@ai_machinelearning_big_data


#ai #ml #aiagent
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍239🔥78🤩5531👏11🎉10🙏9😐6🥰5🤔4💯2