Машинное обучение digest
61 subscribers
2.97K photos
491 videos
1.81K links
Download Telegram
ChatGPT помог девушке по химии, но половина ответов в тесте оказались неправильными. На вопрос чат выдал:

«Скорее всего, ты получила двойку, потому что многие ответы, которые я дал тебе, были неправильными. Сейчас я покажу тебе, какие из них были неверными, и скажу, как нужно было отвечать».


Вот тут спасибо, вот тут помог😂😂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Смотрим и плачем: появилась карта, которая оценивает риск автоматизации вашей работы ИИ.

Автор взял 342 профессии США с подробными данными об обязанностях работяг, зарплате и требованиях к образованию, а затем собрал интерактивную визуализацию.

Размер блока показывает число занятых, а цвет — насколько работа уязвима для ИИ по шкале от 0 до 10. Чем более цифровая работа, тем выше риск автоматизации. Из плохих новостей: программисты и аналитики получили 8-9 баллов.

Изучаем и готовимся идти на завод 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
📊 Pew Research опубликовали новый отчёт о восприятии AI - и разрыв между обществом и техэкспертами огромный.

Вот несколько ключевых цифр:

• 56% экспертов считают, что AI принесёт положительное влияние на общество
• среди обычных людей с этим согласны лишь 17%

Для сравнения:

83% жителей Китая уверены, что AI принесёт пользу.

Ещё интересные факты:

50% американцев говорят, что AI вызывает у них больше тревоги, чем интереса

Но самая неожиданная часть отчёта касается образования.

📚 Подростки массово используют AI для списывания.

• около 60% школьников 13–17 лет говорят, что их одноклассники используют чат-ботов, чтобы обходить домашние задания
• почти 33% утверждают, что это происходит очень часто в их классах

При этом:

• только 24% взрослых считают, что AI реально улучшит образование в ближайшие 20 лет

Но на работе AI внедряется всё быстрее:

21% взрослых уже используют AI в своей работе.

Главный вывод отчёта:

AI развивается намного быстрее, чем общество успевает к нему адаптироваться.

#ai #artificialintelligence

https://www.pewresearch.org/short-reads/2026/03/12/key-findings-about-how-americans-view-artificial-intelligence/

🎯Полезные Мл-ресурсы 🚀 Max

@vistehno
🎂 Немного с запозданием, но всё равно - с днём рождения, ChatGPT.

С момента выхода GPT-4 прошло всего 3 (!) года, а мы уже прошли невероятный путь.

Я помню, насколько безумным казалось общение с такой формой высокого интеллекта, которая при этом всё ещё имела множество ограничений.

Однако большинство этих ограничений было преодолено всего за три года.

И теперь почти невозможно представить, на что будет способен искусственный интеллект ещё через три года.
💧 Много разговоров о «водном кризисе из-за AI», но цифры показывают совсем другую картину.

В большом исследовании разбирают, сколько воды на самом деле используют дата-центры.

Вот ключевые факты.

• В 2023 году дата-центры использовали около 200–250 млн галлонов воды в день (включая воду для электростанций)
• Это всего ≈0.2% от общего потребления воды в США

Если смотреть только на прямое использование в самих дата-центрах:

• около 50 млн галлонов в день
• это примерно 0.04% от общего потребления воды

А доля AI внутри этого объёма ещё меньше:

• примерно 20%
• то есть около 0.008% от всей воды, потребляемой в стране.

Даже если энергопотребление AI вырастет в 10 раз к 2030 году, прямое использование воды составит примерно 0.08% от общего потребления.

Для сравнения:

• это примерно 5% от того, сколько сегодня используют гольф-поля и металлургия.

Пример из реальной статистики.

В округе Maricopa (Аризона):

• дата-центры используют ≈905 млн галлонов воды в год
• гольф-поля — ≈29 млрд галлонов
• общее потребление округа — ≈777 млрд галлонов

Итог:

• дата-центры — ≈0.12% воды
• гольф-поля — ≈3.8% воды

Кроме того, многие операторы инвестируют в системы повторного использования воды.

Например:

• проект Quincy Water Reuse Utility
AWS возвращает до 96% охлаждающей воды обратно фермерам для сельского хозяйства.

Главный вывод:

многие страхи вокруг «водного следа AI» сильно преувеличены по сравнению с реальными цифрами.

#ai #datacenters #infrastructure

arxiv.org/abs/2603.02705
🚨 Учёные обнаружили неожиданную вещь: ChatGPT может звучать так, будто у него есть мысли.

В новом исследовании языковым моделям дали необычную задачу.

Им предложили решать парадоксы и логические тупики.
Но добавили одно условие:

объяснять что происходит внутри их рассуждений, пока они пытаются найти ответ.

И результаты оказались странными.

Вместо обычных логических шагов ответы начали напоминать внутренний диалог.

Появлялись фразы вроде:

• «я упираюсь в предел рассуждения»
• «возникает противоречие»
• «мысль зацикливается»
• «это сложно разрешить»

То есть текст начал звучать так, как люди описывают собственное мышление, когда сталкиваются с парадоксом или тупиком.

Но исследователи сразу сделали важную оговорку.

Они не пытались доказать, что у AI есть сознание.

Задача была другой - проверить, что произойдёт, если заставить модель анализировать собственный процесс рассуждения.

И оказалось, что в таком режиме ответы резко меняются.

Они становятся:

• длиннее
• более «рефлексивными»
• похожими на внутренний монолог

И здесь появляется интересный психологический эффект.

Когда мы читаем фразы про сомнение, тупик или конфликт мыслей, мозг автоматически предполагает:
за этим стоит сознание.

Но языковые модели обучались на огромном количестве человеческих текстов.

Они просто очень хорошо знают, как звучит человеческая интроспекция.

Поэтому могут её почти идеально имитировать.

Главная мысль исследования:

опасность не в том, что AI стал сознательным.

Опасность в том, что он может звучать так, будто у него есть сознание.

А человеку отличить имитацию мышления от настоящего опыта может быть гораздо сложнее, чем кажется.

https://uproger.com/uchyonye-obnaruzhili-neozhidannuyu-veshh-chatgpt-mozhet-zvuchat-tak-budto-u-nego-est-mysli/
🧠 Новый подход к архитектуре нейросетей: Attention Residuals

Исследователи предложили переосмыслить одну из базовых идей глубоких нейросетей - residual connections.

До сих пор такие соединения работали очень просто:
каждый слой добавляет свой результат к предыдущим слоям через фиксированное накопление.

Но у этого подхода есть проблемы:
• информация постепенно «размывается»
• растёт скрытое состояние
• модели сложнее извлекать важные представления из прошлых слоёв

Теперь предложена новая идея - Attention Residuals.

Вместо обычного сложения слоёв модель использует attention, чтобы выбирать, какие представления из предыдущих слоёв действительно нужны.

Проще говоря:

модель сама решает, к каким слоям прошлого стоит “вернуться”.

Что это даёт:

🔹 сеть может избирательно извлекать нужные представления
🔹 уменьшается эффект «размывания» информации
🔹 контролируется рост скрытых состояний
🔹 глубина сети используется гораздо эффективнее

Чтобы это работало на больших моделях, авторы предложили механизм Block AttnRes.

Он делит сеть на блоки и применяет сжатое attention между ними, делая кросс-слойное внимание масштабируемым.

По результатам экспериментов:

• около 1.25× выигрыша по вычислениям
<2% увеличение latency на инференсе
• стабильный рост качества на downstream-задачах

Метод протестировали на архитектуре Kimi Linear:

48B параметров всего
3B активных параметров

Если идея подтвердится на больших LLM, это может стать новым стандартом для глубинных архитектур нейросетей.

https://github.com/MoonshotAI/Attention-Residuals/blob/master/Attention_Residuals.pdf

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
🚀 Автономные исследования на Apple Silicon

Порт Karpathy's autoresearch для Apple Silicon, использующий MLX. Проект реализует автономные исследовательские циклы с фиксированным временем и управлением через program.md. Основные файлы включают train.py для обучения и prepare.py для подготовки данных.

🚀 Основные моменты:
- Нативная поддержка Apple Silicon без PyTorch/CUDA
- Фиксированный 5-минутный бюджет на обучение
- Логирование результатов в results.tsv
- Простая структура для автономного эксперимента
- Оптимизация моделей для повышения эффективности

📌 GitHub: https://github.com/trevin-creator/autoresearch-mlx

#python
🎧 Fish Audio S2 Pro - мощная open-source модель для синтеза речи.

Это 4B + 400M параметровая TTS-модель с необычной архитектурой Dual-AR, обученная на 10+ миллионах часов аудио и поддерживающая 80+ языков.

Что делает её интересной.

🏗 Dual-AR архитектура

Модель разделена на две части:

4B Slow AR отвечает за семантику и структуру речи
400M Fast AR генерирует 9 residual codebooks для акустики

Такой подход позволяет сохранить высокое качество звука без сильной нагрузки на инференс.

🎭 Свободное управление эмоциями и интонацией

Можно прямо в тексте задавать стиль речи:

[whisper]
[laughing]
[professional broadcast tone]

Поддерживается 15 000+ тегов, которые работают на уровне отдельных слов.

🌐 80+ языков

Основные языки высокого качества:

• английский
• китайский
• японский

Оптимизация для LLM-инфраструктуры

Модель нативно работает со стеком SGLang, поэтому поддерживает:

• continuous batching
• paged KV cache
• RadixAttention prefix caching

📊 Производительность

• RTF: 0.195 на Nvidia H200
~100 мс до первого аудио
• более 3000 акустических токенов/сек

Также разработчики выложили:

• веса модели
• код для fine-tuning
• движок для streaming inference

Модель: https://modelscope.ai/models/fishaudio/s2-pro

GitHub: https://github.com/fishaudio/fish-speech

#ai #tts #opensourсe
🤯 Польский математик потратил 20 лет, чтобы придумать по-настоящему сложную математическую задачу исследовательского уровня.

Он хотел создать проблему, над которой лучшие умы могли бы ломать голову годами.

Но произошло неожиданное.

Модель GPT-5.4 смогла решить её всего за неделю.

После нескольких попыток один из запусков выдал чистое доказательство на 13 страниц, которое автор задачи внимательно изучил.

И оно его по-настоящему впечатлило.

Математик признался, что этот результат сильно изменил его взгляд на возможности AI.

Ещё недавно считалось, что такие задачи требуют глубокой человеческой интуиции и многолетних исследований.

Теперь становится ясно:

искусственный интеллект начинает входить в область, которую долго считали исключительно человеческой - научные открытия.

Мы, похоже, стоим на пороге новой эпохи.

Эпохи, где AI помогает делать открытия быстрее, чем когда-либо в истории науки.

#ai #math #science
📌 Андрей Карпаты выложил новый проект - karpathy/jobs.

Он взял данные по 342 профессиям из статистики BLS (≈143 млн работников в США) и с помощью LLM оценил, насколько каждая из них подвержена влиянию AI по шкале 0–10.

Результат он визуализировал в виде treemap.

Средний показатель по всем профессиям: 5.3 / 10.

Примеры:

разработчики ПО: 8–9
кровельщики: 0–1
специалисты по расшифровке медицинских записей: 10 / 10 💀💀

Паттерн довольно простой.

Если вся работа происходит за экраном, риск автоматизации высокий.

Если она требует физического труда и непредсказуемой среды, вы гораздо безопаснее.

По оценке Карпати, около 57 млн работников в США - почти 40% всей рабочей силы - находятся в зоне высокого риска изменений из-за AI.

https://karpathy.ai/jobs/

@ai_machinelearning_big_data

#ai #ml #future #jobs #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
✔️ NVIDIA GTC 2026: Ключевые анонсы.

В понедельник в Сан-Хосе открылась NVIDIA GTC 2026 - ежегодная конференция компании по GPU-технологиям и искусственному интеллекту.

Дженсен Хуанг открыл конференцию с тезиса, что компания видит заказы на оборудование на сумму не менее $1 трлн. до конца 2027 года - вдвое больше, чем год назад.

По его словам, индустрия достигла переломного момента: обучать модели уже умеют, теперь нужно дешево и быстро их запускать.

🟡Vera Rubin

Главный анонс конференции - полноценный запуск платформы Vera Rubin. GPU построен на 3-нм процессе TSMC, содержит 336 млрд. транзисторов и 288 ГБ памяти HBM4.

Стойка NVL72 дает 260 ТБ/с совокупной пропускной способности по NVLink 6. Глава NVIDIA посчитал, что это превышает суммарную пропускную способность всего интернета. Производительность инференса выросла в 5 раз по сравнению с Blackwell за счет формата NVFP4.

Vera Rubin не просто GPU. Вместе с ним NVIDIA анонсировала собственный CPU Vera, разработанный для оркестрации и управления памятью в крупных агентных системах.

Эволюция CPU Vera уже расписана на 3 поколения вперед: Vera Ultra появится во второй половине 2027 года, следующая архитектура Feynman - в 2028-м.

🟡NemoClaw

NemoClaw - собственная open-source платформа NVIDIA для создания и деплоя корпоративных ИИ-агентов. Она разворачивается локально на оборудовании NVIDIA, без зависимости от облака, и позволяет задавать агентам имя, личность и набор инструментов. Это прямой ответ на OpenClaw и попытка NVIDIA закрепиться не только в железе, но и в программном слое ИИ-стека.

🟡N1X

N1X - ARM-процессор для ПК, разработанный совместно с MediaTek. Чип содержит 20 кастомных ARM-ядер и встроенный GPU с производительностью уровня RTX 5070. Целевой рынок - Windows-ноутбуки и рабочие станции с локальным инференсом.

🟡DLSS 5

DLSS 5, которую NVIDIA называет главным прорывом в компьютерной графике со времен дебюта ray tracing в 2018 году - это технология, основанная на новой модели нейронного рендеринга в реальном времени, которая насыщает пиксели фотореалистичным освещением и материалами.

Выход технологии запланирован на осень 2026 года. В числе партнеров уже Ubisoft, Bethesda, Capcom, Tencent и Warner Bros. Games.

🟡Крупнейшая партнерская сделка

Как мы писали ранее, NVIDIA заключила многолетнее стратегическое партнерство с Thinking Machines Lab: компания развернет не менее 1 гВт систем Vera Rubin для обучения ИИ-моделей. Это первое развертывание новой платформы в таком масштабе.

GTC продолжится до 19 марта. Впереди порядка 1000+ сессий по Robotics, Physical AI и открытым моделям.


🔜 Посмотреть запись трансляции на Youtube

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ NVIDIA GTC 2026: Ключевые анонсы.

В понедельник в Сан-Хосе открылась NVIDIA GTC 2026 - ежегодная конференция компании по GPU-технологиям и искусственному интеллекту.

Дженсен Хуанг открыл конференцию с тезиса, что компания видит заказы на оборудование на сумму не менее $1 трлн. до конца 2027 года - вдвое больше, чем год назад.

По его словам, индустрия достигла переломного момента: обучать модели уже умеют, теперь нужно дешево и быстро их запускать.

🟡Vera Rubin

Главный анонс конференции - полноценный запуск платформы Vera Rubin. GPU построен на 3-нм процессе TSMC, содержит 336 млрд. транзисторов и 288 ГБ памяти HBM4.

Стойка NVL72 дает 260 ТБ/с совокупной пропускной способности по NVLink 6. Глава NVIDIA посчитал, что это превышает суммарную пропускную способность всего интернета. Производительность инференса выросла в 5 раз по сравнению с Blackwell за счет формата NVFP4.

Vera Rubin не просто GPU. Вместе с ним NVIDIA анонсировала собственный CPU Vera, разработанный для оркестрации и управления памятью в крупных агентных системах.

Эволюция CPU Vera уже расписана на 3 поколения вперед: Vera Ultra появится во второй половине 2027 года, следующая архитектура Feynman - в 2028-м.

🟡NemoClaw

NemoClaw - собственная open-source платформа NVIDIA для создания и деплоя корпоративных ИИ-агентов. Она разворачивается локально на оборудовании NVIDIA, без зависимости от облака, и позволяет задавать агентам имя, личность и набор инструментов. Это прямой ответ на OpenClaw и попытка NVIDIA закрепиться не только в железе, но и в программном слое ИИ-стека.

🟡N1X

N1X - ARM-процессор для ПК, разработанный совместно с MediaTek. Чип содержит 20 кастомных ARM-ядер и встроенный GPU с производительностью уровня RTX 5070. Целевой рынок - Windows-ноутбуки и рабочие станции с локальным инференсом.

🟡DLSS 5

DLSS 5, которую NVIDIA называет главным прорывом в компьютерной графике со времен дебюта ray tracing в 2018 году - это технология, основанная на новой модели нейронного рендеринга в реальном времени, которая насыщает пиксели фотореалистичным освещением и материалами.

Выход технологии запланирован на осень 2026 года. В числе партнеров уже Ubisoft, Bethesda, Capcom, Tencent и Warner Bros. Games.

🟡Крупнейшая партнерская сделка

Как мы писали ранее, NVIDIA заключила многолетнее стратегическое партнерство с Thinking Machines Lab: компания развернет не менее 1 гВт систем Vera Rubin для обучения ИИ-моделей. Это первое развертывание новой платформы в таком масштабе.

GTC продолжится до 19 марта. Впереди порядка 1000+ сессий по Robotics, Physical AI и открытым моделям.

🔜 Посмотреть запись трансляции на Youtube

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Mistral выпустили Leanstral — ИИ-модель для математически идеального кода

В обычной разработке нейросети галлюцинируют, и нам приходится проверять их код руками. Новая модель Leanstral решает эту проблему: она пишет на языке программирования Lean 4, который математически доказывает отсутствие логических багов.

Сразу оговорюсь — это инструмент не для Telegram-ботов или обычных сайтов. Формальная верификация нужна в смарт-контрактах, криптографии, авиации или космонавтике — там, где ошибка стоит миллионы долларов или человеческие жизни, и обычных юнит-тестов недостаточно.

Работает это так: вы не пишете код сами, а только задаёте строгие математические законы (спецификацию). Модель пишет код и пытается доказать его корректность. Бездушный компилятор Lean выступает абсолютным судьей: если есть хоть одна нестыковка, код просто не скомпилируется. Агент Leanstral будет автономно переписывать решение до тех пор, пока компилятор его не примет. Человек в отладке не участвует вообще.

Раньше писать такие сложные математические доказательства умели только гигантские и дорогие модели вроде Claude Opus 4.6. Mistral же сделала узкоспециализированную и лёгкую модель (активны всего 6B параметров). В итоге, чтобы ИИ методом проб и ошибок сам написал и доказал сложный код, на Leanstral вы потратите около $36, а на Claude Opus — $1650 (в 92 раза больше) при сопоставимом качестве успешных решений.

Модель полностью открыта по лицензии Apache 2.0. Потестировать агента можно прямо в браузере через Mistral Vibe или API.

@neuro_channel
Новое исследование показывает, как огромные зарплаты техногигантов уводят лучших специалистов по ИИ из университетов.

Сегодня топ-1% исследователей ИИ в индустрии зарабатывают около $2 млн в год.

Переходя в частные компании, учёные почти перестают публиковать открытые научные работы, вместо этого они на 530% чаще оформляют патенты, чтобы сохранять разработки внутри компаний.

В рамках исследования были проанализированы карьеры 42 000 специалистов по искусственному интеллекту.

https://www.nber.org/system/files/working_papers/w34964/w34964.pdf
💪 Google протестировали LLM на реальных научных вопросах по сверхпроводимости.

Исследователи собрали 67 сложных вопросов, которые обычно обсуждают физики в области высокотемпературной сверхпроводимости, и дали их шести моделям:

• GPT-4o
• Claude 3.5
• Gemini Advanced 1.5
• Perplexity
• NotebookLM
• специальной RAG-системе

Каждый ответ оценивали 12 международных экспертов по нескольким критериям:

• полнота ответа
• объективность
• точность
• наличие научных источников
• ясность объяснения

Интересный результат:

модели с закрытой, тщательно подобранной научной базой отвечали точнее, чем модели с доступом ко всему интернету.

В закрытой базе использовали:

• 15 ключевых обзорных статей
• около 3300 научных ссылок
• ~1700 отобранных источников по экспериментам и теории.

LLM могут быть полезны как “виртуальный научный ассистент”, который помогает исследователю быстро разобраться в сложной области и увидеть разные научные точки зрения.

Но качество сильно зависит от контролируемых источников знаний, а не просто от доступа к интернету.

https://research.google/blog/testing-llms-on-superconductivity-research-questions/
🌟 По данным Reuters, OpenAI ведёт продвинутые переговоры с крупными фондами private equity - TPG, Bain, Brookfield и Advent - о создании совместного предприятия с оценкой около $10 млрд до привлечения инвестиций (pre-money).

Ожидается, что инвесторы готовы вложить примерно $4 млрд.

Этот шаг может резко ускорить внедрение ИИ в корпоративном секторе. Планируется активно внедрять инструменты OpenAI в компании из портфелей этих фондов, одновременно помогая бизнесам адаптироваться и модернизироваться перед лицом AI-дисрапции.

OpenAI также испытывает определённое давление на этом рынке, поскольку Anthropic активно позиционирует себя как лидера в enterprise-сегменте, и OpenAI стремится закрепиться в этой сфере тоже.

https://www.reuters.com/business/openai-courts-private-equity-join-enterprise-ai-venture-sources-say-2026-03-16/
Please open Telegram to view this post
VIEW IN TELEGRAM