Математика Дата саентиста
14.1K subscribers
465 photos
176 videos
41 files
405 links
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Небанальные прогнозы развития ИИ

В новом выпуске подкаста ВТБ «Деньги любят техно» — разговор с Юрием Валентиновичем Визильтером, одним из ключевых экспертов в области ИИ и компьютерного зрения в России. Юрий Визильтер — профессор РАН, научный директор Института искусственного интеллекта МФТИ, директор по направлению ИИ ГосНИИ авиационных систем.

В беседе с ведущим подкаста, заместителем руководителя департамента анализа данных и моделирования ВТБ Денисом Суржко, Юрий Валентинович рассказал о личном и профессиональном: с чего начинается карьера исследователя, что формирует её вектор и почему важно не замыкаться на одной теме.

Эксперты поговорили об актуальных прорывах в ИИ: где граница между «слабым» и «сильным» ИИ, в каких сферах ИИ уже даёт измеримый эффект, где он помогает (или мешает) науке. И обсудили важное для всех, кто находится в начале карьерного пути в ML и Data Science: какие навыки будут ключевыми для ML‑специалистов в ближайшие 5 лет и в чём сильные стороны отечественной школы.

Слушать подкаст можно здесь
Смотреть здесь
👍97👎1
INTELLECT-3 показывает, что открытое RL способно серьёзно улучшить рассуждение и кодирование в open-source моделях 🤖📈

INTELLECT-3 это Mixture-of-Experts модель:
- 106B параметров всего
- около 12B активны на каждом шаге

Главная идея проекта - стек prime-rl.
Обучение и инференс идут параллельно: GPU продолжают генерировать длинные ответы, пока тренер обновляет веса. Ничего не простаивает.

Что помогает системе работать быстро:
- непрерывное батчирование
- обновления весов на лету
- перекрытие обучения и генерации

По сути, открытое RL отставало не из-за метода, а из-за отсутствия правильной инженерии.

Пайплайн устроен так:
- тренер обновляет модель
- пул инференса генерирует ответы
- координатор держит всё загруженным и синхронизированным

Задачи приходят из модулей-проверяющих с автоскорингом и безопасными песочницами для кода.
Старт идёт с GLM-4.5-Air: сначала примеры диалогов и инструментов, затем RL с наградами за правильные решения.

Результат впечатляет:
- 90.8% на AIME 2024
- открыты и веса, и весь тренировочный стек, так что пайплайн можно воспроизвести

Paper: https://arxiv.org/abs/2512.16144
5
Есть свежая научная статья об искусственном интеллекте твоего авторства? Подавай заявку на участие в Data Fusion Awards 2026 и получи шанс выиграть 1 млн рублей

Банк ВТБ и Институт ИИ МГУ находятся в поиске авторов, чьи работы могут быть официально признаны научным прорывом в ИИ. За это трое победителей разделят призовой фонд 3 000 000 рублей.

Какие темы подходят:
— Математический аппарат ИИ
— Алгоритмы оптимизации
— Машинное обучение и глубокое обучение
— Нейроморфные вычисления
— Робототехника
— Объяснимый ИИ (Explainable AI)
— Другие смежные области

Для участия принимается научная статья, опубликованная в журнале или материалах конференций за 2025 год. При условии, что заявитель:
✔️ выступает первым в списке авторов;
✔️ имеет аффилиацию с российской организацией, которая упоминается в подаваемой работе.

Зарегистрироваться необходимо до 20 января 2026 года на официальном сайте конкурса.
4
ЛИНЕЙНАЯ_АЛГЕБРА_АНАЛИТИЧЕСКАЯ_ГЕОМЕТРИЯ.pdf
1.5 MB
ЛИНЕЙНАЯ АЛГЕБРА АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
А. М. ИВЛЕВА, П. И. ПРИЛУЦКАЯ, И. Д. ЧЕРНЫХ

В пособии подобраны задачи по курсу линейной алгебры и аналитической геометрии, читаемому на I курсе всех факультетов НГТУ. Теоретический материал пособия и приведенные решения типовых задач способствуют лучшему усвоению материала, самостоятельной работе и приобретению навыков решения задач, необходимых для успешной подготовки к экзамену. Авторы не претендуют на абсолютно корректное из- ложение теоретического материала, упростив его для улучшения понимания.
👍174🔥2
Япония протестировала передачу энергии из космоса - без проводов и топлива 🚀

Японские инженеры успешно провели тест:
солнечные панели в космосе собрали энергию и передали её на Землю по микроволновому каналу.
На наземной станции сигнал снова преобразовали в электричество и система заработала.

В отличие от наземных солнечных станций, космические панели работают:

- без облаков и погоды
- без ночи
- круглосуточно — 24/7

То есть это потенциально *стабильный источник чистой энергии*.

Этот тест ранний, но ключевой шаг к будущим
орбитальным солнечным фермам.

В перспективе такие системы смогут обеспечивать энергией:
- целые города
- удалённые и труднодоступные регионы

Эксперты считают, что это может стать переломным моментом: космические технологии начинают помогать в борьбе с климатическими проблемами.

Пока это эксперимент, но главное доказано: идея работает.
24👍16👎3💩31😱1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Mo Gawdat: ИИ больше не просто пишет код, он исправляет нашу математику

Бывший топ-менеджер Google X Мо Гавдат рассказал:
ИИ перестал быть «инструментом программиста». Он начал исправлять человеческие математические методы.

📁 56 лет мы использовали одну и ту же формулу для умножения матриц.
ИИ обнаружил, что подход был неэффективным — и придумал новую математику, а не просто оптимизировал софт.

Результат:

- +23% к производительности
- минус сотни миллионов долларов затрат
- огромная экономия энергии

Это не просто ускорение алгоритмов —
это момент, когда ИИ начинает изобретать фундаментальные вещи, на которых стоит весь софт.

И будущее становится ещё интереснее.
👏20💩166👍4👎3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Математик Теренс Тао - один из самых цитируемых учёных в мире о LLM:

Обучать и запускать большие языковые модели не так уж математически сложно: базу вполне может понять обычный студент-математик.

Но настоящая загадка в другом - у нас нет теории, которая объясняет,
почему модели блестяще решают одни задачи и внезапно проваливаются на других.

По словам Тао, сегодня мы можем только пробовать, измерять и сравнивать результаты —
«мы можем делать лишь эмпирические эксперименты».


Это редкое честное признание: ИИ пока работает как инженерия без полноценной науки — сначала строим, потом понимаем.
17👍13🔥12
⚡️ Wavelet Matrix - структура данных, которая делает сложные запросы быстрыми

Wavelet Matrix позволяет хранить последовательности так,
чтобы работать с ними молниеносно и компактно.

🔥 Что умеет библиотека:

- rank - сколько раз элемент встречается до позиции
- select - где находится k-е вхождение элемента
- quantile - k-й по величине элемент на отрезке
- top-k - самые частые элементы на диапазоне

И всё это — за логарифмическое время и с экономией памяти.

Чем полезен

- работает быстрее, чем наивные структуры
- меньше памяти, чем обычные массивы
- подходит для поиска, индексирования, сжатия, аналитики

Wavelet Matrix - это пример того,
как «умные» структуры данных дают реальные ускорения,
а не просто красивая теория.

Если интересуешься алгоритмами -
этот репозиторий точно стоит сохранить.

Репозиторий: https://github.com/math-hiyoko/wavelet-matrix

@pythonl
👍76🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Джеффри Хинтон: ИИ может обогнать людей в математике

Хинтон считает, что математика - это «закрытая система», а значит ИИ может работать с ней как с игрой с понятными правилами.

Модели уже умеют:

• ставить себе задачи
• проверять собственные доказательства
• учиться на своих же ошибках — без примеров от людей

«Я думаю, что ИИ станет гораздо лучше людей в математике - возможно, уже в ближайшие 10 лет».


💡 Если это случится, ИИ сможет не просто решать задачи, а открывать новые теоремы и методы, двигая науку еще быстрее, чем раньше.
👍117🤡6🔥5
DeepSeek снова в игре 🔥

"Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models"

Идея мощная: DeepSeek предлагают Engram - модуль памяти, который добавляет к LLM *lookup-память* с доступом за O(1).

Что это значит по-человечески:
вместо того чтобы каждый раз “вспоминать” шаблоны через слои трансформера, модель может моментально доставать нужные куски знаний из отдельной памяти.

Engram - это:
- хешированная N-gram память (modernized hashed N-gram embeddings)
- которая работает как быстрый словарь: *пришёл паттерн → достали представление → усилили модель*

Анализ показывает интересное:

🧠 Engram снижает необходимость ранним слоям заново реконструировать “статичные паттерны”
(частые формы, устойчивые токены, регулярные последовательности)

➡️ То есть ранние слои (слои трансформера, которые стоят ближе всего ко входу.) меньше заняты “механической работой”и больше ресурсов остаётся на главное.

В результате модель становится как будто глубже там, где надо:
- reasoning
- планирование
- длинные цепочки мыслей

Фактически это новый тип sparsity:
не только MoE/спарсные слои,
а спарсная память с быстрым доступом.


Это уже похоже на шаг к LLM, где часть знаний живёт как “кэш-память”, а не внутри весов.

Paper: https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf
Видео: https://www.youtube.com/watch?v=Hoz9HxHy_nQ
👍114🔥2
🧠 Grok 4.20: ИИ нашёл новую Bellman-функцию и продвинул сложную задачу в анализе

По сообщениям, Grok 4.20 смог идентифицировать новую Bellman function, которая помогает продвинуться в одной из “тяжёлых” тем математики - на стыке:

- гармонического анализа
- стохастических процессов
- и поведения случайных средних

Самое интересное - ИИ не просто “угадал ответ”, а предложил явную формулу, основанную на времени выхода броуновского движения (exit time of Brownian motion).

Результат:
- удалось улучшить известную нижнюю оценку
- и приблизить математическое сообщество к более точному пониманию того,
как ведут себя средние значения в стохастических системах

Мы входим в эпоху, где ИИ ускоряет математику не на проценты - а на порядки. ⚡️

https://x.com/PI010101/status/2011560477688463573
11👍7🔥5👎1
🧠 Почти 40 лет прошло… и мы снова спорим о том же. Только теперь - про ИИ.

В 1986 году учителя математики протестовали против калькуляторов.
Боялись, что дети перестанут учить базу и будут просто “жать кнопки”.

И на тот момент это была вполне реальная проблема.

Перематываем в 2026 - и мы видим тот же спор, только уже про AI.

Но есть важная разница:

Калькулятор - просто даёт ответ.

А ИИ способен сделать весь процесс:
- придумать решение
- объяснить шаги
- написать код
- оформить вывод
- предложить варианты

И вот это уже не “удобный инструмент”.
Это смена самой модели обучения и работы.

Калькулятор ускорял вычисления.
ИИ ускоряет мышление и действия.

И именно поэтому спор вокруг него будет намного жестче.
14👍7🔥5🤮1
🧊 pyPFC - Python-библиотека для Phase Field Crystal (PFC) симуляций

Если ты занимаешься моделированием материалов, кристаллов или фазовых переходов - сохрани.
pyPFC позволяет запускать PFC-симуляции быстро и удобно прямо на Python.

Что такое Phase Field Crystal (PFC)?
PFC (Phase Field Crystal) - это метод моделирования, который описывает материал как непрерывное поле плотности.

Проще:
- вместо того чтобы симулировать каждый атом отдельно (как в molecular dynamics)
- PFC моделирует “узор кристаллической решётки” как волну/поле

За счёт этого PFC может моделировать процессы на более длинных временных масштабах, чем классические атомарные симуляции.

PFC используют, чтобы изучать:
- рост кристаллов и формирование структуры
- дефекты решётки (дислокации)
- зернистость и границы зёрен
- фазовые переходы и самоорганизацию
- поведение материалов при охлаждении/нагреве

Что даёт pyPFC:
ускорение на GPU через PyTorch (можно гонять и на CPU, и на RTX)
🧪 готовые 3D-симуляции, примеры, эксперименты
🧩 удобно для исследований и обучения
📦 open-source проект + нормальная инженерная структура

GitHub:
https://github.com/HHallb/pyPFC
🔥4👍3
⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?

Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других.

Это очень полезное событие для тех кто только зашел в аналитику и для тех, кто хочет в нее зайти в ближайшее время. Особенно если вы не понимаете, какие навыки действительно важны или боитесь, что без опыта вас не возьмут на работу. Кстати тут разберут и возрастной аспект: как стать аналитиком в 30/40/50 лет и т.д.

На вебинаре будет:
🟠Разберем полный роадмап: что учить, в каком порядке, до какого уровня;
🟠Структура хорошего портфолио с примерами;
🟠Что говорят реальные наниматели - какие у них сейчас требования:
— Покажем реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— Обсудим какие отклики работают, а какие сразу отправляют в корзину;
— Изнанка найма: инсайдерский взгляд на процессы отбора

🟠 Практические техники для новичков: разберём, как компенсировать недостаток опыта и быстро закрывать пробелы в знаниях.

💬 Всем зарегистрировавшимся Simulative пришлют полезный материал — карту компетенций аналитика данных со всеми нужными инструментами для освоения.

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
2
💼 5 AI-репозиториев, которые реально помогут устроиться на работу в 2026

Сохрани себе - это готовые идеи, которые можно собрать в портфолио и показать на собесе.

1) RAG с нуля (RAG from Scratch)
Поймёшь, как устроены retrieval, embeddings, чанкинг, ранжирование и ответы LLM.
GitHub: https://github.com/langchain-ai/rag-from-scratch

2) AI-агент для соцсетей (Social Media Agent)
Автоматизация контента: генерация постов, планирование, работа с трендами.
GitHub: https://github.com/langchain-ai/social-media-agent

3) Анализ медицинских изображений (Medical Image Analysis)
Компьютерное зрение + реальные кейсы: классификация, сегментация, пайплайны.
GitHub: https://github.com/databricks-industry-solutions/pixels

4) MCP Tool-Calling агенты
Агенты, которые умеют вызывать инструменты и внешние сервисы (LangGraph + MCP).
Notebook: https://docs.databricks.com/aws/en/notebooks/source/generative-ai/langgraph-mcp-tool-calling-agent.html

5) AI-ассистент с памятью (Assistant with Memory)
Персонализация: хранение контекста, long-term memory, улучшение диалогов со временем.
GitHub: https://github.com/Makememo/MemoAI

Если хочешь войти в AI - собирай не “игрушки”, а проекты, которые показывают реальные навыки.
4