Научный опенсорс
747 subscribers
79 photos
1 video
1 file
134 links
Канал сообщества ITMO OpenSource, посвященного созданию и использованию наукоёмких open-source проектов, в том числе в области AI/ML.

Чат: https://xn--r1a.website/itmo_opensource

По всем вопросам - @nicl_nno
Download Telegram
В канале ICT Moscow опубликовали AI-List 2025 - обзор проектов (преимущественно опенсорсных) в области ИИ, выпущенных в этом году в России.

Всего в подборке 120 проектов от 68 команд из 7 городов. Полный датасет доступен тут.

Основные выводы по этой подборке заявлены такие:
- лидерство в разработке новых решений — за бигтехом и научными центрами: на долю ИИ-экосистем приходится 43% всех релизов, а с участием исследовательских центров и вузов было представлено 36% проектов. Зачастую именно эти два типа разработчиков совместно создают новые инструменты;

- более половины (58%) решений доступны как Open Source. Здесь первенство за научно-образовательными центрами: на них приходится ровно такая же доля от таких продуктов. Чаще всего для Open Source российские организации создавали бенчмарки, библиотеки и фреймворки;

- ИИ-агенты, RAG-системы, инструменты для обеспечения безопасности ИИ стали важным и заметным направлением развития российского рынка в этом году.


В целом, формат с открытым датасетом удобный, увидел несколько любопытных проектов (в том числе от команд ИТМО), про которые не слышал. Возможно, было бы интересно для открытых проектов, вошедших в подборку, автоматически собирать и актуализировать данные по активности контрибьюторов и пользователей, чтобы можно было более сложный анализ данных проводить потом.

Ну и конечно полноту такой подборки обеспечить очень сложно.
👍73🔥1
Вчера провели небольшой митап, организованный специально для студентов-первокурсников ИТМО c IT- и DS-направлений.

В рамках такого формата рассказываем студентам о существующих опенсорс-практиках в индустрии и науке, а также про различные варианты для "попробовать себя" в интересных задачах.

Доклады были такие:

- Артём Себало, Авито - "DS в Авито: как мы создаём технологии и делимся ими с другими"
- Юлия Борисова, ИТМО - "Репозитории и опенсорс для студентов - что, зачем и как?"
- Николай Никитин, ИТМО - "Open-Source для ИИ или ИИ для Open-Source?"

Презентации для интересующихся - тут.
🔥152
Уже обсужали в чате открытый проект CayleyPy - а тут в понедельник в reading club-е коллег из AI Talent Hub можно будет пообщаться с автором:
👍6
Forwarded from Al Talent Hub
Новый ИИ-взгляд на решение математических задач

⚡️Регистрируйся на новый #ReadingClub

8 декабря, 19:00 МСК

Разберемся, как открытая библиотека CayleyPy на Python меняет подходы к решению сложных задач в математике и других областях, превосходя традиционные системы алгебры.


А также:

→ Как задачи из теории групп можно решить с помощью методов обучения с подкреплением, аналогичных тем, что использует AlphaGo от Google DeepMind?

→ Как ИИ меняет подходы в математике и других научных дисциплинах, и какие достижения ждут нас в будущем?

🎤 Спикер: Александр Червов, к.ф.-м.н., Institut Curie

Разберем сразу 3 статьи:
📌 CayleyPy: Efficient computation of Cayley graphs

📌 Reinforcement learning approach for classical group theory tasks

📌 AI applications in algebra: a new frontier


➡️ ЗАРЕГИСТРИРОВАТЬСЯ

📕 Reading Club — держим в курсе научных прорывов 😎

#AITalentHub #ITMO #NapoleonIT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥32🔥2
В чате сообщества часто обсуждаются опенсорные реализации различных ML-моделей. Часто вспоминают и про такую фронтирную тему как Tabular Foundation Models.

И вот сегодня пройдет лекция по этой для студентов ИТМО - от Sber AI Lab (недавно писали про их ML-библиотеки). Решили провести в открытом формате - так что приглашаю послушать и заинтересованных в тематике участников нашего сообщества.

Тема: фундаментальные модели для табличных данных и их применение в AutoML
Спикер: Дмитрий Симаков, исполнительный директор по исследованию данных Sber AI Lab.
Когда: сегодня 10.12 в 20-30 мск

Лекция пройдет в рамках моего курса "Автоматическое машинное обучение" магистратуры Факультета технологий ИИ ИТМО, но подключиться и позадавать Дмитрию вопросы можно всем.
Запись потом выложим, но вживую интереснее)

Где: zoom (код для входа 143395)

До встречи!
🔥7
Около-опенсорсное чтение на вечер:

Дмитрий Кабанов выпустил новое интервью с Александром Нозиком, директором Центра научного программирования МФТИ:

https://habr.com/ru/articles/976238/

Обсуждается модель опенсорс-хаба, опыт сотрудничества с индустрией и использования открытого кода в коммерческих проектах, идеи по развитию такого формата. Про сообщества ИТМО в ВШЭ тоже вспоминают.
👍11
Научный опенсорс
Около-опенсорсное чтение на вечер: Дмитрий Кабанов выпустил новое интервью с Александром Нозиком, директором Центра научного программирования МФТИ: https://habr.com/ru/articles/976238/ Обсуждается модель опенсорс-хаба, опыт сотрудничества с индустрией и…
И тут же следом новый материал от Дмитрия - про общеевропейский опенсорс-реестр и перспективы этой модели для других стран: https://habr.com/ru/articles/976216/

Я дал там небольшой комментарий со своим мнением по этому вопросу.

В целом у нас есть небольшой, но позитивный опыт работы с научной командой из Бразилии - они и OSA активно используют, и статьи совместные пишем. В одной из новых статей успешно применили наши open-source инструменты (FEDOT, FEDOT.LLM, EPDE) к их задаче - как раз топичный пример.
🔥6👍1
Хотел уже написать пост "Халявные github actions - В C Ё", но вник подробнее и вроде нет, пока наоборот - дорожают self-hosted экшены, которые запускаются не на гитхабе.

Странное решение. Видимо хотят корпоративное использование косвенно монетизировать. Хотя связанные с LLM сценарии для тестов часто и в небольших открытых проектах часто self-hosted.

Подробности:
https://github.blog/changelog/2025-12-16-coming-soon-simpler-pricing-and-a-better-experience-for-github-actions/
Обсуждение в профильном сабреддите:
https://www.reddit.com/r/github/comments/1po8bns/github_selfhosted_action_runners_will_be_billed/
🤔7
Небольшой дайджест научно-опенсорсных активностей и материалов на разный вкус, в которые можно погрузиться в предновогоднюю неделю:

1. Опенсорс-стрим от SourceCraft - 23.12 в 12-00

Обещают знакомство с ИИ для разработки (для тех, кто ещё не знаком), разбор сценариев и "прожарку" кейсов.

2. Доклад в Paper Reading Club-е от AI Talent Hub ИТМО - сегодня в 19-00

Представители нашей лаборатории (Анна Калюжная, Глеб Соловьев) и Центра ИИ в Химии ИТМО (Андрей Дмитренко) расскажут "Как ИИ помогает искать новые лекарственные молекулы".

Речь пойдет и про сам ресерч, и про A*-публикацию про него, и про открытый код и данные.

3. Из мира открытых данных:

>Инженер Yandex Cloud и исследователи Сколтеха представили самый большой в мире датасет для умных касс и систем учета в ритейле

Формат публикации такой: статья с описанием датасета опубликована в журнале Scientific Data; набор изображений размещён на платформе Zenodo; код и примеры моделей — на платформе Kaggle.
👍6🔥5
Попалась подборка open-source проектов AIRI за 2025. Многое пересекается с направлениями, которыми мы занимаемся в ИТМО, поэтому посмотреть интересно.
Вот как авторы описывают проекты:

- Maestro — фреймворк для создания интеллектуальных ИИ-агентов, от авторизации и хранения контекста до оркестрации агентов и модерации контента.

- GigaEvo — платформа для автоматизации научных экспериментов по ИИ, которая автоматизирует подбор архитектур, оптимизацию гиперпараметров и тестирование моделей, интегрируется с AutoML и MLOps

- MAPF-GPT — первая фундаментальная модель для многоагентного обучения с подкреплением в задаче планирования путей, показан новый SOTA в этом классе.

- CADrille — модель для для 3D-реконструкции промышленных деталей. Принимает на вход облака точек, изображения и текстовые описания деталей, а на выходе генерирует код на языке Python для создания CAD-файла.

- Wikontic — пайплайн для извлечения графов знаний из текстов. Использует в 20 раз меньше выходных токенов для извлечения графов, чем GraphRAG от Microsoft.

- Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющая имитировать ход обучения с подкреплением. Анализирует в 3 раза больше информации по сравнению с аналогами: JAT HugginFace и GATO Google DeepMind.

- VLA_Arena — платформа для оценки и сравнения моделей управления роботами. Позволяет запускать роботов в виртуальной среде с визуализацией, а также подключать реальные устройства. Также содержит чистые датасеты для LeRobot, размеченные и переведённые на русский язык.

- DiMA — универсальная компактная модель для генерации белковых молекул на латентной диффузии.

Можно отметить симпатичные карточки проектов.

Надеюсь, доберемся попробовать всё это, кто уже применял - делитесь опытом)
🔥7👍3
Выкатили сегодня лендинг для нашего опенсорс-сообщества на официальный сайт ИТМО:

https://opensource.itmo.ru/

Структурировали там подборки опенсорс-проектов лабораторий, наши аналитические исследования, митапы и ИИ-инструменты. Спасибо Управлению интернет-ресурсов ИТМО за помощь!

Также, конце декабря принято подводить итоги года, поэтому вспомним что нового появилось в 2025:

- Улучшатель открытых репозиториев OSA;

- Исследование "Искусственный интеллект в разработке: тренды и реальное применение", выполненное совместно с Yandex B2B Tech;

- Продолжение цикла митапов "Scientific Open Source" вместе с GitVerse и OpenScaler, участие в организации Open Source BootCamp 2025 вместе со Sber AI Lab и др;

- Премия "За верность науке";

- И многое другое - новые проекты, репозитории, топовые cтатьи, посты и выступления.

Перечень открытых проектов ИТМО пока наверняка неполон - мы планируем реализовать его автоматизированное обновление через PR-ы в репозиторий страницы. Пока можно запрос на добавление своих репо писать прямо сюда в комментарии.

В 2026 - продолжим наши активности в таком же и даже большем масштабе!
🔥14