Code Mining
913 subscribers
95 photos
4 videos
8 files
180 links
ML4Code во всей красе, анализ кода и артефактов: лицензии, уязвимости, процессы. Комментарии к актуальным и не очень новостям, аналитика, эпизодический авторский контент, мемасики.

При поддержке: ods.ai, @codescoring
По вопросам — @alsmirn
Download Telegram
Forwarded from ИСП РАН
‼️ Напоминаем, что сегодня последний день приёма статей и тезисов на Открытую конференцию ИСП РАН, которая состоится 11-12 декабря в Москве, в инновационном кластере «Ломоносов».

✔️Если вы планируете выступить в рецензируемых секциях, загрузите материалы до 23:59 по московскому времени! Все подробности: https://www.isprasopen.ru/#Submission.

Напоминаем, что для прохода в здание нужно зарегистрироваться! Регистрация участников до 23:59 6 декабря: https://www.isprasopen.ru/#Registration.
👍4😱1
Forwarded from ИСП РАН
‼️ Мы продлеваем срок регистрации на Открытую конференцию ИСП РАН до 23.59 8 декабря!

➡️ Регистрация по ссылке:
https://www.isprasopen.ru/#Registration

✔️Напоминаем, конференция пройдет в кластере «Ломоносов» по адресу Москва, Раменский бульвар, д. 1.
👍2🎉2
LLM-based agents for Software Engineering

В сентябре вышел большой труд от китайских коллег: "Large Language Model-Based Agents for Software Engineering: A Survey".

Статья рассматривает аспекты применения LLM-основанных агентов в разных задачах программной инженерии (скрин). Чего там только нет! Добрая сотня доменных инструментов, которые ещё и сравниваются между собой и идет дискуссия о том как эти вещи принято строить в разных случаях.

Будем смотреть согласно своим интересам и что-нибудь обозревать.

Если вы нашли что-то интересненькое — делитесь в комментариях.

Да, к статье прилагается репо с большим количеством ссылок по темам: https://github.com/FudanSELab/Agent4SE-Paper-List.
👍9🔥42🤩1
Генерация безопасного кода с LLM: эмпирический опыт

Спрос на генерацию кода с помощью моделей машинного обучения становится все выше. Вместе с тем растут и сомнения в качестве и безопасности полученного кода. Согласно опросу Stack Overflow 57% пользователей недовольны результатом работы AI-помощников.

На Открытой Конференции коллеги из ИСП РАН представили доклад об исправлении уязвимостей в сгенерированном коде с помощью разработанного расширения CodePatchLLM.

Как это работает? Используя статический анализатор Svace, инструмент получает обратную связь об уязвимых функциях и корректирует результат работы модели. В результате CodePatchLLM устраняет до 85% уязвимостей в коде на Python и Java, при этом не теряя производительности.

Прочитать подробнее про расширение можно в статье, а оценить самостоятельно – на Github.

Тайм-код для просмотра доклада: 1:01:50. Полную запись докладов можно найти на сайте конференции ИСП РАН.

@codemining
🔥127👍3🤯2👏1💩1
THE STATE OF SECRETS SPRAWL 2024

Известно, что захардкоженые секреты (пароли, токены, ключи и т.п.) в коде или конфигурациях могут доставить много разных неприятностей при их утечке.

GitGuardian, лидер в отрасли ловли секретов в декабре выпустила свежий отчет, который подсвечивает актуальные статистики, например:
- 12.8 млн. новых секретов обнаружено в публичных коммитах на GitHub за 2023 год;
- 90% секретов оставались валидными и через 5 дней после утечки;
- каждый десятый разработчик случайно добавляет секрет в код.

В отчете раскрываются какие виды секретов текут чаще, в каких индустриях и отраслях.

В частности, отмечается популярность OpenAI, ключики которого стали течь многократно чаще (с ростом популярности, понятное дело).

Приводится увлекательная статистика по расширениям файлов, откуда утечка может произойти (картинка) и много чего ещё.

Авторы не забыли дать рекомендаций по защите и управлению процессом. Полезно.

Подробнее можно почитать в пятидесятистраничном отчете, который прямо целиком годный.

@codemining
🔥12👏52🤯2👍1
Innovation Graph

Кто читал годовой отчет Github The state of open source software мог обратить внимание на их Innovation Graph из которого было вытащено много интересной статы.

Внутри агрегированная информация про разработчиков, организации, репозитории, языки, лицензии и пр.

Из интересного, есть классификация данных по регионам и разделение по странам. Например, можно посмотреть какие лицензии более популярны в еврозоне, а какие в Америке или Азии. Или динамику прироста программистов в Африке.

👀 Покрутить в интерактивные графики.

Репо и данные. Обновляется раз в квартал.

@codemining
🔥75👍5🤩1
T-Meetup: AI в SWE

4 марта оффлайн в Москве пройдет митап от Т-Банка о применении ИИ в программной инженерии. Больше полезных митапов! 🤟

В программе заявлен доклад "Обзор применений ИИ в программной инженерии в российских реалиях" от Николая Бушкова. Помимо обзорной части ожидается реальный опыт разработки и внедрения ассистентов. Про то как сделать — интересно, а про то, как оно "поехало" — вдвойне. Так что ждем!

Круглый стол! За столом соберутся эксперты из Т-Банка, Сбера и MTS AI и поговорят о проблемах и рисках внедрения этой самой ИИшечки в разработку. Тема животрепещущая, интересно будет послушать реальный опыт коллег по цеху.

Участие бесплатное. Регистрация обязательна.
https://l.tbank.ru/t-meetup-ai-v-swe

@codemining
🔥94👍3🎉2
Бустинг (не градиентный)

Вот и настало время каналу попросить бустов:
https://xn--r1a.website/boost/codemining

🙏🙏🙏
😁31👍1🤔1
PHDays Fest CFP

Кстати вот. Крупнейшее событие по кибербезопасности в мае. И даже есть время податься.

Про работу с кодом в том или ином виде ожидается много разных треков:
- разработческий и опсовые треки
- безопасная разработка
- Open Source & Open Security
- AI Track
- ...

Форматы:
- полновесный доклад (50 мин)
- фаст-трек (15 мин)

Всего треков почти 20 штук, так что и погулять-послушать будет чего. Понятно, что раз CFP, то программы пока нет, но можно посмотреть прошлогоднюю.

28 февраля — дедлайн подачи:
https://phdays.com/ru/cfp/

@codemining
👍5🔥4
Иванниковские чтения CFP

Регулярно конференция собирает множество участников, чтобы пообщаться, обменяться опытом и представить результаты своих изысканий.

По технологиям анализа, моделирования и трансформации программ спектр материала как обычно широк:
- Обратная инженерия бинарного кода
- Выполнение программ в контролируемом окружении
- Поиск ошибок и уязвимостей в исполняемом коде
- Анализ сетевого трафика
- Оптимизации в компиляторе
- Статический и динамический анализ программ
- Методы и инструменты анализа и тестирования программ
- Безопасность и конфиденциальность в ОС
- Жизненный цикл разработки: стандарты и сертификация
- ОС реального времени, интернет вещей
- Сетевые стеки и технологии
- Архитектура операционных систем (в том числе ядра ОС)

Конференция пройдет в Иркутске 26-27 июня.

Податься со статьей или докладом: https://www.ivannikov-ws.org/#Submission

@codemining
🔥9👍42🤩2
Forwarded from ODS Events
Привет ☺️

🔥24 мая - 1 июня 2025 состоится главное событие года для нашего сообщества — Data Fest 2025!

Приглашаем вас присоединиться в роли спикеров или организаторов секций, пока времени до мероприятия еще достаточно 😉

Да-да, это тот самый CALL 4 SPEAKERS & CALL 4 ORGS 📣📣📣
Переходите по ссылкам ниже, пишите о темах, с которыми хотите выступить, пересылайте этот пост друзьям 🦜

Предварительный список секций, куда уже можно податься с докладом:
🔮 Больше про ML в разрезе DS доменов: NLP, Advanced LLMs, CV, Speech, RecSys, TS & Forecasting, Reliable ML
🏭 Больше про индустрии и их приложения: ML in Manufacturing, Ужасы Медицинских Данных, ML in Marketing, ML in [Physics] Science, Robotics, Scoring, ML in Security, Code Generation / AI code (new), ML in Chemistry (new)
🛠 Больше про инженерию: MLOps, Optimal DL, Open Source, DL Frontier (new)
🎁 Неформат: Career & TeamLead, Random DS/ML
….и список будет пополняться!

Стать спикером <— тык
Стать организатором <— тык

🥰 Всех ждем!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2🥰2🎉1
Иванниковские чтения уже на пороге!

🤟Завтра, 26 июня в 9.30 в Иркутске начнётся ежегодная конференция «Иванниковские чтения»!

🔥Нас ждут 19 докладов про анализ кода и вот этого нашего всего.

👀 Трансляция секции «Технологии анализа, моделирования и трансформации программ»:
https://vkvideo.ru/video-214485707_456239047

Расписание:
https://www.ivannikov-ws.org/#Agenda
🔥125🎉4
Открытая конференция ИСП РАН 2025

9-10 декабря в Москве пройдет очередная конференция ISPRASOpen.

Институт системного программирования известен своими технологиями и мощной экспертизой не только программной инженерии, но и исследованиях в области искусственного интеллекта и медицины.

Программа уже доступна.

Трек по технологиям анализа, моделирования и трансформации программ пройдет во второй день конференции и включает 24 доклада по направлениям:
- обратная инженерия бинарного (исполняемого) кода
- выполнение программ в контролируемом окружении
- поиск ошибок и уязвимостей в исполняемом коде
- анализ сетевого трафика
- оптимизации в компиляторе и генерация кода
- статический и динамический анализ программ
- методы и инструменты анализа и тестирования программ
- запутывание программ (обфускация)

В этом году ожидается более 2к участников, интересные стенды и много-много полезного общения для предновогодней подзарядки.

🗓 9 и 10 декабря 2025
📍 Инновационный кластер "Ломоносов"

Участие бесплатное, регистрация необходима (до 6 декабря). Программа конференции.

@codemining
8👍3🔥3🎉1
Чуть не забыл! Подводим итоги года в Open Source на Stereo Elka в Питере уже завтра!

https://ods.ai/events/data-elka-2025-vk-offline-spb
👍124🔥4🙏1
Code Mining
Чуть не забыл! Подводим итоги года в Open Source на Stereo Elka в Питере уже завтра! https://ods.ai/events/data-elka-2025-vk-offline-spb
Data Ёлка 2026

Ёлка случилась. Больше пяти часов интереснейших наблюдений по итогам года под крышечкой Open Data Science одновременно в Москве и Питере. Это было круто, спасибо VK & ODS за организацию! Кажется, это был первый раз, когда мое выступление снимала "летающая" камера :).

Соблюдая тематику нашего канала, подсветим: NLP, который теперь про почти весь про LLM, данные, которые по прежнему в большинстве Open Source и к чему это всё приводит в инструментах разработчика — AI4SE.

🔥 Итоги года в NLP

🔥 Итоги года в Open Source

🔥 Итоги года в AI4SE / CodeGen

@codemining
11🔥5🤩2
Код-майнинг сложно представить без открытого кода, поэтому мы не забываем поддерживать полезные проекты.

Мой знакомый Валик делает open source проект - mlut. Это CSS-фреймворк для кастомных сайтов и креативов. Он похож на Tailwind.

Недавно он запустил проект на ProductRadar.

Соревнуется там со стартапами за топ-3 продуктов этой недели. Давайте поддержим Валика лайком и покажем всем, что open source инструмент тоже может быть продуктом!

@codemining
5🔥3🎉2
Иванниковские чтения 2026 CFP

В 2026 году в Этномире (Калужская обл., Боровский р-н, д. Петрово) состоится международная конференция «Иванниковские чтения», посвящённая разработке инновационных технологий в области системного программирования.

Участие бесплатное как для слушателей, так и для докладчиков.

«Иванниковские чтения» проводятся по инициативе ИСП РАН в память его основателя ‒ академика В.П. Иванникова. Ранее конференция уже проходила в Ереване, Великом Новгороде, Орле, Нижнем Новгороде, Казани и Иркутске, собирая более 350 участников.

С этого года конференция проводится совместно с коллоквиумом по разработке программного обеспечения SYRCoSE, ориентированным на молодых исследователей в сфере информационных технологий.

Важные даты:
- Срок подачи материалов: до 23:59 (GMT+3) 10 апреля 2026
- Уведомление о включении в программу: до 23:59 (GMT+3) 30 апреля 2026
- Регистрация участников: до 23:59 (GMT+3) 11 мая 2026

Податься со статьей или докладом:
https://www.ivannikov-ws.org/#Submission

@codemining
2🎉2🤩1
Code Mining
Срок подачи материалов: до 23:59 (GMT+3) 10 апреля 2026
"Срок подачи статей и тезисов на международную конференцию ИСП РАН «Иванниковские чтения» продлен до 15 апреля 2026 года."

@codemining
🙏21
Forwarded from ODS Events
Привет!

Уже на этой неделе начинается Data Fest 2026 🥰 ура-ура!🤗

Наш список офлайнов:

Москва
▫️23 мая (сб): Data Fest 2026 в гостях у X5 Tech
▫️24 мая (вс): Data Fest 2026 в гостях у ВТБ
▫️26 мая (вт): Data Fest 2026 в гостях у Сбера
▫️29 мая (пт): Data Fest 2026 в гостях у Лемана Тех
▫️30 мая (сб): Data Fest 2026 в гостях у AvitoTech
▫️31 мая (вс): Data Fest 2026 в гостях у Яндекса

Санкт-Петербург
▫️30 мая (сб): Data Fest 2026 в Санкт-Петербурге

Новосибирск
▫️28 мая (чт): Data Fest 2026 в гостях у Сбера

Уфа
▫️25 мая (пн): Data Fest 2026 в Кампусе

Белград
▫️24 мая (вс): Data Fest 2026 в гостях у Яндекса
▫️31 мая (вс): Data Fest 2026 в Белграде

Алматы
▫️30 мая (сб): Data Fest 2026 в Алматы

Успевайте подать заявки, пока регистрации открыты!

Скоро мы начнем делиться подробными расписаниями секций ⭐️
🔥21🎉1
Forwarded from ИСП РАН
🍏Стартовал коллоквиумом молодых ученых SYRCoSE!

Сегодня на площадке этнографического парка-музея ЭТНОМИР проходит коллоквиум SYRCoSE (Spring Young Researchers’ Colloquium on Software Engineering) — традиционная международная площадка для молодых исследователей в области программной инженерии и системного программирования.

В программе — доклады, посвящённые анализу программ, искусственному интеллекту, методам верификации и тестирования, обработке данных, безопасности программного обеспечения и другим актуальным направлениям современной ИТ-науки.

SYRCoSE ежегодно объединяет студентов, аспирантов и молодых учёных из российских и зарубежных университетов и научных центров, предоставляя возможность представить результаты своих исследований и обсудить их с экспертным сообществом.

Ознакомиться с программой коллоквиума

🗣А уже завтра стартует основная программа международной конференции «Иванниковские чтения». Следите за ходом конференции в соц-сетях Института!

💬ИСП РАН в Telegram
💬ИСП РАН в МАКС
Please open Telegram to view this post
VIEW IN TELEGRAM
1🎉1