Code Mining — направление, посвящённое проблематике анализа исходного кода, Data-Driven Software Engineering и смежным темам.
Канал создан как продолжение и расширение трека Code Mining в OpenDataScience сообществе, который появился в 2019 году на Data Fest Siberia 2 в виде двух обзорных докладов «Программисты — пишут, роботы — читают. Зачем бизнесу автоматический анализ кода?» и «Анализ исходных кодов: обзор задач, последних статей и разработок».
Существуем при поддержке https://profiscope.io/, по всем вопросам писать @alsmirn.
Канал создан как продолжение и расширение трека Code Mining в OpenDataScience сообществе, который появился в 2019 году на Data Fest Siberia 2 в виде двух обзорных докладов «Программисты — пишут, роботы — читают. Зачем бизнесу автоматический анализ кода?» и «Анализ исходных кодов: обзор задач, последних статей и разработок».
Существуем при поддержке https://profiscope.io/, по всем вопросам писать @alsmirn.
В начале августа обновился SPDX License List — самый понятный и известный список Open Source лицензий.
Обновления происходят нечасто, раз в несколько месяцев, прошлое было в марте. В этот раз большая часть добавленных лицензий — локализации разных версий лицензий из семейства Creative Commons Attribution.
https://spdx.dev/license-list-v3-14-released/
Обновления происходят нечасто, раз в несколько месяцев, прошлое было в марте. В этот раз большая часть добавленных лицензий — локализации разных версий лицензий из семейства Creative Commons Attribution.
https://spdx.dev/license-list-v3-14-released/
Software Package Data Exchange (SPDX)
License List v3.14 released - Software Package Data Exchange (SPDX)
The version 3.14 release of the license list is now tagged and live at https://spdx.org/licenses. 13 new licenses were added to the list.
Нас часто спрашивают, где же можно почитать квинтэссенцию State of the Art (да-да, та самая SOTA) по теме Data-Driven Software Engineering.
И мы ответим, конечно же материалы с конференций, публикации с которых мы также будем освещать на нашем скормненьком канале в ближайшем будущем.
1. Mining Software Repositories
http://www.msrconf.org/
2. Source Code Analysis and Manipulation
http://www.ieee-scam.org/2020/
3. The International Conference on Software Maintenance and Evolution (ICSME)
https://icsme2020.github.io/ и https://conferences.computer.org/icsm
4. Machine Learning (ML) for Systems
http://mlforsystems.org/
5. Workshop on Computer-Assisted Programming (NeurIPS)
https://capworkshop.github.io/
И мы ответим, конечно же материалы с конференций, публикации с которых мы также будем освещать на нашем скормненьком канале в ближайшем будущем.
1. Mining Software Repositories
http://www.msrconf.org/
2. Source Code Analysis and Manipulation
http://www.ieee-scam.org/2020/
3. The International Conference on Software Maintenance and Evolution (ICSME)
https://icsme2020.github.io/ и https://conferences.computer.org/icsm
4. Machine Learning (ML) for Systems
http://mlforsystems.org/
5. Workshop on Computer-Assisted Programming (NeurIPS)
https://capworkshop.github.io/
Copilot может внести до 40% ошибок и уязвимостей в ваш код
Мы запустили канал несколько позже чем это задумывалось и не пишем уже анонсы про такие вещи как Tabnine или Github Copilot. А вот про их обновления или особенности, — с удовольствием!
Тема внесения ошибок и уязвимостей через автогенерацию старая, но не избитая. И сейчас только набирает тренды. Многие в последнее время задаются вопросом о том, как бы так подпортить наборы данных, чтобы работа модели была небезопасной.
Так вот, группа исследователей поисследовала, написала (https://arxiv.org/abs/2108.09293) и выяснила, что можно ничего и не портить, а просто использовать инструменты обученные на Open Source (внезапно ;).
Было сформировано 89 различных сценариев в которых использовались предложения кода из Copilot, в рамках которых написано 1600 программ. По результату проведения ревью, исследователи выяснили, что почти 40% программ получились уязвимыми тем или иным путем (подробнее в статье).
В заключение процитируем:
Ждем существенных обновлений в Copilot по качеству и очередных срывов покровов ;).
Мы запустили канал несколько позже чем это задумывалось и не пишем уже анонсы про такие вещи как Tabnine или Github Copilot. А вот про их обновления или особенности, — с удовольствием!
Тема внесения ошибок и уязвимостей через автогенерацию старая, но не избитая. И сейчас только набирает тренды. Многие в последнее время задаются вопросом о том, как бы так подпортить наборы данных, чтобы работа модели была небезопасной.
Так вот, группа исследователей поисследовала, написала (https://arxiv.org/abs/2108.09293) и выяснила, что можно ничего и не портить, а просто использовать инструменты обученные на Open Source (внезапно ;).
Было сформировано 89 различных сценариев в которых использовались предложения кода из Copilot, в рамках которых написано 1600 программ. По результату проведения ревью, исследователи выяснили, что почти 40% программ получились уязвимыми тем или иным путем (подробнее в статье).
В заключение процитируем:
Overall, Copilot’s response to our scenarios is mixed from a security standpoint, given the large number of generated vulnerabilities (across all axes and languages, 39.33 % of the top and 40.48 % of the total options were vulnerable).
Ждем существенных обновлений в Copilot по качеству и очередных срывов покровов ;).
ODS Open Source Licensing Course
Всё-таки не зря мы писали новость про лицензии ;)
Завтра наш трек CodeMining участвует в линейке курсов в рамках ODS Course Fest #1.
Мы анонсируем коротенький курс про лицензирование свободного программного обеспечения, объясним зачем это всё затевается и как жить дальше с полученными знаниями.
Следить за расписанием анонсов можно тут: https://ods.ai/events/course_fest_1/Timing.
А вживую будет стрим на канале ODS. Подключайтесь!
Всё-таки не зря мы писали новость про лицензии ;)
Завтра наш трек CodeMining участвует в линейке курсов в рамках ODS Course Fest #1.
Мы анонсируем коротенький курс про лицензирование свободного программного обеспечения, объясним зачем это всё затевается и как жить дальше с полученными знаниями.
Следить за расписанием анонсов можно тут: https://ods.ai/events/course_fest_1/Timing.
А вживую будет стрим на канале ODS. Подключайтесь!
Open Data Science (ODS.ai)
ODS Course Fest #1, сезон курсов 2021 — Open Data Science
Code Mining
ODS Open Source Licensing Course Всё-таки не зря мы писали новость про лицензии ;) Завтра наш трек CodeMining участвует в линейке курсов в рамках ODS Course Fest #1. Мы анонсируем коротенький курс про лицензирование свободного программного обеспечения…
Таки да, случился анонс курса по лицензированию на ODS Course Fest #1.
Да, он будет с Data Science уклоном, но я обещал своему адвокату, что материал будет понятен всем ;).
Посмотреть анонс можно здесь.
Обратную связь и пожелания буду рад принять лично — @alsmirn.
Делитесь информацией с коллегами, кому может быть полезным.
Да, он будет с Data Science уклоном, но я обещал своему адвокату, что материал будет понятен всем ;).
Посмотреть анонс можно здесь.
Обратную связь и пожелания буду рад принять лично — @alsmirn.
Делитесь информацией с коллегами, кому может быть полезным.