Neural Networks | Нейронные сети
11.6K subscribers
803 photos
184 videos
170 files
9.45K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
​Автоматическое машинное обучение: когда data scientist’ы будут не нужны

Уже третий год мы проводим форум по искусственному интеллекту RAIF (Russian Artificial Intelligence Forum), на котором спикеры из мира бизнеса и науки рассказывают о своей работе. Самыми интересными докладами мы решили поделиться. В этом посте Андрей Фильченков, руководитель лаборатории машинного обучения ИТМО, рассказывает всю правду об AutoML.

В рамках прошедшего в Сколково форума RAIF 2019, организованного «Инфосистемы Джет», я выступил с докладом, в котором рассказал об AutoML и перспективах его использования. Поскольку я ученый, мне не так уж часто приходится выступать на подобных мероприятиях: обычно я участвую в научных конференциях.

Одной из основных областей, которой мы занимаемся, является AutoML. Кроме того, я являюсь техническим директором двух небольших стартапов. Один из них – Statanly technologies – создает сервисы AutoML и занимается анализом данных. Фактически я являюсь тем человеком, который придумывает алгоритмы, внедряет их и пользуется ими. Наверное, я единственный человек, который может рассказать про AutoML со всех трех возможных позиций.

🔗 Автоматическое машинное обучение: когда data scientist’ы будут не нужны
Уже третий год мы проводим форум по искусственному интеллекту RAIF (Russian Artificial Intelligence Forum), на котором спикеры из мира бизнеса и науки рассказы...
​FixMatch
Code for the paper: "FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence" by Kihyuk Sohn, David Berthelot, Chun-Liang Li, Zizhao Zhang, Nicholas Carlini, Ekin D. Cubuk, Alex Kurakin, Han Zhang, and Colin Raffel.

This is not an officially supported Google product.

https://github.com/google-research/fixmatch

https://arxiv.org/abs/2001.07685v1

Наш телеграм канал - tglink.me/ai_machinelearning_big_data

🔗 google-research/fixmatch
Contribute to google-research/fixmatch development by creating an account on GitHub.
Присоединяйтесь к нашей группе:
https://vk.com/dm_azforus
До Искусственного интеллекта (ИИ), обладающего собственной волей, еще далеко. Поэтому опасения насчет вероломства и злого умысла машины пока преждевременны. Но и в наше время уже нужно подумать о том, чтобы результаты работы ИИ приносили максимум пользы человеку, были достаточно прозрачны для понимания, а не оставляли заказчика в недоумении: как это все происходит и что мне с этим делать?
Сейчас мы располагаем программами, позволяющими нам распознавать объекты, относить их в один из классов. Причем зачастую нейросети и ведут себя как неприступные снобы, не желающие раскрывать свои секреты и ноу хау. Кроме того, что объект будет отнесен в какой-то класс, мы ничего не знаем о внутренних процессах и закономерностях, которые были выявлены при анализе обучающей базы данных.
Мы предлагаем абсолютно Дружественный Искусственный Интеллект. Его дружелюбие заключается в том, что все найденные закономерности, полученные в результате машинного обучения и анализа базы данных, он предоставляет в виде набора самых важных ключевых параметров. Кроме того, мы получаем и пошаговый алгоритм, позволяющий понять, как объект, попавший в класс с неблагоприятным прогнозом, может изменить свою судьбу и перейти в благоприятный класс.
Для этого ему дается поэтапный план действий: надо изменить значения этого показателя, преодолев конкретно обозначенную границу. Потом так же поступить со следующим показателем. И еще с другими, – вошедшими в набор самых информативных показателей, аналогично.
Таким образом, пациент сможет получить более благоприятный исход своего заболевания, холдинг убыточные филиалы сможет сделать прибыльными, нефтяники смогут увеличить добычу нефти, оптимизируя технический режим работы скважин.
Присоединяйтесь к нашей группе:
https://vk.com/dm_azforus

https://sun9-9.userapi.com/c857736/v857736400/15f44e/dNNMrccOncE.jpg
​Dataset Search is now officially out of beta, discover millions of datasets on the web.

Learn more → https://datasetsearch.research.google.com/

🔗 Dataset Search
​Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days

🔗 Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days
Kaggle Days China edition was held on October 19-20 at Damei Center, Beijing. More than 400 data scientists and enthusiasts gathered to learn, make friends, and compete in a full-day offline competition. Kaggle Days is produced by LogicAI and Kaggle. About LogicAI: LogicAI is a boutique Data Science consultancy company owned by Kaggle fans and Grandmasters. As a global company, they do custom end-to-end AI and Data Science development projects as well as trainings for C-level management and tech teams.
​Что такое активное обучение?
Для получения достаточного количества обучающих данных для робомобилей не требуется задействовать толпы людей, размечающих видео вручную

Прочитав книгу по какой-то определённой теме, вы не станете в ней экспертом. Как не станете вы им, прочитав множество примерно одинаковых книг. Для того, чтобы стать настоящим профессионалом в какой-либо области знаний, требуется собрать большой объём информации из разных источников.

То же будет верным для робомобилей и других технологий, в основе которых лежит ИИ.

Глубокие нейросети, отвечающие за работу робомобиля, требуют всестороннего обучения. Им нужно изучить как ситуации, с которыми они могут столкнуться в повседневных условиях, так и те необычные случаи, с которыми ими никогда не придётся встретиться, если повезёт. Ключ к успеху – убедиться, что они обучаются на подходящих данных.

Но что такое подходящие данные? Это новые или неопределённые ситуации, а не постоянное повторение одного и того же.

🔗 Что такое активное обучение?
Для получения достаточного количества обучающих данных для робомобилей не требуется задействовать толпы людей, размечающих видео вручную Прочитав книгу по как...
​Как прошел 2019 год в области математики и Computer Science
Перевод статьи подготовлен специально для студентов базового и продвинутого курсов «Математика для Data Science».

Математики и информатики за прошедший год добились больших успехов в теории чисел, теории графов, машинном обучении и квантовых вычислениях, даже пересмотрели наши фундаментальные понятия математики и нейронных сетей.

Для математиков и специалистов по computer science 2019 год был годом повторений и пристального изучения. Одни пересматривали основополагающие принципы, в том время как другие находили поразительно простые доказательства, новые методы решения проблем или постигали неожиданные решения давних задач. Некоторые из этих достижений уже нашли широкое применение в физике и других научных дисциплинах. Другие же существуют исключительно в качестве теории (или просто для развлечения), и с практической точки зрения на сегодняшний день не несут никакой пользы.

🔗 Как прошел 2019 год в области математики и Computer Science
Перевод статьи подготовлен специально для студентов базового и продвинутого курсов «Математика для Data Science». Математики и информатики за прошедший год д...
​Two interesting works on Unsupervised Object Detection & Tracking
http://e2crawfo.github.io/

🔗 Eric Crawford
Website of Eric Crawford, PhD student studying machine learning and theoretical neuroscience.
​How to Train BERT Models with limited GPU RAM (Pytorch) | Michael Yeh | Kaggle Days

🔗 How to Train BERT Models with limited GPU RAM (Pytorch) | Michael Yeh | Kaggle Days
Kaggle Days China edition was held on October 19-20 at Damei Center, Beijing. More than 400 data scientists and enthusiasts gathered to learn, make friends, and compete in a full-day offline competition. Kaggle Days is produced by LogicAI and Kaggle. About LogicAI: LogicAI is a boutique Data Science consultancy company owned by Kaggle fans and Grandmasters. As a global company, they do custom end-to-end AI and Data Science development projects as well as trainings for C-level management and tech teams.
Optimal binning: mathematical programming formulation

OptBinning is a library written in Python implementing a rigorous and flexible mathematical programming formulation to solving the optimal binning problem for a binary, continuous and multiclass target type, incorporating constraints not previously addressed.

Code: https://github.com/guillermo-navas-palencia/optbinning

Paper: https://arxiv.org/abs/2001.08025v1

Наш телеграм канал - tglink.me/ai_machinelearning_big_data

🔗 guillermo-navas-palencia/optbinning
Optimal binning: mathematical programming formulation - guillermo-navas-palencia/optbinning
​Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days

🔗 Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days
Kaggle Days China edition was held on October 19-20 at Damei Center, Beijing.

More than 400 data scientists and enthusiasts gathered to learn, make friends, and compete in a full-day offline competition.

Kaggle Days is produced by LogicAI and Kaggle.

About LogicAI:
LogicAI is a boutique Data Science consultancy company owned by Kaggle fans and Grandmasters. As a global company, they do custom end-to-end AI and Data Science development projects as well as trainings for C-level management and tech teams.
Привет, уважаемое сообщество. Спешу поделиться новостью о том, что моя книга по машинному обучению наконец-то выходит от издательства Питер и уже доступна для предзаказов на сайте издательства. Издание цветное, перевод на русский выполнялся не мной, но я принимал активное участие в проекте, дважды вычитывал и исправлял текст, так что качество получилось отличное и мой авторский стиль сохранен в переводе.

Предисловие к изданию написал Сергей Николенко, автор книги «Глубокое обучение. Погружение в мир нейронных сетей».

Ссылка: https://www.piter.com/collection/soon/product/mashinnoe-obuchenie-bez-lishnih-slov

🔗 Машинное обучение без лишних слов
Все, что вам действительно нужно знать в машинном обучении