Neural Networks | Нейронные сети
11.6K subscribers
803 photos
184 videos
170 files
9.45K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
🎥 Decision Pyramid: Choosing the Right ML Tools
👁 1 раз 299 сек.
Looking for the right Google Cloud machine learning tool for your application? In this overview, you’ll get an overview of our suite of machine learning products. Whether you’re an application developer, data scientist, or ML engineer, there’s something for you.

Cloud Machine Learning APis → https://goo.gle/2r30flz
Cloud Auto ML → https://goo.gle/38zZS2E
BQML → https://goo.gle/2PwbgVX
Cloud AI Platform → https://goo.gle/36JYPLW
Kubeflow → https://goo.gle/2PvJRDk
Deep Learning VMs → https://goo.gle/2rYttS
🎥 DSC Podcast Series: AI & Deep Learning at SAS Part 2
👁 1 раз 924 сек.
In this latest Data Science Central podcast, we will continue to explore the hot topic of AI and Deep Learning at SAS. We will discuss how the SAS platform enables the development of AI applications and how SAS customers are using this exciting technology today.

Speaker:
Vasil Uhnyuck, Software Engineer - SAS

Hosted by:
Bill Vorhies, Editorial Director - Data Science Central

https://www.datasciencecentral.com/
🎥 Введение в ML для Java-разработчиков #7 / Spark(часть 3) [Технострим]
👁 1 раз 4978 сек.
Лекция №7 "Spark(часть 3)"
Курс "Введение в ML для Java-разработчиков"
Технополис Mail.Ru Group, СПбПУ Петра Великого

Другие лекции курса: http://bit.ly/2NoqZ83

📝ПОДРОБНЕЕ О КУРСЕ:
Описание и программа: http://bit.ly/36S2U17

Цель курса — познакомить начинающих java-разработчиков со сферой машинного обучения и основным стеком технологий и инструментами, которые используются исследователями при работе в высоконагруженных системах.

👨‍💻ВМЕСТЕ С ЭТИМ КУРСОМ РЕКОМЕНДУЕМ ИЗУЧИТЬ:
Курс "Безопасность интернет-
​Releasing the Drosophila Hemibrain Connectome — The Largest Synapse-Resolution Map of Brain Connectivity

🔗 Releasing the Drosophila Hemibrain Connectome — The Largest Synapse-Resolution Map of Brain Connectivity
Posted by Michal Januszewski, Software Engineer and Viren Jain, Research Scientist and Technical Lead, Connectomics at Google A fundamen...
Идет набор в новую группу профессионального онлайн-курса «Data Engineer». Если слова Hadoop, MapReduce, Spark (и не только!) для вас не пустой звук – это ваш курс.

📌Изучайте программу и минимальные требования к поступающим, проходите вступительное тестирование и присоединяйтесь с welcome-скидкой: https://otus.pw/3QL5/

Что даст вам этот курс:
📌 знание ключевых способов хранения и методов обработки больших объемов данных, а также стоимости их внедрения;
📌 умение работать с распределенными система в контексте Hadoop экосистемы;
📌практические навыки разработки приложений с использованием программной модели MapReduce ;
📌опыт использования распределенной файловой системы (HDFS).

Делиться с вами своей экспертизой будут преподаватели и наставники курса, среди которых Егор Матешук (Senior Data Engineer) и Артемий Козырь (Data Engineer).

Приходите учиться на боевых задачах у настоящих профессионалов.

🔗 Курс по Data Engineering. Запишитесь на курс по организации и предобработке данных
Мы выпускаем после наших курсов крутых специалистов по Data Engineering. Уникальное обучение организации и предобработке данных, с возможностью трудоустройства
​Нужно ли нам озеро данных? А что делать с хранилищем данных?
Это статья перевод моей статьи на medium — Getting Started with Data Lake, которая оказалась довольно популярной, наверное из-за своей простоты. Поэтому я решил написать ее на русском языке и немного дополнить, чтобы простому человеку, который не является специалистом по работе с данными стало понятно, что такое Хранилище Данных (DW), а что такое озеро Данных ( Data Lake), и как они вместе уживаются.

Почему я захотел написать про озеро данных? Я работаю с данными и аналитикой больше 10 лет, и сейчас я точно работаю с большими данными в Amazon Alexa AI в Кембридже, который в Бостоне, хотя сам живу в Виктории на острове Ванкувер и часто бываю и в Бостоне, и в Сиэтле, и в Ванкувере, а иногда даже и в Москве выступаю на конференциях. Так же время от времени я пишу, но пишу в основном на английском, и написал уже несколько книг, так же у меня есть потребность делиться трендами аналитики из Северной Америке, и я иногда пишу в телеграмм.

Я всегда работал с хранилищами данных, и с 2015 года стал плотно работать с Amazon Web Services, да и вообще переключился на облачную аналитику (AWS, Azure, GCP). Я наблюдал эволюцию решений для аналитики с 2007 года и сам даже поработал в вендоре хранилищ данных Терадата и внедрял ее в Сбербанке, тогда-то и появилось сначала Big Data с Hadoop. Все стали говорить, что прошла эра хранилищ и теперь все на Hadoop, а потом уже стали говорить про Data Lake, опят же, что теперь уж точно хранилищу данных пришел конец. Но к счастью (может для кого и к несчастью, кто зарабатывал много денег на настройке Hadoop), хранилище данных не ушло.

🔗 Нужно ли нам озеро данных? А что делать с хранилищем данных?
Это статья перевод моей статьи на medium — Getting Started with Data Lake, которая оказалась довольно популярной, наверное из-за своей простоты. Поэтому я решил...
​Автоматическое машинное обучение: когда data scientist’ы будут не нужны

Уже третий год мы проводим форум по искусственному интеллекту RAIF (Russian Artificial Intelligence Forum), на котором спикеры из мира бизнеса и науки рассказывают о своей работе. Самыми интересными докладами мы решили поделиться. В этом посте Андрей Фильченков, руководитель лаборатории машинного обучения ИТМО, рассказывает всю правду об AutoML.

В рамках прошедшего в Сколково форума RAIF 2019, организованного «Инфосистемы Джет», я выступил с докладом, в котором рассказал об AutoML и перспективах его использования. Поскольку я ученый, мне не так уж часто приходится выступать на подобных мероприятиях: обычно я участвую в научных конференциях.

Одной из основных областей, которой мы занимаемся, является AutoML. Кроме того, я являюсь техническим директором двух небольших стартапов. Один из них – Statanly technologies – создает сервисы AutoML и занимается анализом данных. Фактически я являюсь тем человеком, который придумывает алгоритмы, внедряет их и пользуется ими. Наверное, я единственный человек, который может рассказать про AutoML со всех трех возможных позиций.

🔗 Автоматическое машинное обучение: когда data scientist’ы будут не нужны
Уже третий год мы проводим форум по искусственному интеллекту RAIF (Russian Artificial Intelligence Forum), на котором спикеры из мира бизнеса и науки рассказы...
​FixMatch
Code for the paper: "FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence" by Kihyuk Sohn, David Berthelot, Chun-Liang Li, Zizhao Zhang, Nicholas Carlini, Ekin D. Cubuk, Alex Kurakin, Han Zhang, and Colin Raffel.

This is not an officially supported Google product.

https://github.com/google-research/fixmatch

https://arxiv.org/abs/2001.07685v1

Наш телеграм канал - tglink.me/ai_machinelearning_big_data

🔗 google-research/fixmatch
Contribute to google-research/fixmatch development by creating an account on GitHub.
Присоединяйтесь к нашей группе:
https://vk.com/dm_azforus
До Искусственного интеллекта (ИИ), обладающего собственной волей, еще далеко. Поэтому опасения насчет вероломства и злого умысла машины пока преждевременны. Но и в наше время уже нужно подумать о том, чтобы результаты работы ИИ приносили максимум пользы человеку, были достаточно прозрачны для понимания, а не оставляли заказчика в недоумении: как это все происходит и что мне с этим делать?
Сейчас мы располагаем программами, позволяющими нам распознавать объекты, относить их в один из классов. Причем зачастую нейросети и ведут себя как неприступные снобы, не желающие раскрывать свои секреты и ноу хау. Кроме того, что объект будет отнесен в какой-то класс, мы ничего не знаем о внутренних процессах и закономерностях, которые были выявлены при анализе обучающей базы данных.
Мы предлагаем абсолютно Дружественный Искусственный Интеллект. Его дружелюбие заключается в том, что все найденные закономерности, полученные в результате машинного обучения и анализа базы данных, он предоставляет в виде набора самых важных ключевых параметров. Кроме того, мы получаем и пошаговый алгоритм, позволяющий понять, как объект, попавший в класс с неблагоприятным прогнозом, может изменить свою судьбу и перейти в благоприятный класс.
Для этого ему дается поэтапный план действий: надо изменить значения этого показателя, преодолев конкретно обозначенную границу. Потом так же поступить со следующим показателем. И еще с другими, – вошедшими в набор самых информативных показателей, аналогично.
Таким образом, пациент сможет получить более благоприятный исход своего заболевания, холдинг убыточные филиалы сможет сделать прибыльными, нефтяники смогут увеличить добычу нефти, оптимизируя технический режим работы скважин.
Присоединяйтесь к нашей группе:
https://vk.com/dm_azforus

https://sun9-9.userapi.com/c857736/v857736400/15f44e/dNNMrccOncE.jpg
​Dataset Search is now officially out of beta, discover millions of datasets on the web.

Learn more → https://datasetsearch.research.google.com/

🔗 Dataset Search
​Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days

🔗 Kaggle Pixel Pro - Building Your Own AI Camera | Pavel Ostyakov | Kaggle Days
Kaggle Days China edition was held on October 19-20 at Damei Center, Beijing. More than 400 data scientists and enthusiasts gathered to learn, make friends, and compete in a full-day offline competition. Kaggle Days is produced by LogicAI and Kaggle. About LogicAI: LogicAI is a boutique Data Science consultancy company owned by Kaggle fans and Grandmasters. As a global company, they do custom end-to-end AI and Data Science development projects as well as trainings for C-level management and tech teams.
​Что такое активное обучение?
Для получения достаточного количества обучающих данных для робомобилей не требуется задействовать толпы людей, размечающих видео вручную

Прочитав книгу по какой-то определённой теме, вы не станете в ней экспертом. Как не станете вы им, прочитав множество примерно одинаковых книг. Для того, чтобы стать настоящим профессионалом в какой-либо области знаний, требуется собрать большой объём информации из разных источников.

То же будет верным для робомобилей и других технологий, в основе которых лежит ИИ.

Глубокие нейросети, отвечающие за работу робомобиля, требуют всестороннего обучения. Им нужно изучить как ситуации, с которыми они могут столкнуться в повседневных условиях, так и те необычные случаи, с которыми ими никогда не придётся встретиться, если повезёт. Ключ к успеху – убедиться, что они обучаются на подходящих данных.

Но что такое подходящие данные? Это новые или неопределённые ситуации, а не постоянное повторение одного и того же.

🔗 Что такое активное обучение?
Для получения достаточного количества обучающих данных для робомобилей не требуется задействовать толпы людей, размечающих видео вручную Прочитав книгу по как...