Neural Networks | Нейронные сети
11.6K subscribers
803 photos
184 videos
170 files
9.45K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
​PDDM — Новый Model-Based Reinforcement Learning алгоритм с улучшенным планировщиком

Обучение с подкреплением (Reinforcement Learning) делится на два больших класса: Model-Free и Model-Based. В первом случае действия оптимизируются напрямую по сигналу награды, а во втором нейросеть является только моделью реальности, а оптимальные действия выбираются с помощью внешнего планировщика. У каждого подхода есть свои достоинства и недостатки.
Разработчики из Berkeley и Google Brain представили Model-Based алгоритм PDDM с улучшенным планировщиком, позволяющий эффективно обучаться сложным движениям с большим числом степеней свободы на небольшом числе примеров. Чтобы научиться вращать мячи в роботизированной руке с реалистичными суставами пальцев с 24 степенями свободы, потребовалось всего 4 часа практики на реальном физическом роботе.

🔗 PDDM — Новый Model-Based Reinforcement Learning алгоритм с улучшенным планировщиком
Обучение с подкреплением (Reinforcement Learning) делится на два больших класса: Model-Free и Model-Based. В первом случае действия оптимизируются напрямую по с...
​Как работает метод Левенберга-Марквардта
Алгоритм Левенберга-Марквардта прост. Алгоритм Левенберга-Марквардта эффективен.

А еще о нем говорят, что он где-то посередине между градиентным спуском и методом Ньютона, что бы это ни значило. Ну, с методом Ньютона и его связью с градиентным спуском вроде как разобрались. Но что имеют в виду когда произносят эту глубокомысленную фразу? Попробуем слегка подразобраться.

🔗 Как работает метод Левенберга-Марквардта
Алгоритм Левенберга-Марквардта прост. Алгоритм Левенберга-Марквардта эффективен. А еще о нем говорят, что он где-то посередине между градиентным спуском и метод...
🎥 Recitation 6 | Face Classification and Verification
👁 1 раз 2583 сек.
Carnegie Mellon University
Course: 11-785, Intro to Deep Learning
Offering: Fall 2019

For more information, please visit: http://deeplearning.cs.cmu.edu/

Contents:
• Convolutional Neural Networks (CNNs)
• PyTorch
• Python
🎥 Sequential social dilemmas
👁 1 раз 2162 сек.
На семинаре будет рассказано о sequential social dilemmas - актуальной в последние пару лет проблемой на стыке теории игр и multi-agent reinforcement learning. Эта задача будет рассмотрена с точек зрения обоих областей. Простыми словами, разговор будет о том, как научить агентов кооперироваться и не эксплуатировать друг друга, особенно если это выгодно всем агентам. Также будет рассказано решение, над которым сейчас работаем в JetBrains: с агентами обучать законодателя, который может уменьшать награду агент
​The RAPIDS suite of software libraries gives you the freedom to execute end-to-end data science and analytics pipelines entirely on GPUs

https://github.com/rapidsai/cudf

notebooks repo:

https://github.com/rapidsai/notebooks-contrib

API docs

https://docs.rapids.ai/api/cudf/stable/

🔗 rapidsai/cudf
cuDF - GPU DataFrame Library. Contribute to rapidsai/cudf development by creating an account on GitHub.