For Developers
210 subscribers
65 photos
3 videos
1.01K files
998 links
YAC
Download Telegram
Команда Podlodka Crew запускает новую онлайн-конференцию! Если вы занимаетесь бэкенд-разработкой, специально для вас 29 марта стартует Podlodka Backend Crew!

Конференция пройдет в формате двухнедельного интенсива, при этом программа не завязана на конкретные языки программирования и фреймворки. Каждая неделя посвящена отдельной теме, и эти темы – “Распределенные системы” и “Протоколы передачи данных”.

На неделе “Распределенные системы” рассмотрим тонкости разработки и поддержки распределенных систем. Ответим на вопросы про то, как деплоить такие системы, как их правильно тестировать, как правильно организовать балансировку и сбор логов, как работать с данными и не только.

А на неделе “Протоколы передачи данных” прокачаем очень прикладной навык: как максимально осмысленно выбрать протокол в зависимости от решаемых задач, и как эффективно работать с выбранным протоколом. Не json’ом единым!

Помимо докладов в программе множество нескучных форматов: рулетки кейсов, батлы, лайв-кодинги и не только. Добавим к этому общение со спикерами на зум-сессиях и нетворкинг в слаке, и получим прекрасный способ с пользой провести время! А кроме того, вы получите доступ к записям всех сессий, чтобы потом в любой удобный момент можно было освежить знания!

Старт 29 марта, расписание и билеты уже на сайте! Ждем вас на борту!
#rl #dl #paper

Communication in Multi-Agent Reinforcement Learning: Intention Sharing
by kim et al

TL;DR: In this paper, we propose a new communication scheme named Intention Sharing (IS) for multi-agent reinforcement learning in order to enhance the coordination among agents. In the proposed IS scheme, each agent generates an imagined trajectory by modeling the environment dynamics and other agents' actions. The imagined trajectory is the simulated future trajectory of each agent based on the learned model of the environment dynamics and other agents and represents each agent's future action plan. Each agent compresses this imagined trajectory capturing its future action plan to generate its intention message for communication by applying an attention mechanism to learn the relative importance of the components in the imagined trajectory based on the received message from other agents. Numeral results show that the proposed IS scheme outperforms other communication schemes in multi-agent reinforcement learning.

Paper: https://openreview.net/pdf?id=qpsl2dR9twy