Приходите на PowerPoint Party!
Теперь — с центральной темой.
На этот раз ждём (и готовим) презентации про любые навыки — от необходимых до абсурдных.
Лайфхак, история провала или неочевидный способ учиться быстрее — всё, что расскажет о вашем навыке или подарит новый зрителю.
Формат презентаций максимально свободный. Торжественно приглашаем:
- Прийти с одним-единственным слайдом, но с харизматичным докладом;
- Украсть обучающую презентацию с прошлой работы;
- Правдоподобно сыграть педагога в PowerPoint-караоке
или придумать любой другой формат под ваш рассказ.
Примеры тем:
Истории про реальные победы и поражения чрезвычайно приветствуются!
Бонус: если тема зайдёт — сделаем сборник лучших лайфхаков после вечера.
Презентация желательна — будет грустно в двадцатером слушать 3 доклада. Но и без неё приходить не запрещаем!
Ждём всех, кто хочет научиться — или научить!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
На этой неделе в Моноиде:
• Понедельник 18.08 — Коворкинг🖥️
• Среда 20.08 — Коворкинг🖥️
• Пятница 22.08 — Новости ML, AI и technical safety🏷️
• Суббота 23.08 — Коворкинг🖥️
• Воскресенье 24.08 — Коворкинг🖥️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
💰 - Мероприятие платное
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 18.08 — Коворкинг
• Среда 20.08 — Коворкинг
• Пятница 22.08 — Новости ML, AI и technical safety
• Суббота 23.08 — Коворкинг
• Воскресенье 24.08 — Коворкинг
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Книга «Шум. Несовершенство человеческих суждений» посвящена незаметному, но повсеместному явлению — разбросу в человеческих суждениях, который возникает даже при одинаковой информации и одинаковых задачах. Авторы называют это «шумом» и подчёркивают: его последствия глубоки, а масштабы недооценены. Судебные приговоры, медицинские диагнозы, управленческие решения — всё это оказывается чувствительным к случайным факторам: дню недели, настроению, порядку рассмотрения дел.
Канеман, Сибони и Санстейн предлагают смотреть на шум как на скрытую переменную, которую можно измерить, а значит — и сократить. Они описывают способы обнаружения и уменьшения шума: с помощью «шумовых аудитов», алгоритмов, стандартизированных процедур и командного анализа. Примеры из медицины, права, страхования и бизнеса делают проблему осязаемой и подталкивают к переосмыслению роли экспертного мнения. Авторы обращают внимание на то, как можно повысить точность и справедливость суждений, если внедрить подходы, уменьшающие влияние случайности.
Цитаты:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤1👎1
На этой неделе в Моноиде:
• Понедельник 25.08 — POWERPOINT PARTY: НАВЫКИ И ИНСАЙТЫ🖥️
• Среда 27.08 — Коворкинг🖥️
• Пятница 29.08 — Новости ML, AI и technical safety🏷️
• Суббота 30.08 — Коворкинг🖥️
• Воскресенье 31.08 — Коворкинг🖥️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
💰 - Мероприятие платное
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 25.08 — POWERPOINT PARTY: НАВЫКИ И ИНСАЙТЫ
• Среда 27.08 — Коворкинг
• Пятница 29.08 — Новости ML, AI и technical safety
• Суббота 30.08 — Коворкинг
• Воскресенье 31.08 — Коворкинг
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Новости ML, AI и technical safety
📅 Когда: 29 августа (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ A Theory of Deep Learning Must Include Compositional Sparsity - в статье излагается гипотеза о причинах эффективной работы глубоких сетей - выучиваемые функции принадлежат определённому, довольно специфичному классу, допускающему и эффективное вычисление и обучение.
2️⃣ Risks from Learned Optimization in Advanced Machine Learning Systems - классическая статья, излагающая гипотетическую концепцию меса-оптимизаторов как артефактов обучения и сценариев, в которых они приводят к нежелательным результатам обучения.
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
На этой неделе в Моноиде:
• Понедельник 01.09 — Коворкинг🖥️
• Среда 03.09 — Коворкинг🖥️
• Пятница 05.09 — Новости ML, AI и technical safety🏷️
• Суббота 06.09 — Коворкинг🖥️
• Воскресенье 07.09 —Доклад: основы менеджмента по Гроуву. Что такое рычажное действие?🏷️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
💰 - Мероприятие платное
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 01.09 — Коворкинг
• Среда 03.09 — Коворкинг
• Пятница 05.09 — Новости ML, AI и technical safety
• Суббота 06.09 — Коворкинг
• Воскресенье 07.09 —Доклад: основы менеджмента по Гроуву. Что такое рычажное действие?
Please open Telegram to view this post
VIEW IN TELEGRAM
Новости ML, AI и technical safety
📅 Когда: 5 сентября (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ Explaining and Harnessing Adversarial Examples - о намеренном введении нейросетей в заблуждение, как и почему это работает. По меркам отрасли статья древняя (2014!), но высказанные высокоуровневые соображения остаются актуальными по сей день.
2️⃣ Alignment faking in large language models (внимание: основная статья 53 страницы, прочитайте заранее) - о реальных наблюдениях эффектов по мотивам Risks from learned optimization предыдущей недели. Какие реально наблюдаемые эффекты при обучении моделей выглядят как противостояние мета- и меса-оптимизатора, если рассматривать происходящее через эту призму?
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Основы менеджмента по Гроуву. Что такое рычажное действие?
Отчетный доклад в рамках стажировки
📅 Когда: 7 сентября (воскресенье) в 17:00
📍 Где: Москва, ЦДО «Моноид»
🎙️ Спикер: Арина Забелина
💰 Стоимость: по тарифам коворкинга
О чем:
Рычаг — способ за счёт небольших усилий двигать что-то большое. Рычажное воздействие в менеджменте — способность двигать большие процессы через работу с ключевыми элементами.
Энди Гроув, сооснователь Intel, считал, что суть управления заключается в поиске и применении таких «рычагов» — действий с максимальным коэффициентом полезности. На докладе обсудим ключевые концепции из его книги "высокоэффективный менеджмент" и примеры из реальных процессов.
Обсуждаемые вопросы:
🔘 Как на самом деле измеряется вклад менеджера
🔘 Действия с отрицательным рычагом — какие привычные задачи разрушают эффективность?
🔘 Почему это звучит так похоже на EA Handbook?)
Что будет:
🔘 Краткое изложение основных концепций книги "высокоэффективный менеджмент".
🔘 Иллюстрации и примеры из разных отраслей.
🔘 Обсуждение.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Отчетный доклад в рамках стажировки
О чем:
Рычаг — способ за счёт небольших усилий двигать что-то большое. Рычажное воздействие в менеджменте — способность двигать большие процессы через работу с ключевыми элементами.
Энди Гроув, сооснователь Intel, считал, что суть управления заключается в поиске и применении таких «рычагов» — действий с максимальным коэффициентом полезности. На докладе обсудим ключевые концепции из его книги "высокоэффективный менеджмент" и примеры из реальных процессов.
Обсуждаемые вопросы:
Что будет:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🙏3👍1
На этой неделе в Моноиде:
• Понедельник 08.09 — Коворкинг🖥️
• Среда 10.09 — Коворкинг🖥️
• Четверг 11.09 — Коворкинг🖥️
• Пятница 12.09 — Новости ML, AI и technical safety🏷️
• Суббота 13.09 — Коворкинг🖥️
• Воскресенье 14.09 — SSC / ACX митап🏷️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
💰 - Мероприятие платное
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 08.09 — Коворкинг
• Среда 10.09 — Коворкинг
• Четверг 11.09 — Коворкинг
• Пятница 12.09 — Новости ML, AI и technical safety
• Суббота 13.09 — Коворкинг
• Воскресенье 14.09 — SSC / ACX митап
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Slate Star Codex / Astral Codex Ten
Я могу прийти?
Да. Если вы видите это сообщение, значит вы приглашены. Не стесняйтесь приходить, даже если вы прочли не так много статей в блоге или это не совсем ваша специальность - главное это желание пообщаться с интересными людьми.
Что будет:
Общение и обсуждение постов Slate Star Codex / Astral Codex Ten / Less Wrong.
А поподробнее?
Про что это все?
Скотт Александер — автор блогов Slate Star Codex и Astral Codex Ten.
Знакомство можно начать со следующих постов:
По вопросам организации: чат.
По разным вопросам: @red_hara, @sciuru, @Gwinyster
Коротко о правилах:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Новости ML, AI и technical safety
📅 Когда: 12 сентября (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ Testing The Natural Abstraction Hypothesis: Project Intro - программная статья Johns Wentworth о гипотетическом подходе к согласованию ИИ.
2️⃣ Optimizers Qualitatively Alter Solutions And We Should Leverage This - если в прошлый раз мы смотрели статью Anthropic, в этот раз будет Google DeepMind: альтернативный взгляд на динамику процесса обучения.
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
Знакомство с AI safety по роликам Роба Майлза
Киноклуб, дискуссии, нетворкинг
📅 Когда: 17:00, 17 сентября (среда)
📍 Где: Москва, ЦДО «Моноид»
🎙️ Организатор: Анна Самина
💰 Стоимость: бесплатно
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: пофилософствовать с попкорном в руках
Что смотрим:
🔘 10 Reasons to Ignore AI Safety
🔘 9 Examples of Specification Gaming
🔘 Tech is Good, AI Will Be Different
Q: Я первый раз слышу про сейфети. Мне можно прийти?
A: Нужно. Именно на новичков этот формат и ориентирован.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Киноклуб, дискуссии, нетворкинг
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: пофилософствовать с попкорном в руках
Что смотрим:
Q: Я первый раз слышу про сейфети. Мне можно прийти?
A: Нужно. Именно на новичков этот формат и ориентирован.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🥰3🔥1
На этой неделе в Моноиде:
• Понедельник 15.09 — Коворкинг🖥️
• Среда 17.09 — Знакомство с AI safety по роликам Роба Майлза🏷️
• Четверг 18.09 — Коворкинг🖥️
• Пятница 19.09 — Новости ML, AI и technical safety🏷️
• Суббота 20.09 — Коворкинг🖥️
• Воскресенье 21.09 — Коворкинг🖥️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 15.09 — Коворкинг
• Среда 17.09 — Знакомство с AI safety по роликам Роба Майлза
• Четверг 18.09 — Коворкинг
• Пятница 19.09 — Новости ML, AI и technical safety
• Суббота 20.09 — Коворкинг
• Воскресенье 21.09 — Коворкинг
Please open Telegram to view this post
VIEW IN TELEGRAM
Новости ML, AI и technical safety
📅 Когда: 19 сентября (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ Concrete Problems in AI Safety - обзор проблем безопасности с практическим прицелом, в противоположность более теоретическим построениям Хубингера или Уэнтворса. Рекомендуется сравнить этот прогноз девятилетней давности с текущим состоянием.
2️⃣ Mechanistic Interpretability for AI Safety -- A Review - мы достаточно много поминаем mech-interp на обсуждениях, но до жирафа дошло, что собственно статей о нём мы не брали. Обзор суммирует разные результаты и подходы; на стр. 32 есть забавный словарик терминов.
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
На этой неделе в Моноиде:
• Понедельник 22.09 — Коворкинг🖥️
• Среда 24.09 — Коворкинг🖥️
• Четверг 25.09 — Знакомство с AI safety по роликам Роба Майлза🏷️
• Пятница 26.09 — Новости ML, AI и technical safety🏷️
• Суббота 27.09 — Знакомство с AI safety по роликам Роба Майлза🏷️
• Воскресенье 28.09 — Коворкинг🖥️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 22.09 — Коворкинг
• Среда 24.09 — Коворкинг
• Четверг 25.09 — Знакомство с AI safety по роликам Роба Майлза
• Пятница 26.09 — Новости ML, AI и technical safety
• Суббота 27.09 — Знакомство с AI safety по роликам Роба Майлза
• Воскресенье 28.09 — Коворкинг
Please open Telegram to view this post
VIEW IN TELEGRAM
Новости ML, AI и technical safety
📅 Когда: 26 сентября (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ AI safety via debate - вариант реализации “Scalable oversight”, о котором мы немного говорили в прошлый раз: идея использования пары ИИ для достижения более устойчивых и безопасных результатов, которая продолжает звучать в разных вариациях.
2️⃣ Super Co-alignment of Human and AI for Sustainable Symbiotic Society - недавний взгляд на задачу согласования (под вывеской “Superalignment”, потому что у слов тоже есть инфляция), который в том числе ставит под сомнение работоспособность подхода первой статьи.
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
Продолжаем знакомство с AI safety по роликам Роба Майлза
Киноклуб, дискуссии, нетворкинг
📅 Когда: 17:00, 27 сентября (суббота)
📍 Где: Москва, ЦДО «Моноид»
🎙️ Организатор: Анна Самина
💰 Стоимость: бесплатно
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: неформальные разговоры и философия с попкорном.
Что смотрим:
🔘 Why Would AI Want to do Bad Things? Instrumental Convergence
🔘 Why Does AI Lie, and What Can We Do About It?
🔘 The OTHER AI Alignment Problem: Mesa-Optimizers and Inner Alignment
Q: Я не был(а) на первой встрече. Смогу понять?
A: Конечно. Каждое видео самостоятельное — можно присоединиться, когда удобно
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Киноклуб, дискуссии, нетворкинг
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: неформальные разговоры и философия с попкорном.
Что смотрим:
Q: Я не был(а) на первой встрече. Смогу понять?
A: Конечно. Каждое видео самостоятельное — можно присоединиться, когда удобно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Evals: оценки прогресса и прогресс оценок ИИ.
Лекция в рамках программы стажировки
📅 Когда: 28 сентября (воскресенье)
⏰ Время: 18:00
📍 Где: Москва, ЦДО «Моноид»
🎙️ Спикер: Олег Лариков
💰 Стоимость: бесплатно
Как осмысленно измерять производительность больших языковых моделей, если они постоянно меняются? Что отличает надежный метод оценки от посредственного? Что именно делает задачу сложной? На лекции поговорим о субъективности оценок, о том, как оценивают творческие задачи, и что делать с быстрым устареванием тестов.
Основные вопросы:
Это лекция о проблемах осмысленного измерения быстро меняющегося процесса:
🔘 Что мы измеряем? Подходы к определению и измерению абстрактного понятия "качества" у языковых моделей.
🔘 К чему приводят ошибки? Риски, связанные с плохими метриками и их последствия.
🔘 Почему это так сложно? Вызовы и уникальные проблемы в оценке LLM.
Зачем приходить:
🔘 познакомиться с темой мета-анализа ИИ-технологий.
🔘 разобраться подробнее, что делают Anthropic и METR.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Лекция в рамках программы стажировки
Как осмысленно измерять производительность больших языковых моделей, если они постоянно меняются? Что отличает надежный метод оценки от посредственного? Что именно делает задачу сложной? На лекции поговорим о субъективности оценок, о том, как оценивают творческие задачи, и что делать с быстрым устареванием тестов.
Основные вопросы:
Это лекция о проблемах осмысленного измерения быстро меняющегося процесса:
Зачем приходить:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
На этой неделе в Моноиде:
• Понедельник 29.09 — Коворкинг🖥️
• Среда 01.10 — Коворкинг🖥️
• Четверг 02.10 — Знакомство с AI safety по роликам Роба Майлза🏷️
• Пятница 03.10 — Новости ML, AI и technical safety🏷️
• Суббота 04.10 — Один интеллект хорошо, а два - лучше💰
• Воскресенье 05.10 — Коворкинг🖥️
🖥️ - Стоимость по тарифам коворкинга
🏷️ - Вход бесплатный
💰 - Мероприятие платное
🌍 Подробные описания мероприятий и тарифы доступны на сайте
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
• Понедельник 29.09 — Коворкинг
• Среда 01.10 — Коворкинг
• Четверг 02.10 — Знакомство с AI safety по роликам Роба Майлза
• Пятница 03.10 — Новости ML, AI и technical safety
• Суббота 04.10 — Один интеллект хорошо, а два - лучше
• Воскресенье 05.10 — Коворкинг
Please open Telegram to view this post
VIEW IN TELEGRAM
Продолжаем знакомство с AI safety по роликам Роба Майлза
Киноклуб, дискуссии, нетворкинг
📅 Когда: 17:00, 2 октября (четверг)
📍 Где: Москва, ЦДО «Моноид»
🎙️ Организатор: Арина Забелина
🆓 Стоимость: бесплатно
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: неформальные разговоры и философия с попкорном.
Что смотрим:
🔘 Intelligence and Stupidity: The Orthogonality Thesis
🔘 Goal Misgeneralization: How a Tiny Change Could End Everything
🔘 Quantilizers: AI That Doesn't Try Too Hard
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Киноклуб, дискуссии, нетворкинг
О мероприятии:
Смотрим короткие видео про безопасность ИИ от Роба Майлза, обсуждаем идеи и делимся мыслями.
Атмосфера: неформальные разговоры и философия с попкорном.
Что смотрим:
Please open Telegram to view this post
VIEW IN TELEGRAM
Новости ML, AI и technical safety
📅 Когда: 3 октября (и каждую пятницу)
⏰ Время: 20:00
📍 Где: Москва, ЦДО «Моноид»
💰 Стоимость: бесплатно
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
1️⃣ Optimal Policies Tend to Seek Power - попытка математического описания естественных аттракторов агентов: почему в достаточно неопределённом мире широкий диапазон целей может приводить к схожим промежуточным действиям;
2️⃣ Frontier Models are Capable of In-context Scheming - о практических проблемах ограничения ИИ-агентов, включая их способность игнорировать поставленные временные рамки и ломать ограничивающие механизмы.
Чтобы поучаствовать во встрече, нужно:
⭕️ прочитать статью,
⭕️ прийти и обсудить прочитанное.
📍 Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin
Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.
На этой неделе читаем:
Чтобы поучаствовать во встрече, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM