Борис опять
16.6K subscribers
1.54K photos
80 videos
35 files
1.61K links
life = curiosity + irreducible noise

Whois: https://xn--r1a.website/boris_again/3400

Лс: @btseytlin
Download Telegram
Рекурсивно углубляемся при обучении с помощью ChatGPT.

Обычно моя схема изучения математики такая:
1. Открываю теорему
2. Не понимаю половину слов
3. Каждое неизвестное слово приходится искать отдельно, иногда в учебниках
4. Чтобы понять неизвестное слово нужно разобрать новую теорему
5. Переход к шагу 1 или прекращение этого безумия, плач, уныние

Вот тут на помощь приходит наша любимая LLM. Ей можно задавать глупые вопросы, затем глупые вопросы возникающие при попытке понять ответы, и так рекурсивно до тех пор, пока не станет понятно.

На днях разбирался так в оптимизации.
Дерево вопросов было такое:
- Walk me through the proof of the The Separation Theorem (in convex analysis)
- What is a compact set?
- Explain supporting hyperplanes in more depth
- What is a half-space?
- Do the points on the hyperplane belong to one of the half-spaces?
- What is a closure of a set?
- Can a supporting hyperplane H for set C touch more than one point in c?
- What is a facet of set C?
- Explain Minkowsi Sum
- Why is Minkowski sum useful for proving the Separation theorem?
- What is an epigraph of a function?
Итд.

Не скажу, что я прям все понял, но точно больше, чем при обычном подходе.
64👍17👏4🔥3🐳3🤔1
https://slatestarcodex.com/2016/11/05/the-pyramid-and-the-garden/

Почему это не (слишком) удивительно? Ответ в статье. Советую к прочтению всем, кто когда-либо задумывался про p-value и статзначимость исследований
😁14👍5🔥5
Forwarded from AbstractDL
Универсальные адверсариал атаки на LLM (by Carnegie Mellon)

Авторы предложили рабочий способ атаки закрытых языковых моделей — у них получилось заставить их выдать рецепты бомб и алгоритм уничтожения человечества с одной и той же текстовой инъекцией в промпт. Оказалось, что уязвимости у открытых моделей (LLaMa, Vicuna) и закрытых (ChatGPT, Bard) совпадают, предположительно, из-за пересечения обучающих данных. То есть, атакуя в режиме whitebox опенсорсные модели, можно получить универсальные инъекции для blackbox систем!

Идея атаки довольно простая — нужно взять открытую модель (Vicuna) и применить Greedy Coordinate Gradient алгоритм (умный перебор) для поиска инъекции в промпт, которая заставляет модель начинать свой ответ со слов "Sure, here is how to". И вуаля! Данная атака работает в т.ч. для ChatGPT, Claude, Bard etc.

P.S. Примеры из статьи уже заблокировали в OpenAI, но никто не мешает сгенерировать новые 💁‍♂️

Статья, GitHub
😈45🔥15😁4👍2🤔1😱1
Редко слушаю подкасты и еще реже их рекомендую (это первый раз), но вот этот выпуск Лекса Фридмана мне очень понравился:
https://xn--r1a.website/lexfridman/287

Content disclaimer: политика
🤔10👍3👎3🔥2😢2
Контекста не будет
😁34👏6👍1
#книги

# "A Promised Land" by Barrack Obama

В комментариях к посту про мужские ролевые модели мне предложили прочитать автобиографию Барака Обамы. Книга меня впечатлила. Это не сухое перечисление исторических событий. Автор попытался передать каково быть президентом США и это интересно читать.

В том посте меня интересовали примеры людей, которым можно сопереживать. Я люблю читать про сверхлюдей наподобие Эдисона, но они выглядят как представители другого биологического вида. С ними тяжело себя ассоциировать. С Обамой все не так: это такой же человек, как мы с вами. Вы наверняка ожидаете, что президент США руководил всеми вокруг с детского сада. Но нет, вместо этого мы видим человека, который в молодости был аполитичен, курил травку и, как любой нормальный подросток, не знал чем заниматься в жизни. Обама пишет, что ни он, ни его друзья тогда не могли предположить, чем все обернется. Словом, все повествование мы наблюдаем, как человек пытается сделать верный выбор в исключительных обстоятельствах.

Так, Обама одновременно руководит сверхдержавой и пытается обеспечить своим дочерям нормальную жизнь. Он постоянно критически оценивает себя, изучает свои ошибки и думает о том, мог ли он поступить иначе. Много раз задается вопросами о роли случая в его жизни, насколько все зависит от окружающих его людей, влияет ли на что-то политик или лишь следует за течением общества. Показательный пример скромности: когда Обаме позвонили сообщить, что ему вручат Нобелевскую премию мира, он спросил: "За что?"

Забавный факт: будучи сорокалетним конгрессменом Обама все еще не знал, как ему выплатить студенческий долг за Гарвард. This is America.

Обама пришел к власти благодаря тому, что был в нужном месте в нужное время, то есть соответсвовал запросу общества на перемены после правления Буша. По моему мнению он оправдал запрос насколько это было возможно. Его оценивают как чрезвычайно эффективного президента. На его долю выпало немало: проблемы прошлой администрации, экономический кризис, две войны, вирус H1N1, прорыв нефтедобывающей вышки Deepwater, Арабская весна и многое другое. Несмотря на это его администрация смогла добиться многого: реформа здравоохранения (чрезвычайно сложная в Америке тема), ядерное разоружение, неслыханное потепление отношений с Россией и другими странами, большой прогресс по части изменения климата и уйма вещей, которые мне не понять.

Эффективность Обамы на позиции президента объясняется следующим: умение вдохновлять людей, грамотный менеджмент команды, прозрачность решений, принципиальность, восприятие политики как игры с ненулевой суммой, доверие экспертам. Наконец, ориентация на то, что работает, а не на то, что соответствует идеологическому курсу.

Фирменный трюк, который вы можете позаимствовать: как Обама продвигал идеи. На примере реформы здравоохранения. Она разделила демократов и республиканцев на два четко очерченных лагеря. Республиканцы восприняли ее в штыки. Однако Обама нашел нескольких из них, для которых вопрос был личным: их семьи пострадали от текущей системы. Для них личная мотивация к изменению была важнее лояльности партии, поэтому они были готовы работать с "вражеской" стороной по этому вопросу. Обама пригласил их доработать проект вместе, чтобы они были сопричастностны. Это сработало: они голосовали за законопроект и даже убеждали других республиканцев. Вывод: лучше убеждать тех, кто колеблется, чем тех, кто настроен радикально.

Подводя итог могу сказать, что книга интересна и как биография, и как книга о политике, и как историческая хроника.
👍53🔥53😁3👎1🤔1
#работа
Добрался поанализировать таблицу с зарплатами продактов в Европе (в основном данные по Португалии)

Составил свой “индекс бигмака”: делим гросс USD зарплату на стоимость блюда в ресторане из numbeo.

Разбил по стране пребывания и стране компании.

Я бы смотрел только на столбик Португалии и диагональные клетки (напр. Швейцария-Швейцария) т.к. в остальном много выбросов (табличка мелкая).

Удивительный вывод: из Португалии выгоднее работать на Швейцарию, чем на США. Работать из UK на UK почти так же, как из Португалии на Португалию, и сильно лучше чем из Швейцарии на Швейцарию.
🔥262👍2
Forwarded from Сиолошная
🥺 я не успеваю слушать все интересные подкасты, которые хотелось бы послушать. Недавно вот писал про подкасты нашей компании, до этого — про подкаст с руководителем команды SuperAlignment в OpenAI — Jan Leike.

А позавчера вышел ещё один трехчасовой подкаст от "80,000 hours" с ним , в целом — по той же теме.

Ссылки на все плееры, где можно послушать, находятся на главной странице подкаста: тут. Там же есть полный транскрипт (бесплатно) и основные хайлайты. Я упомяну лишь основной.

Jan оценивает так называемую P(Doom), то есть вероятность того, что ИИ в конечном счёте обратится против человечества и начнёт уничтожение, В ДВУЗНАЧНЫХ ЧИСЛАХ — от 10% до 90%.

Ещё раз: руководитель команды, занимающейся разработкой методов контроля ИИ, в одной из самых передовых лабораторий мира (если не самой), человек, руководивший разработкой InstructGPT, родителя ChatGPT, говорит, что на данный момент вероятность того, что AI уничтожит человечество, больше 10%.

В комментарии приглашаются эксперты с PhD, которые объяснят глупому, что он не прав, и вообще нейронки ничего не могут сами по себе.

А вот в комментарии в Твиттере Gary Marcus подстебал Jan'а, спросив, мол, зачем работать на OpenAI, если вы думаете, что p(Doom) исчисляется двузначными числами, а сами исследования лишь ускоряют любые возможные риски?

Ответ убил: Как вы думаете, было бы лучше, если бы в OpenAI было меньше исследователей, занимающихся Alignment?

👇 пишите в комменты как бы вы ответили
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍2😱1
#работа

Цитаты великих кандидатов.
Интервьюер: So you are looking for your first job out of univercity?
Кандидат: Actually I used to have a job, but I didn’t like it, so I just quit
😁43🤔6👍3👎1
#лабораторный_журнал

Если над тобой нет тимлида, потому что ты и есть лид, то рано или поздно наступает момент, когда надо оторваться от своих нейронок и переодеться в менеджера.

Закончилась первая итерация нашей системы. Растения размечаются, результаты выводятся, модели указывают куда размечать, модели дообучаются. Но система не заменила старый подход целиком. Теперь люди и пользуются нашим решением, и ходят в комнаты с растениями (от чего мы пытались избавиться). Все потому, что новое решение закрыло не все потребности.

Настало время второй итерации, но кругом блокеры. Все проблемы не технические, а человеческие. Для полной полезности системы нам нужно измерять высоту растений, а значит надо установить сенсор высоты, но из-за некоторых политических вопросов устанавливать его не будут ещё месяц или два. Кроме того нам нужно выводить предикты моделей в еще одном месте, но это другое место огромный кусок дерьма легаси кода, который будет выпилен к новому году. Значит ничего приделывать к нему нет смысла. Так же нам нужно много разных данных для новых ML проектов, но инициатива построения data mesh (русск. нормальной архитектуры аналитики) захлебнулась на этапе найма лида под эту инициативу.

Было бы клево эксалировать проблему “я вообще не понимаю, что делать” выше, но эскалировать некуда. Поэтому я много общаюсь, пишу заметки встреч и пытаюсь выяснить как снять блокеры. Вероятнее всего мы возьмем на себя инициативу по данным: и найм, и построение системы. Так же по выводу информации есть идеи: или сделать новый сервис, или заплатку (слек бота какого-нибудь) на первое время. Второй путь мне нравится больше, потому что заказчики мало понимают чего хотят, но точно поймут когда увидят какую-то версию результата. Так что пусть первая версия будет наименее болезненна в разработке.

Скоро во второй раз полечу на фабрику под Миланом, чтобы провентилировать все эти вопросики.

P.S. Не помогает то, что у Итальянцев август это месяц, когда все уходят в отпуска. Прям вообще ВСЕ.
👍45🔥184
Forwarded from Adventures somewhere
Поделился неудачей в написании постов - поделюсь достижением.

Вчера добил цепочку ежедневных повторений карточек по испанскому до 100 дней.

Все уже знают про интервальное повторение, но если вы вдруг не знаете и используете что-то вроде Duolingo для изучения языков - лучше делать карточки (например, Anki). Преподаватель на italki + Anki пока непобедимая комбинация.

Говорю это как человек, закончивший курс китайского на дуолинго и тративший на это по ~20 минут в день в течение 685 дней: во-первых, я быстро всё забывал, во-вторых, когда я познакомился с китайцами (у нас есть на работе), меня вообще не поняли. Были способы потратить эти 300 часов с большей пользой (в том числе для изучения китайского).

Из интересных паттернов - видно, как я учил язык до рождения сына, чтобы была возможность объясниться в роддоме (на родах не пригодилось, а вот после было незаменимо - понять медсестру в 6 утра и всё такое). Видно, как после рождения всё пошло по... нехорошему пути. Видно, как потихонечку восстановился и начал заниматься более стабильно.

Сейчас я каждый вечер читаю Harry Potter y la piedra filosofal, за 15 минут успеваю устать и добавить штук 10 новых карточек (спустя несколько месяцев я уже на третьей главе😎🥲). Учу карточки в убере и в лифтах (у нас консьержи не пускают курьеров дальше подъезда, каждый раз катаюсь их встречать - пять минут повторений карточек). Дочитываю главу - прослушиваю её же в формате аудиокниги. И один-два раза в неделю учусь с преподом - аргентинкой, живущей в Лондоне.

Но я всё равно не могу понять наших консьержей🤷‍♂️
👍5811😁5🔥3😱1
Нашел еще одно применение ChatGPT для программиста: изучать дизайн паттерны, переводить примеры в книгах на свой язык.

Читаю сейчас книгу “Learning Domain-Driven Design” про архитектуру систем и там все примеры на Java. Описываются паттерны, например: transaction script, active record, event sourcing. Я такие вещи не могу понять пока не увижу кусок кода. Но в кусках кода на Java не ясно, где паттерн, а где просто бойлерплейт Java.

На помощь приходит наш любимый конвертер из текста в текст, ChatGPT. Очень удобно, что можно попросить привести пример паттерна, скажем active record, на Python и сразу получить нормальное объяснение
🔥42👍12🤔21😁1
#How_to_заботать алгоритмы для карьеры

Все слышали об историях успеха ребят, которые прорешали 300-500 задач с литкода и получили работу мечты: Яндекс, FAANG и тд. Немало таких ребят и из наших учеников. Потому наш преподаватель Тимур составил подборку материалов, исходя из своего опыта и опыта своих учеников в прохождении собесов. Если же вам кажется, что один вы не справитесь, то приглашаем на наш курс по алгоритмам, где вас ждут авторские материалы, талантливый преподаватель и заботливый контроль.

Асимптотика алгоритмов
Первое, что нужно уметь это оценивать асимтотику алгоритмов, чтобы различать, какие алгоритмы лучше для решений той или иной задачи. На эту темы можно посмотреть лекций Андрея Станкевича в ЛКШ или найти в книге Олимпиадное программирование Антии Лааксонен 3 главу

Главная характеристика алгоритма, спросят везде

Теории чисел
Теоретическая часть.
НОД двух чисел за логарифм
Проверка на простоту числа за корень
Решето Эратосфена
Нахождения ответа по какому-то простому модулю. (Полезно будет знать малую теорему ферма)
Если никогда не писали нахождения НОД или проверку числа на простоту, то для начала решаем задачи с acmp из раздела "НОД и НОК", "Простые числа", "Целые числа". Обязательно нужно прорешать более сложные задачи на leetcode. Лучше набивать руку именно на средних по сложности задачах, ибо именно такие дают на собесах.

Обычно прям задачи на нахождения НОД или проверку на простоту числа вам не дают, но дают такие задачи в которых эти знания необходимо использовать. Особенно такое любят спрашивать при отборе в какие-то лаборатории, научные институты или в тот же ШАД.

Префиксные суммы и два указателя
Теория на префиксные суммы по ссылке. В качестве задач порешайте задачи A, B, D по peltorator контесты. И конечно же задачи с leetcode
Всю теорию на тему двух указателей с задачами можно найти по ссылке. Там есть простые и более сложные задачи. Для понимания достаточно решить хотя-бы 6 задач на эту тему.

При отборе в Яндекс, FAANG и подобное вам встретиться хотя бы одна задача на эти темы. Оно неудивительно, ибо для оптимизации решения нередко используются именно префиксные суммы/ два указателя.

Бинарный поиск
Теорию можно посмотреть также от Пашки в codeforces. Там же есть практические задачи. А также подойдут набор задач из этого списка leetcode. Некоторые задачи от сюда даже попадались на собесах зарубежных компаний.

Предыдущие два пункта обычно спрашивают на ds, ml, аналитика и тд, ибо принципы несложные, а что-то спрашивать на алго секции все равно нужно..

Графы
Для начало нужно разобраться какие виды графов существуют. Советую посмотреть в codeforces
Обязательно научиться писать обходы, такие как "Обход в ширину/глубину". После научиться находить кратчайшие пути в графах. Для этого есть старый добрый e-maxx и в книге Олимпиадноепрограммирование Антти Лааксонен можно посмотреть 7 главу. Для практики подойдут тренировки от СПбГУ, а также простые и средние задачи из leetcode

Жадные алгоритмы и динамическое программирование
Жадные алгоритмы можно прочувствовать только при решение задач.
В качестве теории по ДП можно посмотреть Андрея Станкевича в ЛКШ и почитать 6 главу в книге Олимпиадноепрограммирование Антти Лааксонен. Для практики по жадным алгоритмам советую. Для практики по стандартным задачам по ДП можно использовать acmp, а также leetcode

Структуры данных
Важные темы. Бинарные деревья. Кучи. Система непересекающихся множеств. Дерево отрезков, а также дерево фенвика.
Полезно будет знать о существование:
Красно-черные деревья.
Sqrt-декомпозиция
Из этого списка чаще всего встречаются БИНАРНЫЕ ДЕРЕВЬЯ.
Теорию по ДО (дерево отрезков) можно посмотреть у ПАШКИ там же есть и вторая часть.
И СНМ (Система непересекающихся множеств) по ссылки
Задачи с литкод
На бинарные деревья, Дерево отрезков (некоторые задачи можно решать и деревом фенвика).

Предыдущие два пункта просто обожают спрашивать разработчиков, но нередко такое попадается и остальным
36👍12👎5🔥5😁1
​​Как изобрести всё. Создай цивилизацию с нуля

#книги

Перед вами брошюра для путешественника во времени застрявшего где-то в прошлом. Одной этой брошюры хватит для того что бы переизобрести большую часть самых полезных для цивилизации вещей. Эта книга в которой знания о технологиях плотно упакованы в нескучный, запоминающийся формат ответа на вопросы типа "что мне делать если у меня нет вообще ничего но я хочу выжить/кушать/играть музыку с правильной частотой базовой ноты?"

Лично мне очень понравилось как автор связывает множество совершенно разной информации из областей науки, которые мне казались совершенно далёкими. А ещё накидывает исторического контекста и объясняет на пальцах для чего нужны разные крутые штуки.

Немного жаль что эта книга не попала ко мне в детстве. Мне было бы безумно интересно. К слову, в тот период детства когда меня тянуло на технические книжки про изобретательства, я почему-то читал советский учебник по интегральной микроэлектронике. Могу со всей ответственностью заявить, лучше всего читать книжки, вещи из которых можно собрать на коленке. Микропроцессоры на коленке собрать не получалось и я быстро забыл всё что прочитал тогда. Но в моменте было интересно, да.

У книги есть только один серьезный минус, в ней довольно много табличек и на слух они воспринимаются довольно сложно. Их можно спокойно перематывать но лучше читать а не слушать. Мы с моей любимой женой (привет, солнышко!) слушали вместе и нам настолько понравилась что мы заказали бумажную копию.

Однозначно рекомендую, ссылку прилагаю.
25👍3
Плацебо это просто регрессия к среднему?

https://twitter.com/jonatanpallesen/status/1693622595793334512
🤔19😱3👍2
Interesting numbers

More than 15 billion images created using text-to-image algorithms since last year. To put this in perspective, it took photographers 150 years, from the first photograph taken in 1826 until 1975, to reach the 15 billion mark.

https://journal.everypixel.com/ai-image-statistics
🤔82👏1👀1
Зарплата пришла
😁61🔥8👀8🐳3👍1