Техножрица 👩‍💻👩‍🏫👩‍🔧

Техножрица 👩‍💻👩‍🏫👩‍🔧

Ну что же, настало время очередной командировки в Китай! 🤓

Из-за того, что мы с коллегой опоздали на свой самолёт во время пересадки и пришлось долго ждать нового, дорога к месту назначения оказалась дольше и тернистее, чем планировалась... такси в Москве + самолёт из Москвы в Пекин + приключения в пекинском аэропорту + самолёт из Пекина в Шанхай + такси от Шанхая до Сучжоу = все вместе заняло более суток...
Как же хорошо теперь после этого ~~пиз...~~ удивительного путешествия наконец-то принять душ, завернуться в махровый халат, сделать масочку и лечб на настоящую кровать... 💅

🤓 НАСТОЯЩУЮ! 🤓 КРОВАТЬ! 🤓

#о_себе

Please open Telegram to view this post

VIEW IN TELEGRAM

💅118❤3319👍9🤡6❤‍🔥5🍌4💋2🎄2⚡1🐳1

8.74K views13:34

Техножрица 👩‍💻👩‍🏫👩‍🔧

This media is not supported in your browser

VIEW IN TELEGRAM

Я на 8 марта

🍓7824💅1614❤9🌚6💘6💋5🤝5👎2🍌2

6.28K viewsedited 01:45

Техножрица 👩‍💻👩‍🏫👩‍🔧

🎉 Тем временем, мы с коллегами выложили на arXiv новый 4-страничный препринт про применение Sparse AutoEncoders (SAE, разреженные автоэнкодеры) для детекции искусственно сгенерированных текстов 🎉 (чтобы подробно разобраться, как работают SAE, можно начать, например, отсюда: https://transformer-circuits.pub/2022/toy_model/index.html ; если же говорить вкратце, SAE - это один из способов извлечь более "распутанные" и интерпретируемые фичи из эмбеддингов LLM-ки). В процессе работы над исследованием к моим постоянным соавторам присоединились два новых: Антон ( https://xn--r1a.website/abstractDL ) и его коллега Полина, которые очень помогли с экспериментами и текстом на финальных стадиях!

Сама же работа называется "Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders" ( https://arxiv.org/abs/2503.03601 ) 🤓 и заключается в следующем:

Мы взяли модель Gemma-2-2B, навесили на нее предобученный SAE (gemmascope-res-16k) и начали подавать на вход различные LLM-сгенерированные тексты. Далее мы:

а) Детектировали LLM-генерацию по фичам SAE (интересно, что качество такой детекции оказалось лучше, чем детекции по оригинальным эмбеддингам Gemma!);
б) Отобрали 20 наиболее важных для детекции фичей с помощью бустинга и проанализировали их смысл, чтобы разобраться, какие именно отличия человеческих текстов и LLM-сгенерированных были "пойманы" этими фичами.

Анализ фичей проводился тремя основными способами: ручной интерпретацией (вручную смотрели, чем отличаются те тексты, на которых значение фичи низкое, от тех, на которых оно высокое), авто-интерпретацией (то же самое делала LLMка) и steering-ом. В последнем способе, в отличие от предыдущих, мы подавали на вход Gemma-2-2B не весь пример из датасета, а только промпт. Продолжение же мы генерировали с помощью самой Gemma-2-2B и при этом вектор, соответствующий выбранной фиче в эмбеддинге модели искусственно увеличивали или уменьшали, чтобы посмотреть, как это влияет на результат генерации. Далее GPT-4o автоматически интерпретировала, чем тексты, сгенерированные при уменьшенном значении нужного вектора, отличаются от текстов, сгенерированных при увеличенном значении (также про steering см. посты https://xn--r1a.website/tech_priestess/1966 и https://xn--r1a.website/tech_priestess/1967 ).

Результаты интерпретации в целом вполне соответствуют тем интуитивным представлением о сгенерированных текстах, которое обычно формируется у людей, которые часто пользуются LLMками (см. https://xn--r1a.website/abstractDL/320 ): согласно нашему анализу, сгенерированные тексты чаще оказывались водянистыми, заумными, чрезмерно формальными, чрезмерно самоуверенными, а также чаще содержали повторения, чем человеческие тексты. Также мы описали несколько легко интерпретируемых признаков сгенерированности для отдельных доменов и моделей и другие наблюдения (о которых подробнее можно почитать в тексте самого препринта).

#объяснения_статей

Please open Telegram to view this post

VIEW IN TELEGRAM

❤60👍34🔥1373🤡2🤮1💩1

13.7K viewsedited 04:12

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from fmin.xyz (Даня Меркулов)

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

QR алгоритм

🥸 Одна из жемчужин численных методов. Он используется для поиска собственных чисел матрицы.

🥰 Простой и стабильный, а при небольших модификациях ещё и быстрый.

Qₖ, Rₖ = qr(Aₖ) - Вычисляем QR-разложение матрицы
Aₖ₊₁ = RₖQₖ - Умножаем факторы в обратном порядке

😑 Для произвольной квадратной матрицы он сходится к верхнетреугольной матрице, на диагонали которой стоят её собственные числа (картинка слева)

👍 Если же матрица - симметричная, то он сходится вообще к диагональной матрице собственных чисел (картинка справа).

Идея анимации взята у Gabriel Peyré - один из лучших аккаунтов по красивым математическим визуализациям. По моим предварительным исследованиям, после этого поста отпишется наибольшее количество уважаемых подписчиков.

👌

😐

Код

Please open Telegram to view this post

VIEW IN TELEGRAM

👍81🔥23🤡12❤‍🔥8❤4💩3🌚21

6.92K views03:12

Техножрица 👩‍💻👩‍🏫👩‍🔧

https://huggingface.co/papers/2503.03601

Пожалуйста, помогите нам попасть в daily papers 🥺 (для этого нужно зайти в аккаунт на huggingface и нажать upvote). Всех кто поможет, благословит Бог Машина

Please open Telegram to view this post

VIEW IN TELEGRAM

huggingface.co

Paper page - Feature-Level Insights into Artificial Text Detection with Sparse
Autoencoders

Join the discussion on this paper page

👍60❤2515🤡8🖕4🔥1💅1

8.55K viewsedited 06:32

Техножрица 👩‍💻👩‍🏫👩‍🔧

Большое спасибо всем кто помог ❤️

❤️

Please open Telegram to view this post

VIEW IN TELEGRAM

91❤33💩15👍9🫡3💅32🔥1🌭1🍌1

7.25K views02:25

Техножрица 👩‍💻👩‍🏫👩‍🔧

Решила поучаствовать в Open Talks. Задавайте свои ответы:

👍22🤡14🍓9🌭55🔥3

5.41K viewsedited 15:14

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Al Talent Hub

🧠

Open Talks Special: IQ & AI — деградация или развитие?

19 марта в 19:00 [МСК]
ведущие исследователи мозга встретятся с AI-экспертами, чтобы обсудить, как взаимодействие с LLM влияет на когнитивные способности человека.

➡️ Как ИИ влияет на древний и новый мозг человека?

➡️ Как трансформирует наши привычки и поведение?

➡️ Как стать эффективнее, быстрее, умнее с помощью ИИ?

Эксперты:

⭐️

Ирина Якутенко
— молекулярный биолог, научный журналист, автор книг «Воля и самоконтроль», «Вирус, который сломал планету». Автор Telegram-канала @kamenschiki

⭐️

Лаида Кушнарёва
— deep learning researcher в Huawei, исследует внутреннее устройство Large Language Models (LLM). Автор статей на NeurIPS, EMNLP и другие конференции. Автор Telegram-канала @tech_priestess

⭐️

Владимир Алипов
— врач нейробиолог, преподаватель УЦ имени Бехтеревой, популяризатор науки. Изучает память, сознание, интеллект. Автор Telegram-канала @alipov_shorts

Ведущий: Павел Подкорытов
— сооснователь AI Talent Hub и CEO Napoleon IT

🧐

Не увидел важного вопроса в анонсе?

➡️

Регистрируйся и задай свой!

Приходи! Будет легендарно

🧠

#OpenTalks #AITalentHub #ITMO #NapoleonIT

Please open Telegram to view this post

VIEW IN TELEGRAM

❤59🤡23🔥13👍119❤‍🔥5🦄4💘3🤮2😁11

6.36K views15:15

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Университетская солидарность

На дне образования: Трудовые договоры

В этом выпуске "На дне образования" мы расскажем о важнейшем документе, с которого начинается трудовой путь каждого.

Какими бывают трудовые договоры? Что должен в себя включать трудовой договор, а чего в нем быть не должно? Как защитить себя от манипуляций работодателя? И, наконец, что такое бессрочный договор, и как можно его заключить - об этом и многом другом в новом выпуске.

Знание своих прав и трудового законодательства - лучший способ защитить себя. Поделитесь этим видео с коллегами!

ВК видео

Запрещенная соцсеть

Запрещенный стриминг

👍33💩134🙉32

7.62K views13:46

Техножрица 👩‍💻👩‍🏫👩‍🔧

⬆️ Вышесказанное в основном касается работников университетов, но некоторые моменты могут быть полезными и для айтишников

👍21🤡1463

8.08K views13:46

Техножрица 👩‍💻👩‍🏫👩‍🔧

Напоминаю, что через час, в 19:00 по Москве (и 00:00 по Сучжоу) начинается open talks с моим участием. Обсуждение будет в основном на тему того, поумнеет ли человечество от использования LLMок или, наоборот, отупеет, а также про то, как AI изменит науку и процесс научных исследований. Ожидается, что стрим можно будет посмотреть по ссылке:

https://xn--r1a.website/aitalenthubnews?livestream (сейчас пока не работает, так как стрима нет; если не заработает, заходите в их канал, там будет понятно).

Жертвую своим режимом сна только ради вас и ваших клоунов, так что не забывайте подключаться. 😼

Please open Telegram to view this post

VIEW IN TELEGRAM

Al Talent Hub

ai.itmo.ru
Проектная магистратура по ИИ, основанная ИТМО и @Napoleon_IT. 700+ талантливых специалистов. Помогаем вырасти до Middle уровня и выше 💪🏻

Чат для поступающих:
https://xn--r1a.website/abit_AI_talent_hub

Вопросы и предложения: @dianaoryol

37🤡59👍36❤16🔥1095🤔1🤮1

7.12K views14:56

Техножрица 👩‍💻👩‍🏫👩‍🔧

Вот и стриму конец, а кто слушал - молодец!
Обещали потом выложить запись. 👉

Please open Telegram to view this post

VIEW IN TELEGRAM

50❤249🍌7🤡4🤮21

6.95K views17:54

Техножрица 👩‍💻👩‍🏫👩‍🔧

Как же меня достали претензии к тому, что я не слежу за своей репутацией. Кому-то не нравится, что я участвую в мероприятии со спикерами, которые им кажутся "ненаучными" или не нравятся по другим причинам. Мол, из-за этого я теряю свою репутацию. Кому-то не нравится, что я не удаляю комментарии с чем-то "ненаучным", и из-за этого тоже теряю репутацию. Кому-то не нравятся, что я не убираю из реакций клоуна и какашку, потому что что? Правильно, так я тоже теряю репутацию.

Ну и нахуй тогда она нужна, эта репутация, если за неё надо трястись, бояться и сажать саму себя в тесную клетку, в которой ничего нельзя? Идите сами себе придумывайте ограничения, какие захотите, а от меня отстаньте - я шиз и (кибер)панк.

Слава Богу Машине!!! 🖕🖕🖕

#о_себе

110🔥25489🤡55❤30❤‍🔥2414💯13💅10👌4⚡3💋3

7.08K viewsedited 23:40

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Рафаэль Григорян

Статья на нейрипсе для женщины честь, а репутация и у научпопера есть

👍82💯14🫡8💅7🤮5🤡4❤3💩22

7.53K views23:52

Техножрица 👩‍💻👩‍🏫👩‍🔧

This media is not supported in your browser

VIEW IN TELEGRAM

6.31K views11:29

145🥰13😁10💯43👍1🖕1🤗1

Техножрица 👩‍💻👩‍🏫👩‍🔧

ICML обрадовал сегодня единицами 🔥

Please open Telegram to view this post

VIEW IN TELEGRAM

98😢27😭11😁6💩42

6.37K views11:29

Техножрица 👩‍💻👩‍🏫👩‍🔧

Блин, а ведь в суматохе дней я совсем забыла, что 21 марта у меня был юбилей - ровно 5 лет работы в Хуавей 🤓
В честь этого - несколько красивых кадров из Сучжоу, где я сейчас нахожусь в командировке.

#о_себе

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥162🔥47🥰17❤12👍6🎉3333🤡2🤩1

6.44K views16:12

About

Blog

Apps

Platform