Техножрица 👩‍💻👩‍🏫👩‍🔧 – Telegram

Техножрица 👩‍💻👩‍🏫👩‍🔧

@tech_priestess

14.1K subscribers

1.45K photos

66 videos

28 files

769 links

Люблю высокие технологии и кушать.

Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.

Download Telegram

About

Blog

Apps

Platform

Техножрица 👩‍💻👩‍🏫👩‍🔧

14.1K subscribers

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from какая-то библиотека

🆕

🆕

🆕

Гайд для студентов по поиску и анализу научной информации

〰️

О чем этот гайд?
Этот материал поможет вам эффективно работать с научной литературой, начиная от постановки цели и поиска источников до их анализа и систематизации.

〰️

Ключевые разделы гайда:

- Зачем нужна научная литература?
- Поиск информации для научной работы
- Использование сетей цитирования и ИИ-инструментов
- Международные базы (Scopus, Web of Science, BASE)
- Тематические ресурсы для гуманитарных, естественных и технических наук
- Российские базы данных: РИНЦ, КиберЛенинка, НЭБ
- Легальные и альтернативные способы получения статей
- Как выбрать релевантные источники
- Оценка качества изданий, авторов и контекста цитирования.
- Библиографические менеджеры

🔤

Для кого этот гайд?

Для студентов, которые хотят писать курсовые и дипломные работы быстро и качественно. Для тех, кто ищет оптимальные способы работы с научной информацией.

Скачайте гайд и начните свой путь к научным успехам!
📍 Ссылка на гайд

〰️

Агент в ChatGPT, который тоже умеет консультировать по работе с научной литературой.

Please open Telegram to view this post

VIEW IN TELEGRAM

Гайд для студентов

Гайд для студентов по поиску и анализу научной информации Подписывайтесь на наш телеграм-канал [https://xn--r1a.website/selfmadeLibrary] и поддержите нас на Бусти [https://boosty.to/newsinserity/donate] Оглавление Оглавление
2 Введение
3 Зачем нужна научная литература?…

2019❤13👍106❤‍🔥5🔥42

7.7K views08:10

Техножрица 👩‍💻👩‍🏫👩‍🔧

Атмосфера в комментариях любого ML паблика без автоматической модерации через 0.0001 наносекунду после поста в последние несколько дней

💯109😁5720🍓862👍1🔥1

31.6K views08:33

Техножрица 👩‍💻👩‍🏫👩‍🔧

Теренс Тао (математик, филдсовский лауреат) рассказывает про реджекты (отклонение) своих статей из журналов 🥴 (ниже будет Tl;Dr на русском):

Rejection is actually a relatively common occurrence for me, happening once or twice a year on average. I occasionally mention this fact to my students and colleagues, who are sometimes surprised that my rejection rate is far from zero. I have belatedly realized our profession is far more willing to announce successful accomplishments (such as having a paper accepted, or a result proved) than unsuccessful ones (such as a paper rejected, or a proof attempt not working), except when the failures are somehow controversial. Because of this, a perception can be created that all of one's peers are achieving either success or controversy, with one's own personal career ending up becoming the only known source of examples of "mundane" failure. I speculate that this may be a contributor to the "impostor syndrome" that is prevalent in this field (though, again, not widely disseminated, due to the aforementioned reporting bias, and perhaps also due to some stigma regarding the topic). ...

With hindsight, some of my past rejections have become amusing. With a coauthor, I once almost solved a conjecture, establishing the result with an "epsilon loss" in a key parameter. We submitted to a highly reputable journal, but it was rejected on the grounds that it did not resolve the full conjecture. So we submitted elsewhere, and the paper was accepted.

The following year, we managed to finally prove the full conjecture without the epsilon loss, and decided to try submitting to the highly reputable journal again. This time, the paper was rejected for only being an epsilon improvement over the previous literature!

Tl;Dr: Однажды Теренс вместе со своим соавтором доказали математическое утверждение с точностью до эпсилон и отправили этот результат в крутой журнал. Однако, статью отклонили из-за того, что утверждение было доказано не в исходной формулировке, в лишь с точностью до эпсилона, и пришлось отправлять её в другой журнал. 🥴 В следующий раз, они доказали утверждение в точной формулировке (без эпсилона) и снова отправили в первый журнал. Теперь статья была отвергнута из-за того, что являлась эпсилон-улучшением предыдущей статьи 😂
Кроме того, Теренс пишет, что его статьи в целом регулярно (1-2 раза в год) подвергаются реджекту. Это нормально даже среди лучших ученых, но не все об этом рассказывают. Вероятно, из-за этого у многих людей в науке развивается синдром самозванца, т.к. они много слышат о чужих успехах, но очень мало - о неудачах.

Источник: https://mathstodon.xyz/@tao/113721192051328193

#наука

Terence Tao (@tao@mathstodon.xyz)

One of my papers got declined today by the journal I submitted it to, with a polite letter saying that while they found the paper interesting, it was not a good fit for the journal. In truth, I largely agreed with their conclusions, and the paper is now…

285😭32❤14😁866👏4🤷‍♂2🔥2👍1

9.76K viewsedited 09:23

Техножрица 👩‍💻👩‍🏫👩‍🔧

1🔥22🙏3👍2🤮21

6.78K views12:39

Техножрица 👩‍💻👩‍🏫👩‍🔧

❤53🤣36😁123🎉1

7.94K views14:17

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Проветримся!

This media is not supported in your browser

VIEW IN TELEGRAM

К вопросу о том, как выглядит безопасный искусственный интеллект by design:

Моделька для генерации видео по картинке Kling v1.6, получив на выход проблему вагонетки, сгенерировала трамвай медленно пятящийся подальше от прикрученнных к рельсам людей.

❤161😁741984🔥2

6.56K views19:09

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Artem Khrapov

This media is not supported in your browser

VIEW IN TELEGRAM

Ещё такое решение мне нравится)

В стиле доктора Манхеттена какого-нибудь

39😁28👍85

7.09K views20:12

Техножрица 👩‍💻👩‍🏫👩‍🔧

Похвастаюсь продуктивно проведенным последним днём каникул: этот красавец вчера убил ТРЁХ космодесов-саламандр 😈

😈

😈 (киллтим)

Please open Telegram to view this post

VIEW IN TELEGRAM

👍995218🔥13🤓10❤9🥴66👎1🍌1💅1

6.27K views10:48

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Рациональная мемология

💯104😁55🔥14❤8🥰6😭5👍1

5.67K views05:55

Техножрица 👩‍💻👩‍🏫👩‍🔧

Полтора года назад я упоминала в паблике статью "Representation Engineering: A Top-Down Approach to AI Transparency" ( пост: https://xn--r1a.website/tech_priestess/974 , статья: https://arxiv.org/abs/2310.01405 ).

Напомню основной прикол: авторы этой статьи находили такие направления в пространстве эмбеддингов языковой модели, которые соответствуют определенным концептам / аспектам поведения этой модели. Например, нашли направление, соответствующее концепции "Truthfulness": если сдвинуть эмбеддинг последнего слоя вдоль этого направления в положительную сторону (т.е. прибавить к нему вектор "Truthfulness" с положительным коэффициентом), то модель станет наукоботом - начнет отрицать псевдонауку, высказывать сентенции, соответствующие общепринятым представлениям о критическом мышлении и даже более правильно отвечать на некоторые фактические вопросы. И наоборот, если сдвинуться в сторону отрицательного "Truthfulness", то модель станет шизом - начнет верить в теории заговоров, лечение методами доктора Попова и инопланетян в зоне 51. Проверялась наукоботность / шизовость модели на датасете TruthfulQA ( https://arxiv.org/abs/2109.07958 ), который, может быть, немного спорен, но основную суть улавливает. Находили и многие другие прикольные направления в пространстве эмбеддингов, которые делают модель более честной / нечестной, моралфагом / психопатом, меняют ее настроение на хорошее / плохое и т.п.

Так вот. Я время от времени вспоминала эту статью в связи с разными обсуждениями вопросов интерпретируемости и alignment, а недавно мне на глаза попалась ещё пара препринтов, продолжающих ту же тему и более свежих. Так что я решила сегодня написать о них пару слов.

#объяснения_статей

Техножрица 👩‍💻👩‍🏫👩‍🔧

Интересный рассказ с картинками про то, как приноровились менять поведение предтренированной модели, воздействуя непосредственно на её эмбеддинги:

https://xn--r1a.website/seeallochnaya/682
https://xn--r1a.website/seeallochnaya/685
https://xn--r1a.website/seeallochnaya/687
(Три последовательных…

27🔥17👍9❤6

6.2K viewsedited 18:30

Техножрица 👩‍💻👩‍🏫👩‍🔧

Так, в статье "Analyzing the Generalization and Reliability of Steering Vectors" ( https://arxiv.org/abs/2407.12404 ) анализируют проблемы с обобщаемостью одного, очень простого метода нахождения таких вот концептуальных векторов (их здесь называют "steering vectors", так как с их помощью можно контролировать модель, как бы рулить ею).

Суть метода такова: модели задают вопрос, связанный с определенным концептом, например, тем же Truthfulness, и перечисляют два варианта ответа: например, под буквой A предлагают наукоботный ответ, а под B - шизовый. В общем, делают обычный Multi-Choice Question Answering. Далее берут представление токена буквы А и представление токена буквы B, отнимают одно от другого. Повторяют то же самое для всех вопросов из целевого датасета, усредняют и получают вектор ~~шизы~~ Truthfulness.

Авторы статьи показали, что steering vectors, найденные таким методом и хорошо работающие на одном датасете, часто существенно хуже работают на другом. Кроме того, эти steering vectors как бы сплетаются с "шумными", ненужными нам свойствами эмбеддинга. В общем, конкретный steering vector может сильно зависеть от деталей реализации алгоритма, с помощью которого он получен и от данных, на которых он получен.

—

Что же касается второй статьи, "Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution" ( https://arxiv.org/abs/2410.00153 ), тут авторы решили искать вместо одного вектора-концепта целое подпространство-концепт. Для этого они разбивали датасет с примерами на большое количество под-датасетов, и для каждого под-датасета считали steering vector независимо, так что получался не один, а целое множество векторов (метод их нахождения, кстати, отличался от описанного в предыдущей статье). Далее, авторы предположили, что эти вектора являются сэмплами из некоторого d-мерного гауссовского распределения (где d - размерность эмбеддинга) с диагональной ковариационной матрицей, т.е. такого, где каждая координата независима (это допущение, конечно, делалось из соображений экономии вычислений). Ну а потом посчитали параметры распределения и назвали это Gaussian Concept Subspace-ом, для краткости, GCS.

Далее, авторы сэмплировали вектора из этого GCS и показывали, что они действительно отражают смысл концепта (например, смещение по вектору, соответствующему положительному / отрицательному отзыву, действительно делает отзыв таковым - проверялось это с помощью автоматического evaluation).

Добавлю пару комментариев от себя : как мне кажется, методология в этой статье несколько спорная, а практическая польза пока не ясна, т.к. для влияния на выход модели достаточно использовать просто усреднение всех steering vectors вместо сэмплирования из распределения. Однако, направление мысли мне понравилось. Действительно, концепты, подобные тем, что находят в этих статьях, вряд ли на самом деле укладываются в один вектор, и было бы неплохо перейти от steering vectors к steering subspaces или чему-то ещё такому, более обобщенному.

—

Из любопытного напоследок могу отметить, что в каждой из трех перечисленных статей рассматривали разные методы нахождения steering vectors и местами использовали разную терминологию, что говорит о том, что данная область исследований пока только нарождается и, возможно, в будущем принесет ещё больше интересного.

#объяснения_статей

Analyzing the Generalization and Reliability of Steering Vectors

Steering vectors (SVs) have been proposed as an effective approach to adjust language model behaviour at inference time by intervening on intermediate model activations. They have shown promise in...

🔥54👍177❤52

7.72K views18:35

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Labrats

С развитием технологий машинного обучения становится все труднее отличать текст, написанный машиной, от текста, написанного студентом, обученным на примерах, сгенерированных чатжпт

😁121❤6418💯7🔥5👍2⚡1

5.23K views16:51

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Love, Death & Math

😁10915🔥76👍22

6.01K views20:19

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Дата канальи — про «специалистов» в данных / ML / AI

Кстати про технические сложности
Вспомнился старый кейс, где я вовсю ощутил свой недостаток образования в Computer Science.

В далеком кризисе 2014 года меня приютила одна по доброте душевной (а там правда очень классные люди) компания, которая разрабатывала софт для нефтяной сейсмики. У Яндекса там была существенная доля и хорошее отношение – которое выражалось, например в том что компания называлась Яндекс.Терра, а сотрудники могли быть слушателями ШАД.

Разработка на C/ С++ это вот ни разу не python или Matlab (мой основной иснтрумент тогда), и я в нее не умел (о чем честно сказал на входе). А задачи были – писать модули для той большой системы, и на старте мне дали достаточно простые – одноканальная обработка сигналов, всякие фильтрации/свертки, немного со спектрами и кепстрами.

И как-то мне нужно было пройтись по спектру с шагом 0.1 Гц, что-то сделать, а затем к результату применить обратное Фурье. Только вот не всегда результат обратного преобразования Фурье будет вещественнозначным ) Поэтому делать надо было аккуратно, с первого раза в C не получилось. Списав все на свои кривые руки, решил сделать в матлабе. И там волшебным образом все заработало!

Несколько дней я потратил, пытаясь добиться того же результата в C – без шанса 🙈🤯.
В матлабе же не только индексация массивов отличается)
В итоге пошел на поклон к синьору и тут вскрылся мой недостаток образования на тот момент в CS. Что-то о свойствах вещественных чисел я знал (что на равенство сравнивать нельзя, ибо хранятся они в некотором приближении), но вот глубоко не копал – на чем и погорел.

В чем же была проблема?
Как это выглядело в Matlab:


d = 0;
for i = 1:10000
    d = d + 0.1;
end
fprintf('%.25f', d)
>>> 1000.0000000001588205122970976

Аналогично на python:


d = 0
for i in range(10_000):
    d += 0.1
print(d)
>>> 1000.0000000001588

И вот то же самое (на самом деле нет) на C:

  
   float d = 0;
   for (int i = 0; i < 10000; ++i)
   {
       d += 0.1;
   }
   printf("%.6f", d);
>>> 999.902893

Дело было в том что 0.1 в двоичном виде непредставима как конечная дробь, только как периодическая. А с ограничением точности (float против double, который по умолчанию в python) при суммировании ошибка накопилась и достигла настолько существенных величин, что обратное Фурье становилось комплексным 😱.

PS как-то у коллеги видел очень похожую ситуацию в python (только там он при чтении из файла во float сохранил), уже в 16м, подсказал – помогло.
А копать с тех пор стараюсь поглубже 🪆

👍74❤20🔥1412😁6🤡54🤓3🤔1💔1

6.04K views13:13

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from The Layer (Irina Tolstykh)

В недавнем исследовании про таргетированный AI-фишинг авторы собирали информацию в интернете о человеке, с помощью GPT-4o и Claude 3.5 Sonnet составляли его профиль, на основе которого генерировали персонализированные фишинговые сообщения. Что интересно, в 88% случаев профили оказывались точными и полезными, а click-rate на ссылки в автоматически сгенерированных письмах составил 54%. Это значение совпало с click-rate для писем, написанных человеком-экспертом. В аналогичных же исследованиях прошлого года, чтобы достичь уровня экспертов, моделям требовалось участие человека.

Результаты лишний раз подчеркивают необходимость создания и улучшения детекторов сгенерированного контента.

LLM модели совершенствуют свои «‎обманные способности»‎, а мы продолжаем совершенствовать нашу модель детектирования для русскоязычных текстов GigaCheck. Обновленная версия уже доступна в нашем Telegram-боте. Кроме того, мы добавили нашу новую модель (находится на стадии бета-тестирования), которая умеет определять в co-written текстах фрагменты текста, созданные LLM. Вы можете легко переключать модели через команду /model.
Напомним, что используемый нами подход для детекции интервалов основан на архитектуре DN-DAB-DETR, подробнее можно почитать в опубликованной нами статье, про которую мы писали в этом посте.

Заходите в бот, тестируйте, и не дайте злоумышленникам вас обмануть! 😊

👍21🤣95🔥4🤔3

7.27K views10:20

Техножрица 👩‍💻👩‍🏫👩‍🔧

⬆️ Кто-нибудь пробовал атаковать этот детектор? Если да, поделитесь результатами

6.9K views10:21

Техножрица 👩‍💻👩‍🏫👩‍🔧

Я просто зашла в курс https://stepik.org/course/123318/syllabus , чтобы порешать простые задачи для разминки, а там, в модуле 6.1 был рис. 1... 😳😳😳

...

Боже, насколько же меня испортил интернет... ☺️

😁137🤣4010🤡4🍌4⚡2👍2🍓2👎11

7.16K views15:28

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Адель и МЛь

Команда Answer.AI месяц тестила ИИ-инженера Devin, который, напомню, обещает сам писать код, деплоить проекты и решать сложные задачи. На старте всё было круто: Devin легко затянул данные из Notion в Google Sheets и даже помог создать планетарный трекер (при этом команды давались через телефон). Но чем сложнее становились задачи, тем больше он начинал буксовать.

От бесконечных попыток сделать невозможное до кучи бесполезного спагетти-кода. Похоже, основная проблема Девина такая же как и у LLM в целом: неумение сказать “я не знаю” / “я не могу”. В целом, эксперимент быстро превратился в проверку на терпение. Итоговые цифры говорят сами за себя: из 20 задач — только 3 успеха, 14 провалов и 3 “непонятных” результата.

Основной вывод авторов — идея автономного ИИ для программирования классная, но в реальности Devin больше мешал, чем помогал.

Подробнее читать тут - хороший текст от уважаемых ребят

Thoughts On A Month With Devin – Answer.AI

Our impressions of Devin after giving it 20+ tasks.

1❤47🤷‍♀15💯1064👍2👨‍💻2🙏1🫡1

6.52K views12:21

Техножрица 👩‍💻👩‍🏫👩‍🔧

😈 Ловушка Джокера для GPT-5: 😈

https://zadzmo.org/code/nepenthes/

Описание с сайта:

This is a tarpit intended to catch web crawlers. Specifically, it's targetting crawlers that scrape data for LLM's - but really, like the plants it is named after, it'll eat just about anything that finds it's way inside.

It works by generating an endless sequences of pages, each of which with dozens of links, that simply go back into a the tarpit. Pages are randomly generated, but in a deterministic way, causing them to appear to be flat files that never change. Intentional delay is added to prevent crawlers from bogging down your server, in addition to wasting their time. Lastly, optional Markov-babble can be added to the pages, to give the crawlers something to scrape up and train their LLMs on, hopefully accelerating model collapse.

Демонстрация работы: https://zadzmo.org/nepenthes-demo/

Tl;Dr: чел придумал софт, с помощью которого можно генерировать бесконечное количество статических страниц с мусорным текстом и ссылками на такие же мусорные тексты. Цель - загнать crawler-а (поискового робота), который пытается полностью выкачать ваш сайт, в бесконечный лабиринт, из которого нет выхода и заставить возвращать своим хозяевам тонны мусора. Предполагается, что таким образом можно испортить новые соскрапленные с интернета датасеты для будущих LLM-ок и устроить им коллапс. 😠

Конкретно эта попытка, конечно, наивна, т.к. мусор здесь генерируется марковской цепью, а такое легко задетектировать на этапе очистки датасета перед тренировкой модели. Кроме того, такой сайт будет иметь очевидно аномальную структуру и, как следствие, быстро улетит в черный список при обходе, так что и времени на него тоже много не потратится. Но в целом идея такого адверсариального замусоривания чужих датасетов выглядит занимательно. Я легко могу себе представить более совершенную версию такого генератора, который будет создавать плохо детектируемый искусственный контент и более реалистичную структуру ссылок. Я не знаю, зачем этим занимается автор данного конкретного софта, но, возможно, какая-нибудь AI компания, создающая собственные LLM-ки, и правда в будущем начнет использовать подобное для ухудшения обучения LLM-ок конкурентов.

What a time to be alive? 🥴🥴🥴 #технокек

Please open Telegram to view this post

VIEW IN TELEGRAM

😁6923❤1413👍115🔥44

31.9K viewsedited 17:43

Техножрица 👩‍💻👩‍🏫👩‍🔧

Forwarded from Denis Sexy IT 🤖

This media is not supported in your browser

VIEW IN TELEGRAM

Как выглядит интерфейс DDOS-атаки на сервер в 2025 году

👏

Please open Telegram to view this post

VIEW IN TELEGRAM

😁91🥰30👏12💩106👍3😢2🔥1👌1

6.59K views11:25

Техножрица 👩‍💻👩‍🏫👩‍🔧

Техножрица 👩‍💻👩‍🏫👩‍🔧

😈 Ловушка Джокера для GPT-5: 😈 https://zadzmo.org/code/nepenthes/ Описание с сайта: This is a tarpit intended to catch web crawlers. Specifically, it's targetting crawlers that scrape data for LLM's - but really, like the plants it is named after, it'll…

😁17916766👎3🔥1

9.42K views21:47