law.exe

РУНЕТЛЕКС КОНФ

Мероприятие получилось огненное и чертовски плотное.

Павел (и конечно Ксюша, Катя, Валя и многие другие из команды) задали планочку.

#irl

🔥10👍4

224 views19:28

law.exe

ЛИЧНАЯ МЕТЕОСЛУЖБА

Вчерашнее воскресенье выдалось особенным - я красил яйца, смотрел на небо и думал: «Прости, Юра, Христос воскресе». А все выходные до этого пилил мини-проект в честь Дня космонавтики. Показываю четыре картинки - это не просто красивое, а живые данные, которые можно тянуть по API прямо сейчас.

⬖ № 1 - карта аллергенной пыльцы в Европе. Визуализация математической модели SILAM от Финского метеорологического института. Одна из самых точных в мире моделей прогнозирования распространения пыльцы берёзы и ольхи.

⬖ № 2 - песчаные бури над Ливией и Египтом - снимок спектрометра TROPOMI на спутнике Sentinel-5P, который ежедневно сканирует всю атмосферу Земли для контроля загрязнений воздуха.

⬖ № 3 - тепловые аномалии в Череповце - NASA FIRMS, спутниковой системы, предназначенной для поиска пожаров. Красные точки - это тепловые аномалии, синие - известные техногенные источники тепла. Тепловая карта металлургии региона.

⬖ № 4 - последствия таяния снега в Казани. Данные краудсорсинговой сети Sensor Community показывают резкий рост концентрации мелких частиц (PM2.5 и PM10) в марте, во время таяния снега. Зима покажет, кто где срал - вся грязь и реагенты, копившиеся в сугробах, попадают в атмосферу.

Так уж получилось, что в силу личных биологических причин я живо интересуюсь качеством воздуха. И вот собрал собственный портал по качеству воздуха с единой картой, куда интегрированы: прогноз пыльцы, спутниковые данные и наземные сенсоры. Это мой самый большой вайб-кодинговый проект: около 20к строк кода плюс база данных.

#vibecoding

🔥10

306 views20:00

law.exe

[Тут должен быть заголовок, но законы России сделали это невозможным]

Есть один знаменитый университет, который в России знаменит настолько, что входит в перечень нежелательных организаций. Так вот этот университет давненько следит за развитием искусственного интеллекта с тех самых пор когда это еще не было мейнстримом и выпускает научные материалы на эту тематику. Но так как в нашей стране подобные материалы распространять нельзя, я лишь перескажу основные выводы:

⬖ Развитие ИИ и не думает замедлятся. Темпы развития не снижаются, а 2025 год побил предыдущие.

⬖ Знания ИИ неравномерны. Модели стали еще умнее, в науке приблизились к человеку, решают олимпиадные задачки, но путаются в детских загадках и слабы в логике. Это не ново, Ханс Моравек рассказывал об этом с в 80х. 2025 обозначился прорывом в кодинге, но мы вайбкодеры об этом и так знаем.

⬖ Беспрецедентная скорость распространения. ИИ за три года накрыл 53% населения Земли - быстрее, чем в свое время ПК и Интернет, но уровень использования прямо коррелируется с бедностью.

⬖ Полярные взгляды на технологию. AI-специалисты говорят о высоком влиянии технологии на мир (каждый кулик своё болото хвалит), но широкая публика считает иначе.

⬖ Сильнейшее влияние на образование. 80% американских старшеклассников и студентов используют нейросети для учебы, в то время как учителя не понимают, что с этим делать. Тут как всегда - молодежь быстро подхватывает технологии, пока мамонты пытаются адаптироваться.

#новости #цензура

🔥4

398 viewsedited 16:51

law.exe

НЕ РАСТЯГИВАЙТЕ РАЗГОВОРЫ C LLM

В этом посте поговорим про промпт-инжиниринг. В мае 2025 года Microsoft Research и Salesforce опубликовали статью «LLMs Get Lost in Multi-Turn Conversation» - времени прошло немало, протестированные LLM уже не в моде, однако выводы очень интересные. Собственно суть:

Исследователи взяли пучок LLM ( в т.ч. и топы вроде GPT-4.1, GPT o3, Claude 3.7 Sonnet, Gemini 2.5 Pro и Flash, DeepSeek-R1 и т.д.) и прогнали через них 200 000+ симулированных диалогов, с одним и тем же набором задач: код, SQL, математика, резюмирование. Но информация подавалась двумя разными способами: целиком в одном сообщении (single-turn) и по кускам в несколько заходов (собственно тот самый "multi-turn conversation" из названия исследования).

Результат: подход "всё сразу" показывает в среднем на 39% лучшую производительность чем "по частям", причем у всех: у моделей маленьких и больших, размышляющих и не очень.

Что происходит:

⬖ При уточнении задачи в последующих сообщениях, модель пытается "встроить" их в существующие ответы, создавая франкенштейна из прошлых предположений и новых правок.
⬖ Свернуть не туда достаточно один раз, дальше модель скатывается по скользкой дорожке (цитирую: when LLMs take a wrong turn, they get lost and do not recover).

Что точно не помогает (исходя из исследования):

⬖ Размышления (тут кстати любопытный момент - Gemini 2.5 Pro не была упомянута авторами как думающая, мама миа, считай нашел косяк в именитой статье) не помогают, а скорее затрудняют дело (больше мыслей - больше предположений и метаний).
⬖ Снижение температуры до нуля.
⬖ Промпт-прием вроде "повтори всё сказанное в последнем сообщении" дает прирост +15-20%, но до уровня single-turn не дотягивает.

Выводы:
Золотое правило "чем короче - тем лучше" заиграло новыми красками за пределами деградации контекста (неэффективная обработка информации в рамках контекстного окна - context rot).
Другое золотое правило "без ТЗ - результат ХЗ" было повторно апробировано.

Что делать:
Не знаете чего хотите - собираете контекст в одном чате, а потом начинаете новый чат с четкой задачей.

#prompting

👍7🔥5

319 views18:28

law.exe

ИИ-РЕВОЛЮЦИЯ? РАБОТОДАТЕЛИ НЕ В КУРСЕ

Правильно говорил один известный философ о том, что безделье - игрушка дьявола. Поэтому я решил не впадать в шашлычный угар на выходных, а немного поковыряться в данных юридического рынка труда.

Источник - HH.ru, окно сбора данных - 29 апреля по 1 мая 2026, инструментарий - мои любимые LLM. Мини-отчет ниже, здесь только выжимка:

⬖ Проведен анализ 4 036 вакансий;
⬖ Из них юридическими оказалось 2 230 вакансий (в качеству поиска появляются вопросики);
⬖ ИИ упоминается в 79 — это 3,5%.

Там где ИИ упоминается полный винегрет: это может быть как требование к соискателю, как преимущество работодателя (у нас развернуты локалки, пыщ-пыщ), так и скупое упоминание в тексте через запятую с остальными терминами (IP, IT, AI).

Выводы: до ИИ трансформации юридической отрасли еще очень далеко.

Ответственно заявляю: я не настоящий ~~сварщик~~ исследователь, методы исследования вызывают вопросы, но я ответственно заверяю, что Headhunter не пострадал, а мое любопытство удовлетворено.

🔥9😁3

675 viewsedited 08:52

law.exe

ai-in-hh.pdf

135.3 KB

👍3

669 views08:53

law.exe

ПЯТЬ ЧАСОВ - НОВЫЙ СТАНДАРТ

Хотелось бы говорить о пятичасовом рабочем дне, но увы. Разговор будет о пятичасовом скользящем окне лимитов:

⬖ Claude - первая ласточка. Скользящее окно работает у него уже давно: привязка идёт не к конкретному времени, а к началу использования. Отправил первое сообщение - время пошло.
⬖ ChatGPT - подхватил эстафету. Раньше при слишком активном диалоге тебя на пару часов переключали на модельку попроще, но теперь пятичасовое окно зафиксировано в документации.
⬖ Gemini - присоединился к профсоюзу буквально на днях. Ввел новую политику с пятичасовыми и недельными лимитами.

Итого: 5 часов - это индустриальный стандарт, под которым подписались все большие дяди.

ПЕРЕКРОЙ ПРИВЫЧЕК

Чтобы пост был не чисто новостным, расскажу, как новый хронометраж перетряхнул мой распорядок. Последние несколько лет работаю на удаленке, пару месяцев плотно живу в Claude.

⬖ Только продрав глаза, врубаю комп и кидаю банальное «Привет, какие новости». Цель - запустить скользящее окно ДО начала работы. Дальше иду на утренние процедуры, а таймер тикает.
⬖ Считаем: рабочий день 8 часов + обед = 9, а два полных цикла лимитов - это 10. Таким образом, обновление попадает плюс-минус на обед.
⬖ Первая половина дня всегда самая нагруженная, иду обедать - возвращаюсь к обновлённому Claude. Второго присеста обычно хватает, чтобы добить работу до вечера.
⬖ Вечером лимиты обновляются третий раз, и я переключаюсь на личные проекты. Итого три полных использования лимитов за сутки.

Юмор в том, что скользящее окно (а не я) теперь определяет ритм моего дня.

🔥8👍1

181 viewsedited 07:29

law.exe

ДЕТЕКЦИЯ ИИ КОНТЕНТА

Искины генерят контент с такой скоростью, что верить собственным глазам больше нельзя. Мы с Евдокией по уши закопались в тему и написали препринт статьи «Маркировка ИИ-изображений».

База: автором по закону может быть только человек, роботы авторства не порождают. Российские суды пока в тему особо не вникают, а вот EU AI Act требует вшивать в сгенерированный контент машиночитаемую метку.
Есть прямой способ - C2PA, открытый «паспорт контента»: криптоподпись и история правок, прицепленные паровозиком к файлу. Но паспорт лежит в кармане у файла и теряется на раз - пересохранил или загрузил в соцсеть, и метаданных нет.

А ТЕПЕРЬ САМОЕ ВКУСНОЕ

Для EU AI Act хватило бы одного C2PA. Но Google идет дальше и зашивает в картинки SynthID - клеймо, выжженное в самих пикселях. Переживает сжатие, кадрирование и множество других финтов ушами. Зачем делать больше, чем велит регулятор? Накидали мыслей:

⬖ Удалил водяной знак Google - нарушил пользовательское соглашение, а оттуда и до отказа в доступе ко всем сервисам недалеко (вместе с твоими данными на их серверах).
⬖ SynthID позволяет Google безошибочно узнавать «свой» контент - отсюда один шаг до приоритетного показа своего и тихого задвигания чужого в выдаче.

Выводы невеселые: штука, придуманная ради прозрачности и защиты человека, прекрасно конвертируется в инфраструктуру контроля и монополии. PDF под постом, будем рады критике.

#longread

🔥12👍4

119 viewsedited 11:02

law.exe

Статья_Маркировка_ИИ_изображений_Леонтьев_Шматина.pdf

6.7 MB

🔥9👍5

201 views11:02

law.exe

ЦИФЕРКИ ПРОТИВ ЛЮДЕЙ

Илья Семухин нашел очень интересное дело про детекцию сгенерированного текста. А дело-то родное - Верховный суд Республики Татарстан и Вахитовский районный суд Казани. Фабула простая: студентка пытается защитить диплом, работу прогоняют через "Антиплагиат.ВУЗ" - систему, которая вроде как умеет находить ИИ-контент. И тут начинается цирк.

Работу загружали трижды:

⬖ 7 июня - ИИ-контент 41,91%;
⬖ 8 июня - научрук заявляет, что более чем в 70% текста намеренно перемешаны слова, чтобы искусственно поднять оригинальность ценой смысла, называет это фальсификацией и отправляет работу на доработку;
⬖ 9 июня - ИИ-контент 11,92%, а оставшиеся 88,08% суд потом зафиксирует как показатель авторского текста и приравняет к требованию оригинальности не менее 50%.

Тут необходимо сделать оговорку, что неясно, изменялся ли текст между загрузками. Но в сухом остатке - отчисление. Добро пожаловать во взрослую жизнь.

Но девушка решила побороться в суде и победила. Основные выводы суда:

⬖ Человеческой верификации не было. Уже в заседании представитель ответчика признал: научный руководитель вообще не в курсе, как работает Антиплагиат, и компетенции проверять текст на ИИ у нее нет. Представитель также не смог объяснить принципы работы программы, пределы погрешностей и критерии достоверности - короче, ничего. Все просто посмотрели на выводы программы и решили: "И так сойдет!"
⬖ У Антиплагиата нет прозрачной методологии. Отчет системы - вероятностный по своей природе, и в нем самом стоит оговорка: окончательное решение за живым экспертом. А этот "эксперт" немножечко кнопкожим, да и не эксперт вовсе. Вишенка на торте: сравнили отчеты от 7 и 9 июня - одни и те же куски текста в одном помечены как "написал ИИ", а в другом - как "написал человек". И наоборот.

Итоги: вероятностная циферка, которую никто не понимает и не может перепроверить, не может быть единственным и бесспорным доказательством того, что студент жульничает.

Важный нюанс: судя по тексту, представитель вуза давил на то, что определенный процент сгенерированного текста сам по себе является проблемой. Правда, почему это проблема и как ее определять, не рассказал. От себя еще раз отмечу, что в отсутствие цифровых отпечатков в контенте способы определения ИИшницы больше напоминают гадание на кофейной гуще.

Грустная история (благо хоть с хорошим концом) о том, как непроверенные алгоритмы решают судьбу человека.

🔥7🤔2

82 viewsedited 08:15

About

Blog

Apps

Platform