Дамасские чернила | AI и M&A
1.22K subscribers
54 photos
2 videos
28 files
108 links
Об искусственном интеллекте в M&A-процессах (и иных юридических процессах) от практикующего юриста из консалтинга с ноткой постиронии.

Авторский канал Софьи Смирновой, советника корпоративной практики O2 Consulting.

Не является консультацией.
Download Telegram
Тем временем Харви Спектра раскусили...

Скандал с известнейшим стартапом Harvey AI. Если честно, я ожидала чего-то подобного...

Детали на реддите. Что ж, это примечательно, и очередное подтверждение того, что верить маркетинговой обертке в сфере ИИ и вообще нельзя.
Инновацией обычную gpt-прокладку не назовёшь.

Да и многие ИИ-стартапы не выдержат конкуренцию с техногигантами типа Гугла и Яндекса.
🤷‍♀3
250925_Смирнова_O2_Consulting_ПравоТех_презентация.pdf
4.4 MB
Друзья, делюсь своей презентацией с форума ПравоТех.

Лайк, шер, репост - приветствуются!

Презентация с дискуссионной части форума (превентивный риск-менеджмент в корпорациях) будет чуть позднее и вместе с саммари дискуссии для удобства восприятия.

Делитесь своими идеями и призывайте друзей делиться, я буду очень рада обратной связи. 🐇
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍11
Дамасские чернила | AI и M&A
💫"Наш самый быстрый и полезный модель" - GPT-5 вышла Moscow Digital School в апреле 2025 года провела исследование: 42,9% российских юристов уже используют ChatGPT, 80,4% считают, что ИИ повышает эффективность работы. Основные сферы применения — поиск информации…
Вышла Claude Sonnet 4.5 - передовая модель для сложных текстов

Свежая новость пылу с жару - новости 12 минут :). Традиционно лучшая модель для работы со сложным материалом.

Срочно бежим тестировать.

Основные новшества:
📍Поддержка долгих задач (30+ часов), больших контекстов и одновременного запуска нескольких инструментов. Модель способна сохранять фокус и контекст на протяжении более 30 часов работы над сложными многошаговыми заданиями, не теряя последовательности рассуждений и не допуская ошибок в логике выполнения. Это особенно важно для автоматизации крупных проектов — например, анализа крупных юридических задач
📍Улучшенный контроль и безопасность: возрастает защитa от prompt injection и вредоносного контента.

Пост будет обновлен
👍3
Дамасские чернила | AI и M&A
За эту методичку в чате Нейросети | Ilovedocs я полгода назад получила ироничное прозвище "Матерь промптов" :) Как изменилась ситуация за полгода? Полгода назад мы постигали искусство формулирования "идеальных" запросов к ИИ (промптов) по различным кейсам.…
Контекст-инжиниринг VS промпт-инжиниринг

Антропик выпустили методу по контекст-инжинирингу для ИИ-агентов, узнала новость тут (и советую подписаться).

Контекст-инженерия - это следующий этап. Промпт-инженерия - только её часть. Здесь задача состоит в том, чтобы не просто написать хороший промпт, а спроектировать «систему» - динамическую архитектуру, которая собирает, фильтрует, структурирует и в нужный момент подаёт модели релевантный контекст: историю диалога, извлечённые знания из базы документов (RAG), профиль пользователя (если применимо), актуальные данные из внешних источников, описания инструментов и формат вывода. Контекст-инженер работает не только с текстом запроса, а с архитектурой информационных потоков, динамически адаптируя содержимое окна контекста LLM под задачу агента на каждом этапе.

Я обещала написать пост про RAG - и обязательно сделаю это. В продолжение моего выступления на ПравоТехе меня позвали выступить на конференции в стенах СПбГУ, пост будет как раз кстати. Собственно, мой кейс будет о контекст-инженерии.

Stay tuned 🙃
👍42
Как создать доверие к ИИ-агенту для due diligence?

Это тот случай, когда добавить нечего. Это именно тот приём, который буду использовать для нашего RAG.

⬇️⬇️⬇️

TL;DR: Фича позволяет доверять ИИ-агенту больше, чем когда-либо до этого в процессе DD.

Gemini с box_2d принципиально меняет работу с документами для юридических задач — позволяет не только извлекать конкретные поля, но и точно фиксировать их положение на изображении.

Для юриста это важно, потому что дает точную привязку данных к оригинальному документу, что облегчает проверку и исключает риск ошибок при due diligence, аудитах и комплаенсе. Автоматизированные ИИ-агенты, использующие такие модели, могут не просто выдавать сведения, а обосновывать их с помощью визуальной верификации, что значительно повышает уровень доверия и снижает риски.

Для ИИ-агентов это открывает новые сценарии:
(1) Агент получает не только строчку текста, но привязку к оригинальному изображению, что позволяет строить сложные RAG‑пайплайны с точными ссылками на источник, реализовывать интерактивную обратную связь с пользователем и автоматизировать оценку ошибок.
(2) Проверка модели выходит на новый уровень: теперь QA-агент может быстро визуализировать, где была ошибка, и учесть это в дообучении либо выставлении метки качества. В корпоративных задачах — прозрачность процесса извлечения и однозначное обоснование результатов для compliance, аудита, M&A-процессов.

Gemini box_2d - фундамент для перехода к юридическим ИИ‑агентам, которые действуют прозрачно и доказывают каждое действие по цепочке.
👍4
Forwarded from Refat Talks: Tech & AI
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Image Understanding (box_2d) в Gemini - недооцененная суперсила для OCR и не только

Короче, как я перепробовал почти все и пришел к простому. Недавно работал над задачей: нужно было извлекать данные из документов (инвойсы, ID карты, чеки), причем не просто текст вытащить, а конкретные поля и обязательно показать пользователю откуда именно взяли каждое поле. То есть полноценный grounded extraction с визуальной верификацией.

Перепробовал кучу всего, включая OCR-движки и YOLO модели - все не то: или работает с узким набором доков, или вытаскивает все подряд, или надо дообучать.

И тут я вспомнил про фичу Gemini, которую использовал в других кейсах - Image Understanding с 2D Bounding Boxes. Удивился насколько это работает лучше всех предыдущих решений. Быстрее, точнее и вполне недорого (особенно с Flash).

Смотрите, большинство vision-моделей могут описать что на картинке. GPT, Claude, другие vision модели - все они видят текст, объекты и понимают контекст. Но Gemini делает больше: он может показать где именно на изображении находится то, что он видит. С точностью до пикселя.

В промпте надо упомянуть необходимость извлечения box_2d контуров и получаете не просто текст, а JSON с координатами каждого поля:

{
"box_2d": [245, 156, 289, 487],
"label": "DOCUMENT_NUMBER",
"value": "AB123456"
}


Координаты нормализованы от 0 до 1000, формат [ymin, xmin, ymax, xmax]. Дальше простая геометрия - и ты можешь наложить эти боксы на оригинал. Получается интерактивная подсветка: навел на поле в списке - подсветилось на изображении. Смотрите на видео демку из моего проекта.

Зачем это нужно: операторы могут проверять правильность извлечения прямо на документе, RAG-пайплайны хранят координаты для точных ссылок на источник, QA сразу видит где модель ошиблась, клиенты получают прозрачность - что извлекли и откуда.
Этот пост, кстати, хорошое дополнение к моему обзору LangExtract.

Технические нюансы
- Важно просить Gemini выдать именно box_2d (она натренирована таким образом): "The box_2d should be [ymin, xmin, ymax, xmax] normalized to 0-1000"
- Structured Outputs + JSON schema с box_2d отлично сочетаются и гарантируют валидный формат
- Flash/Flash Lite модели чаще всего достаточно (всего $0.10/$0.40 за миллион токенов), Pro для сложных отчетов
- Выключайте thinking для spatial задач (thinking_budget=0)
- Ресайзите до 640px по большей стороне (часто - лучший вариант, но зависит от кейса)
- Gemini 2.5+ поддерживает Segmentation Masks - то есть выдает также base64 png с точной формой объекта, полезно для computer vision задач и conversational segmentation типа "подсвети строки где сумма больше $1000"

Use cases за пределами документов: UI/UX тестирование и визуальные регрессии, e-commerce (детекция продуктов, ценников, инвентаря), quality control (дефекты, лейблы, компоненты), робототехника (навигация, захват объектов, инспекция).

Если вы делаете что-то с обработкой документов или изображений где важна локализация - попробуйте Gemini Image Understanding. Это недооцененная фича которая может сэкономить месяцы разработки и деньги на инфраструктуру.

🔥🔁
🔥5
🧋 Написала большую заметку про текущее состояние рынка ИИ-агентов от монополистов и его тренды на 2026 для корпоративного использования

TL,DR:

🍳 Ключевой фокус индустрии — борьба с «галлюцинациями» через контекст-инженерию: извлечение данных из верифицированных источников, перекрёстная проверка, оценка уверенности агента в выводах.

↗️ Прогноз на 2026: снижение барьеров и стоимости внедрения за счёт no-code платформ для ИИ-агентов и доступности методологий внедрения. Конкурентное преимущество смещается от обладания моделями к способности первыми выстроить и наладить инфраструктуру доверия и контроля качества в новую эпоху автономных интеллектуальных систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥1😱1
Forwarded from Делай RAG
Новый цикл общеобразовательно-рисерческих постов на канале под гордым названием #rise_of_RAG я начну с неожиданного вопроса: что вы знаете о Бразилии? Что бы вы о Бразилии ни знали ранее, сегодня вы узнаете, что в бразильском Сенате работают юристы-гигаумники, которые куют своими руками будущее права. Вот такой кликбейтный зачин!

Как многие читатели уже знают, я не умею писать короткие посты. На этот раз я переплюнула вообще все собственные ожидания от самой себя, и разразилась лонгридом — вот ссылка на Телеграф.
Этот материал в основном является обзором нескольких статей из стремительно накапливающегося корпуса публикаций по теме методов составления баз знаний для технологии Retrieval-Augmented Generation. При описании методов я пересказываю идеи авторов, свою оценку полезности не даю и перепроверить конкретными метриками тоже, разумеется, не могу. Хотя возникают шальные мысли что-то попробовать и некоторые эксперименты поставить.
О чем будет речь? О трёх подходах, эволюционировавших из обычных векторных RAGов — плоских или, как их еще называют, «наивных». Первый - Multi-Layered Embedding-Based Retrieval (MLR), многоуровневый или иерархический подход. Второй - GraphRAG, графовый. Третий — SAT-GraphRAG (Structure-Aware Temporal GraphRAG, структурно-темпоральный подход). В статье рассказываю о том, как они реализованы технологически, какие задачи решают и в чём они, по мнению авторов, лучше других.

Но этот лонгрид — не только пересказ статей. Вообще, если не любите вдаваться в технические подробности, это всё можно будет скипнуть и читать только последний раздел. В начале я делюсь своими выработанными практикой догадками о минусах наивных RAG, а в конце пытаюсь выявить первые принципы будущей методологии составления баз знаний для RAG-технологии, возможные области применения разных подходов и высказать некоторые свои гипотезы о нашем с вами будущем в свете всего этого.

Мне очень интересно, что вы об этом всём думаете. Я лично чувствую что-то, копая в этом направлении 🙂 правильных ответов нет, никто не знает, как надо, никто не знает, действительно ли всё это нам будет нужно. Но это ужасно интересная область приложения интеллекта, и мне очень хочется, чтобы вокруг неё сложилась дискуссия.

Приятного чтения!
7👍2🔥1
В честь 500 подписчиков 🌻

Дорогие читатели и гости моего уютного канала!

Спасибо, что мотивируете меня писать о своих мытарствах в AI.
Эссе про AI в M&A, как планировала, не получилось приурочить к красивому числу. Но я исправлюсь! Все слишком быстро меняется, не хочется писать что-то, что станет неактуальным, хочется дать что-то как must have - это, возможно, слишком амбициозная цель...

Выступила вчера с темой автоматизации на базе ИИ в юрконсалтинге в стенах СПбГУ вместе с коллегами из Сбера, Яндекса, МТС, Газпромнефти, КЕПТ, будучи единственным спикером от юрфирмы - свою презентацию прикладываю. Рассказала о текущем стеке и его проблематике. Во многом она основана на моей презентации с Правотех, но в этот раз я детально рассказала про эксперимент с RAG и объяснила, в чем отличие от NotebookLM.
Сегодня ещё разовью идеи на экспертной встрече Агентства стратегических инициатив. Ни пуха мне...
🔥8👍5👀33
Руководство от Perplexity по повышению эффективности (на русском)

Вчера, 22.10.2025, вышло руководство от уважаемых товарищей из Перплексити. Мы в админской любимого чата ilovedocs | нейросети перевели быстро на русский с deepl (Gregory 🫡) - enjoy your dinner!
👍871
pplx-at-work (12) ru.pdf
2.2 MB
Перплексити сделал саммари документа за нас :)
Чтение публичных оферт до добра никого не доводило. Верить им или нет в эпоху больших данных, когда речь идет об операторе ИИ - вопрос риторический.

По всей видимости, это байт на покупку корпоративных подписок, в которых обещания конфиденциальности есть (и то, веры в них нет...).
🔥4
Forwarded from Неискусственный интеллект (Илья Склюев)
Отечественные чат-боты превзошли американцев и китайцев... в сборе информации

Вечером среды мы внезапно поняли, что в приложениях «Алисы» и GigaChat почему-то нет простой кнопки, позволяющей отключить сбор и анализ ваших диалогов. Хотя у ChatGPT и DeepSeek настройка находится в пару кликов.

Оказывается, всё это не просто так. Отечественные компании ведут активный сбор данных, но используют их по-разному:

1️⃣ «Алиса» анализирует ваши «отдельные голосовые и текстовые сообщения» по умолчанию

Нам казалось, что отключить настройку можно через «Яндекс ID». Но в компании пояснили, что кнопка «Помогать Алисе стать лучше» действует только для умных устройств.

В сервисном соглашении «Алисы AI» в разделе про данные пользователя говорят, что «Правообладателю передается следующая информация: идентификатор Пользователя, Запросы, ответы на Запросы Пользователя, иная информация, предоставляемая и собираемая посредством пользовательского интерфейса Сервиса».

Используют их, конечно же, «в целях совершенствования в целях проведения анализа, развития и совершенствования Сервиса и его отдельных функций». А ещё для рекламы:

«Персональная информация Пользователя обрабатывается в целях предоставления функциональности Сервиса, в том числе для отображения контента, потенциально наиболее интересного Пользователю».

Не очень понимаем, как с такими условиями пользоваться агентскими фичами «Алисы». Если любая информация, попавшая в поле зрения бота, будет уходить для отображения интересного контента.


2️⃣ «Сбер» получает всё, но делать с этим ничего не будет

Пользуясь GigaChat, пользователь «предоставляет SDevices и Правообладателю право использования Контента Клиента <...> любыми способами, не противоречащими действующему законодательству, в том числе, указанными в п. 2 ст. 1270 Гражданского кодекса Российской Федерации, но не ограничиваясь ими».

В
корпоративном соглашении и в версии для физлиц подчёркивают, что «SDevices и Правообладатель не используют предоставленный или загружаемый Контент в собственных целях, не связанных с предоставлением Сервиса». Формулировка размытая, но нам официально заявили, что в «Сбере» не используют запросы пользователей для обучения нейросетей.

При этом, как только вы что-то сгенерировали в GigaChat, то вы передаёте компании лицензию на использование контента следующими способами:

▪️ «воспроизведение, хранение и запись в память ЭВМ Правообладателя и его аффилированных лиц и на серверах, назначенных Правообладателем, если такое использование необходимо для целей предоставления Сервиса»

▪️ «использование с предварительного согласия Клиента в маркетинговых и информационных материалах Правообладателя, направленных на привлечение внимание к Сервису или информирование о возможностях Сервиса неопределенного круга лиц».

@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
Исследование_M&A_Tech_IPO_Advisory_Board_x_ФРИИ.pdf
21.1 MB
Исследование по Tech M&A пока без GenAI-стартапов

Вчера коллеги из ФРИИ на своём закрытом мероприятии презентовали и затем опубликовали исследование по Tech M&A (без участия крупнейших экосистемных игроков) на основе своих данных. Выборка не является широкой (около 50 респондентов, имена не раскрываются), но все равно вопросы поставлены широко и заставляют задуматься о многих разумных вещах.

Согласно файлу, базовые параметры процесса в искомой части Tech M&A: рыночный «sweet spot» по выручке целей 50–800 млн, стандартный DD занимает 60–120 дней, а earn‑out обычно 12–36 месяцев с ориентацией на EBITDA и KPI.

В исследовании не отмечены отдельно GenAI-стартапы - хотела бы об этом немного поговорить отдельно.

При покупке ИИ‑стартапов следует не только задать классические вопросы, но и учесть специфику зарождающегося рынка + DeepTech сегмента: как оценить команду и IP, когда таргет не генерирует «типичную» выручку, как структурировать earn‑out под нестабильные метрики, каким образом выстроить механизм удержания, чтобы ключевые инженеры не ушли через пару месяцев после закрытия сделки.

В данном сегменте рынка, как мне представляется, будет преобладать формат acquihire. По моему опыту, в сфере AI (и аналогично в DeepTech) сделки проходят достаточно быстро, и в ДД подобного таргета на ранней стадии обращают внимание на историю грантов и проблему сохранения исключительных прав на разработки на авторами.

При этом успешность AI-продукта по сути равна успешности внедрения при коммерциализации (пользовательского опыта), а для этого у фаундеров должна быть сильная стратегическая экспертиза или хотя бы прозрачное видение того, как это возможно сделать. Proof of concept (по сути, наличие пилота и проверка гипотезы коммерциализации продукта) - неотъемлемая часть подобной сделки.

Услышала на мероприятии вчера мнение (источник уже не вспомню), что лучший способ мотивировать фаундера - это сделать equity swap (то есть, дать ему долю в компании-покупателе), об этом необходимо ещё подумать отдельно.

Тема ждёт своего исследователя. Займусь плотнее этим, тем более что есть определенный опыт сделок с ИИ-таргетами.
👍8🔥3👀1
Карта_рынка_GenAI_red_mad_robot_2025.pdf
40.5 MB
Карта рынка GenAI в России: что происходит.

Ребята из red_mad_robot выпустили отчёт про состояние российского рынка генеративного ИИ. Получилось что-то вроде карты, которая объясняет, как устроена AI-экосистема страны: от железа и моделей до корпоративных внедрений и рынка труда.

Пролистал, местами есть интересное 👇
1. Сегмент B2B AI взлетает — особенно там, где много рутины
Уже 70% компаний применяют GenAI.
Что внедряют быстрее всего:
• клиентская поддержка (чат-боты, ассистенты)
• корпоративные базы знаний
• HR-процессы
• генерация контента и маркетинг
Бизнес ищет быстрый возврат инвестиций, поэтому приоритет — автоматизация массовых операций.

2. Серьезный кадровый дефицит
По оценке Сбера: дефицит AI-специалистов ≈ 10 000 человек.
Количество вакансий «с AI» у hh.ru превысило 4,2 тыс., и это только верхушка.
Отсюда два вывода:
• Консалтинг и внедрение будут расти.
• Корпорации начинают строить свои R&D и Labs.

3. Рынок движется к «взрывному росту»
Ключевые факторы:
• локализация и суверенные стеки
• санкции -> окно возможностей для внутренних решений
• рост кластеров вокруг Сбера, Яндекса, Т-Банка
• быстрые внедрения в промышленности, ритейле, банках

4. Появляется новый тип сотрудника — «AI-работник»
Интересная мысль: рынок B2B SaaS пересекается с рынком интеллектуального труда.
На границе рождается новая роль — AI-сотрудник.
Он не заменяет людей полностью — но закрывает 30–60% задач там, где раньше не хватало рук.

5. Что это значит для разных сегментов
Корпорации
• строят свои R&D
• кастомизируют модели
• усиливают консалтинг и интеграцию
• конкурируют за таланты

Малый и средний бизнес
• получает доступ к инструментам уровня корпораций
• может автоматизировать маркетинг, продажи, поддержку
• не тратит миллионы на разработку — покупает готовые решения со встроенным AI

Самозанятые
• AI позволяет масштабироваться в одиночку
• порог входа на многие рынки резко падает

Итого, по состоянию на конец 2025 года можно зафиксировать: рынок ещё сырой, местами хаотичный — но именно поэтому он сейчас такой интересный.
👍3🔥3👀1
Google сварил RAG'у

Корпорация бобра запустила новый сервис — File Search Tool в составе Gemini API. Такой вот рывок в рынок RAG-решений: компания фактически упаковала весь стек: от загрузки файлов и чанкинга до эмбеддингов и подстановки контекста в единый управляемый сервис. Теперь «пройтись по документам» можно без собственной инфраструктуры, без векторных баз и без ручной сборки пайплайна.

Такой шаг автоматически бьёт по десяткам стартапов, которые строили бизнес на том, чтобы предоставлять готовые RAG-платформы или продавать инструменты для интеграции поиска по документам в корпоративные процессы. Google закрывает большую часть этого «конструктора» одним продуктом, оставляя разработчикам только логику приложения и интерфейс. При этом поддерживается много форматов, есть примеры и документация, а значит даже «промПт-инженегры» справятся.

Но есть и ложка дёгтя: хранение файлов и обработка через LLM доступны только в облаке Google, локального или on-premise варианта пока не существует. Это усиливает зависимость от экосистемы Google, но не меняет факта — File Search Tool делает классический RAG менее «ремеслом» и больше Plug&Play, что и создаёт давление на рынок тех, кто пытался монетизировать эту сложность.

@anti_agi
👍11
Сегодня просто день новостей в мире корпоративного ИИ, и это прекрасно!
4
Исследование по сделкам Tech M&A

Всем привет! O2 Consulting совместно с другими ведущими юридическими фирмами из top-tier и крупными финансовыми консультантами проводит исследование по ключевым аспектам сделок Tech M&A в 2024-2025 году.

Основной фокус исследования на вопросах IP / IT при подготовке и структурировании сделок с технологическими активами (включая AI-продукты), включая due diligence программных продуктов.

Ваша покорная слуга 🌻напишет в исследовании секцию по GenAI таргетам: как делать их due diligence, как структурировать и сопровождать сделки с такими объектами.

Исследование проводится на data-driven основе.
Поэтому мы приглашаем вас принять участие в одном из онлайн-опросов (анонимно), данные которого мы также включим в исследование, прокомментируем и поделимся с вами.

Ссылка на опрос:
ФОРМА ЗАКРЫТА

Примерное время прохождения опроса: 10 минут
Срок закрытия опроса: 20 ноября

Благодарим за участие!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥41
Forwarded from Loader from SVO
Глубокий_правовой_анализ_крупные_сделки.pdf
167.2 KB
Кстати, о юридическом ИИ.

Если в начале этого года я довольно скептически отнесся к тем результатам ответов ИИ на юридические вопросы, то теперь мое отношение к ИИ сильно изменилось.

Я понял, что ключевое значение имеет не только архитектура нейросети, но и big data, к которой он обращается.

Я уже писал, что сейчас вовлечен в один стартап, связанный с созданием юридического ИИ, который был (а) не галлюцинировал и (б) давал бы профессиональные развернутые ответы на юридические вопросы.

Результат нашей работы - в приложенном файле. Тем, что у нас получается, я очень доволен.

Мы пока еще находимся на стадии альфа-тестирования, впереди еще много работы - есть масса идей, которые мы реализуем в нашем инструменте. Но контуры будущего продукта уже понятны.
🔥4👍2