Forwarded from Refat Talks: Tech & AI
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Image Understanding (
Короче, как я перепробовал почти все и пришел к простому. Недавно работал над задачей: нужно было извлекать данные из документов (инвойсы, ID карты, чеки), причем не просто текст вытащить, а конкретные поля и обязательно показать пользователю откуда именно взяли каждое поле. То есть полноценный grounded extraction с визуальной верификацией.
Перепробовал кучу всего, включая OCR-движки и YOLO модели - все не то: или работает с узким набором доков, или вытаскивает все подряд, или надо дообучать.
И тут я вспомнил про фичу Gemini, которую использовал в других кейсах - Image Understanding с 2D Bounding Boxes. Удивился насколько это работает лучше всех предыдущих решений. Быстрее, точнее и вполне недорого (особенно с Flash).
Смотрите, большинство vision-моделей могут описать что на картинке. GPT, Claude, другие vision модели - все они видят текст, объекты и понимают контекст. Но Gemini делает больше: он может показать где именно на изображении находится то, что он видит. С точностью до пикселя.
В промпте надо упомянуть необходимость извлечения box_2d контуров и получаете не просто текст, а JSON с координатами каждого поля:
Координаты нормализованы от 0 до 1000, формат [ymin, xmin, ymax, xmax]. Дальше простая геометрия - и ты можешь наложить эти боксы на оригинал. Получается интерактивная подсветка: навел на поле в списке - подсветилось на изображении. Смотрите на видео демку из моего проекта.
Зачем это нужно: операторы могут проверять правильность извлечения прямо на документе, RAG-пайплайны хранят координаты для точных ссылок на источник, QA сразу видит где модель ошиблась, клиенты получают прозрачность - что извлекли и откуда.
Этот пост, кстати, хорошое дополнение к моему обзору LangExtract.
Технические нюансы
- Важно просить Gemini выдать именно box_2d (она натренирована таким образом): "The box_2d should be [ymin, xmin, ymax, xmax] normalized to 0-1000"
- Structured Outputs + JSON schema с box_2d отлично сочетаются и гарантируют валидный формат
- Flash/Flash Lite модели чаще всего достаточно (всего $0.10/$0.40 за миллион токенов), Pro для сложных отчетов
- Выключайте thinking для spatial задач (thinking_budget=0)
- Ресайзите до 640px по большей стороне (часто - лучший вариант, но зависит от кейса)
- Gemini 2.5+ поддерживает Segmentation Masks - то есть выдает также base64 png с точной формой объекта, полезно для computer vision задач и conversational segmentation типа "подсвети строки где сумма больше $1000"
Use cases за пределами документов: UI/UX тестирование и визуальные регрессии, e-commerce (детекция продуктов, ценников, инвентаря), quality control (дефекты, лейблы, компоненты), робототехника (навигация, захват объектов, инспекция).
Если вы делаете что-то с обработкой документов или изображений где важна локализация - попробуйте Gemini Image Understanding. Это недооцененная фича которая может сэкономить месяцы разработки и деньги на инфраструктуру.
🔥➕🔁
box_2d) в Gemini - недооцененная суперсила для OCR и не толькоКороче, как я перепробовал почти все и пришел к простому. Недавно работал над задачей: нужно было извлекать данные из документов (инвойсы, ID карты, чеки), причем не просто текст вытащить, а конкретные поля и обязательно показать пользователю откуда именно взяли каждое поле. То есть полноценный grounded extraction с визуальной верификацией.
Перепробовал кучу всего, включая OCR-движки и YOLO модели - все не то: или работает с узким набором доков, или вытаскивает все подряд, или надо дообучать.
И тут я вспомнил про фичу Gemini, которую использовал в других кейсах - Image Understanding с 2D Bounding Boxes. Удивился насколько это работает лучше всех предыдущих решений. Быстрее, точнее и вполне недорого (особенно с Flash).
Смотрите, большинство vision-моделей могут описать что на картинке. GPT, Claude, другие vision модели - все они видят текст, объекты и понимают контекст. Но Gemini делает больше: он может показать где именно на изображении находится то, что он видит. С точностью до пикселя.
В промпте надо упомянуть необходимость извлечения box_2d контуров и получаете не просто текст, а JSON с координатами каждого поля:
{
"box_2d": [245, 156, 289, 487],
"label": "DOCUMENT_NUMBER",
"value": "AB123456"
}
Координаты нормализованы от 0 до 1000, формат [ymin, xmin, ymax, xmax]. Дальше простая геометрия - и ты можешь наложить эти боксы на оригинал. Получается интерактивная подсветка: навел на поле в списке - подсветилось на изображении. Смотрите на видео демку из моего проекта.
Зачем это нужно: операторы могут проверять правильность извлечения прямо на документе, RAG-пайплайны хранят координаты для точных ссылок на источник, QA сразу видит где модель ошиблась, клиенты получают прозрачность - что извлекли и откуда.
Этот пост, кстати, хорошое дополнение к моему обзору LangExtract.
Технические нюансы
- Важно просить Gemini выдать именно box_2d (она натренирована таким образом): "The box_2d should be [ymin, xmin, ymax, xmax] normalized to 0-1000"
- Structured Outputs + JSON schema с box_2d отлично сочетаются и гарантируют валидный формат
- Flash/Flash Lite модели чаще всего достаточно (всего $0.10/$0.40 за миллион токенов), Pro для сложных отчетов
- Выключайте thinking для spatial задач (thinking_budget=0)
- Ресайзите до 640px по большей стороне (часто - лучший вариант, но зависит от кейса)
- Gemini 2.5+ поддерживает Segmentation Masks - то есть выдает также base64 png с точной формой объекта, полезно для computer vision задач и conversational segmentation типа "подсвети строки где сумма больше $1000"
Use cases за пределами документов: UI/UX тестирование и визуальные регрессии, e-commerce (детекция продуктов, ценников, инвентаря), quality control (дефекты, лейблы, компоненты), робототехника (навигация, захват объектов, инспекция).
Если вы делаете что-то с обработкой документов или изображений где важна локализация - попробуйте Gemini Image Understanding. Это недооцененная фича которая может сэкономить месяцы разработки и деньги на инфраструктуру.
🔥➕🔁
🔥5
☕ TL,DR:
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
☕️ 2025: год ИИ-агентов и контекст-инженерии — как OpenAI, Anthropic и Google борются за корпоративный рынок
Второе полугодие 2025 года закрепило смещение фокуса корпоративного ИИ от универсальных больших языковых моделей к агентским архитектурам, где на первый план выходят не столько сами модели и их "качество", сколько комплексные экосистемы контекст-инженерии:…
👍9🔥1😱1
Forwarded from Делай RAG
Новый цикл общеобразовательно-рисерческих постов на канале под гордым названием #rise_of_RAG я начну с неожиданного вопроса: что вы знаете о Бразилии? Что бы вы о Бразилии ни знали ранее, сегодня вы узнаете, что в бразильском Сенате работают юристы-гигаумники, которые куют своими руками будущее права. Вот такой кликбейтный зачин!
Как многие читатели уже знают, я не умею писать короткие посты. На этот раз я переплюнула вообще все собственные ожидания от самой себя, и разразилась лонгридом — вот ссылка на Телеграф.
Этот материал в основном является обзором нескольких статей из стремительно накапливающегося корпуса публикаций по теме методов составления баз знаний для технологии Retrieval-Augmented Generation. При описании методов я пересказываю идеи авторов, свою оценку полезности не даю и перепроверить конкретными метриками тоже, разумеется, не могу. Хотя возникают шальные мысли что-то попробовать и некоторые эксперименты поставить.
О чем будет речь? О трёх подходах, эволюционировавших из обычных векторных RAGов — плоских или, как их еще называют, «наивных». Первый - Multi-Layered Embedding-Based Retrieval (MLR), многоуровневый или иерархический подход. Второй - GraphRAG, графовый. Третий — SAT-GraphRAG (Structure-Aware Temporal GraphRAG, структурно-темпоральный подход). В статье рассказываю о том, как они реализованы технологически, какие задачи решают и в чём они, по мнению авторов, лучше других.
Но этот лонгрид — не только пересказ статей. Вообще, если не любите вдаваться в технические подробности, это всё можно будет скипнуть и читать только последний раздел. В начале я делюсь своими выработанными практикой догадками о минусах наивных RAG, а в конце пытаюсь выявить первые принципы будущей методологии составления баз знаний для RAG-технологии, возможные области применения разных подходов и высказать некоторые свои гипотезы о нашем с вами будущем в свете всего этого.
Мне очень интересно, что вы об этом всём думаете. Я лично чувствую
Приятного чтения!
Как многие читатели уже знают, я не умею писать короткие посты. На этот раз я переплюнула вообще все собственные ожидания от самой себя, и разразилась лонгридом — вот ссылка на Телеграф.
Этот материал в основном является обзором нескольких статей из стремительно накапливающегося корпуса публикаций по теме методов составления баз знаний для технологии Retrieval-Augmented Generation. При описании методов я пересказываю идеи авторов, свою оценку полезности не даю и перепроверить конкретными метриками тоже, разумеется, не могу. Хотя возникают шальные мысли что-то попробовать и некоторые эксперименты поставить.
О чем будет речь? О трёх подходах, эволюционировавших из обычных векторных RAGов — плоских или, как их еще называют, «наивных». Первый - Multi-Layered Embedding-Based Retrieval (MLR), многоуровневый или иерархический подход. Второй - GraphRAG, графовый. Третий — SAT-GraphRAG (Structure-Aware Temporal GraphRAG, структурно-темпоральный подход). В статье рассказываю о том, как они реализованы технологически, какие задачи решают и в чём они, по мнению авторов, лучше других.
Но этот лонгрид — не только пересказ статей. Вообще, если не любите вдаваться в технические подробности, это всё можно будет скипнуть и читать только последний раздел. В начале я делюсь своими выработанными практикой догадками о минусах наивных RAG, а в конце пытаюсь выявить первые принципы будущей методологии составления баз знаний для RAG-технологии, возможные области применения разных подходов и высказать некоторые свои гипотезы о нашем с вами будущем в свете всего этого.
Мне очень интересно, что вы об этом всём думаете. Я лично чувствую
что-то, копая в этом направлении 🙂 правильных ответов нет, никто не знает, как надо, никто не знает, действительно ли всё это нам будет нужно. Но это ужасно интересная область приложения интеллекта, и мне очень хочется, чтобы вокруг неё сложилась дискуссия.Приятного чтения!
Telegraph
Rise of RAG: от плоских векторов к темпоральным графам
Что вы знаете о Бразилии? Что бы вы о Бразилии ни знали ранее, сегодня вы узнаете, что в бразильском Сенате работают юристы-гигаумники, которые куют своими руками будущее права Хоть подзаголовок получился пафосным и кликбейтным, но, думаю, дальше он оправдает…
В честь 500 подписчиков 🌻
Дорогие читатели и гости моегоуютного канала!
Спасибо, что мотивируете меня писать о своих мытарствах в AI.
Эссе про AI в M&A, как планировала, не получилось приурочить к красивому числу. Но я исправлюсь! Все слишком быстро меняется, не хочется писать что-то, что станет неактуальным, хочется дать что-то как must have - это, возможно, слишком амбициозная цель...
Выступила вчера с темой автоматизации на базе ИИ в юрконсалтинге в стенах СПбГУ вместе с коллегами из Сбера, Яндекса, МТС, Газпромнефти, КЕПТ, будучи единственным спикером от юрфирмы - свою презентацию прикладываю. Рассказала о текущем стеке и его проблематике. Во многом она основана на моей презентации с Правотех, но в этот раз я детально рассказала про эксперимент с RAG и объяснила, в чем отличие от NotebookLM.
Сегодня ещё разовью идеи на экспертной встрече Агентства стратегических инициатив. Ни пуха мне...
Дорогие читатели и гости моего
Спасибо, что мотивируете меня писать о своих мытарствах в AI.
Эссе про AI в M&A, как планировала, не получилось приурочить к красивому числу. Но я исправлюсь! Все слишком быстро меняется, не хочется писать что-то, что станет неактуальным, хочется дать что-то как must have - это, возможно, слишком амбициозная цель...
Выступила вчера с темой автоматизации на базе ИИ в юрконсалтинге в стенах СПбГУ вместе с коллегами из Сбера, Яндекса, МТС, Газпромнефти, КЕПТ, будучи единственным спикером от юрфирмы - свою презентацию прикладываю. Рассказала о текущем стеке и его проблематике. Во многом она основана на моей презентации с Правотех, но в этот раз я детально рассказала про эксперимент с RAG и объяснила, в чем отличие от NotebookLM.
Сегодня ещё разовью идеи на экспертной встрече Агентства стратегических инициатив. Ни пуха мне...
🔥8👍5👀3 3
Руководство от Perplexity по повышению эффективности (на русском)
Вчера, 22.10.2025, вышло руководство от уважаемых товарищей из Перплексити. Мы в админской любимого чата ilovedocs | нейросети перевели быстро на русский с deepl (Gregory 🫡) - enjoy your dinner!
Вчера, 22.10.2025, вышло руководство от уважаемых товарищей из Перплексити. Мы в админской любимого чата ilovedocs | нейросети перевели быстро на русский с deepl (Gregory 🫡) - enjoy your dinner!
👍8 7 1
pplx-at-work (12) ru.pdf
2.2 MB
Перплексити сделал саммари документа за нас :)
Чтение публичных оферт до добра никого не доводило. Верить им или нет в эпоху больших данных, когда речь идет об операторе ИИ - вопрос риторический.
По всей видимости, это байт на покупку корпоративных подписок, в которых обещания конфиденциальности есть (и то, веры в них нет...).
По всей видимости, это байт на покупку корпоративных подписок, в которых обещания конфиденциальности есть (и то, веры в них нет...).
🔥4
Forwarded from Неискусственный интеллект (Илья Склюев)
Отечественные чат-боты превзошли американцев и китайцев... в сборе информации
Вечером среды мы внезапно поняли, что в приложениях «Алисы» и GigaChat почему-то нет простой кнопки, позволяющей отключить сбор и анализ ваших диалогов. Хотя у ChatGPT и DeepSeek настройка находится в пару кликов.
Оказывается, всё это не просто так. Отечественные компании ведут активный сбор данных, но используют их по-разному:
1️⃣ «Алиса» анализирует ваши «отдельные голосовые и текстовые сообщения» по умолчанию
Нам казалось, что отключить настройку можно через «Яндекс ID». Но в компании пояснили, что кнопка «Помогать Алисе стать лучше» действует только для умных устройств.
В сервисном соглашении «Алисы AI» в разделе про данные пользователя говорят, что «Правообладателю передается следующая информация: идентификатор Пользователя, Запросы, ответы на Запросы Пользователя, иная информация, предоставляемая и собираемая посредством пользовательского интерфейса Сервиса».
Используют их, конечно же, «в целях совершенствования в целях проведения анализа, развития и совершенствования Сервиса и его отдельных функций». А ещё для рекламы:
«Персональная информация Пользователя обрабатывается в целях предоставления функциональности Сервиса, в том числе для отображения контента, потенциально наиболее интересного Пользователю».
2️⃣ «Сбер» получает всё, но делать с этим ничего не будет
Пользуясь GigaChat, пользователь «предоставляет SDevices и Правообладателю право использования Контента Клиента <...> любыми способами, не противоречащими действующему законодательству, в том числе, указанными в п. 2 ст. 1270 Гражданского кодекса Российской Федерации, но не ограничиваясь ими».
В корпоративном соглашении и в версии для физлиц подчёркивают, что «SDevices и Правообладатель не используют предоставленный или загружаемый Контент в собственных целях, не связанных с предоставлением Сервиса». Формулировка размытая, но нам официально заявили, что в «Сбере» не используют запросы пользователей для обучения нейросетей.
При этом, как только вы что-то сгенерировали в GigaChat, то вы передаёте компании лицензию на использование контента следующими способами:
▪️ «воспроизведение, хранение и запись в память ЭВМ Правообладателя и его аффилированных лиц и на серверах, назначенных Правообладателем, если такое использование необходимо для целей предоставления Сервиса»
▪️ «использование с предварительного согласия Клиента в маркетинговых и информационных материалах Правообладателя, направленных на привлечение внимание к Сервису или информирование о возможностях Сервиса неопределенного круга лиц».
@anti_agi
Вечером среды мы внезапно поняли, что в приложениях «Алисы» и GigaChat почему-то нет простой кнопки, позволяющей отключить сбор и анализ ваших диалогов. Хотя у ChatGPT и DeepSeek настройка находится в пару кликов.
Оказывается, всё это не просто так. Отечественные компании ведут активный сбор данных, но используют их по-разному:
Нам казалось, что отключить настройку можно через «Яндекс ID». Но в компании пояснили, что кнопка «Помогать Алисе стать лучше» действует только для умных устройств.
В сервисном соглашении «Алисы AI» в разделе про данные пользователя говорят, что «Правообладателю передается следующая информация: идентификатор Пользователя, Запросы, ответы на Запросы Пользователя, иная информация, предоставляемая и собираемая посредством пользовательского интерфейса Сервиса».
Используют их, конечно же, «в целях совершенствования в целях проведения анализа, развития и совершенствования Сервиса и его отдельных функций». А ещё для рекламы:
«Персональная информация Пользователя обрабатывается в целях предоставления функциональности Сервиса, в том числе для отображения контента, потенциально наиболее интересного Пользователю».
Не очень понимаем, как с такими условиями пользоваться агентскими фичами «Алисы». Если любая информация, попавшая в поле зрения бота, будет уходить для отображения интересного контента.
Пользуясь GigaChat, пользователь «предоставляет SDevices и Правообладателю право использования Контента Клиента <...> любыми способами, не противоречащими действующему законодательству, в том числе, указанными в п. 2 ст. 1270 Гражданского кодекса Российской Федерации, но не ограничиваясь ими».
В корпоративном соглашении и в версии для физлиц подчёркивают, что «SDevices и Правообладатель не используют предоставленный или загружаемый Контент в собственных целях, не связанных с предоставлением Сервиса». Формулировка размытая, но нам официально заявили, что в «Сбере» не используют запросы пользователей для обучения нейросетей.
При этом, как только вы что-то сгенерировали в GigaChat, то вы передаёте компании лицензию на использование контента следующими способами:
@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
Исследование_M&A_Tech_IPO_Advisory_Board_x_ФРИИ.pdf
21.1 MB
Исследование по Tech M&A пока без GenAI-стартапов
Вчера коллеги из ФРИИ на своём закрытом мероприятии презентовали и затем опубликовали исследование по Tech M&A (без участия крупнейших экосистемных игроков) на основе своих данных. Выборка не является широкой (около 50 респондентов, имена не раскрываются), но все равно вопросы поставлены широко и заставляют задуматься о многих разумных вещах.
Согласно файлу, базовые параметры процесса в искомой части Tech M&A: рыночный «sweet spot» по выручке целей 50–800 млн, стандартный DD занимает 60–120 дней, а earn‑out обычно 12–36 месяцев с ориентацией на EBITDA и KPI.
В исследовании не отмечены отдельно GenAI-стартапы - хотела бы об этом немного поговорить отдельно.
При покупке ИИ‑стартапов следует не только задать классические вопросы, но и учесть специфику зарождающегося рынка + DeepTech сегмента: как оценить команду и IP, когда таргет не генерирует «типичную» выручку, как структурировать earn‑out под нестабильные метрики, каким образом выстроить механизм удержания, чтобы ключевые инженеры не ушли через пару месяцев после закрытия сделки.
В данном сегменте рынка, как мне представляется, будет преобладать формат acquihire. По моему опыту, в сфере AI (и аналогично в DeepTech) сделки проходят достаточно быстро, и в ДД подобного таргета на ранней стадии обращают внимание на историю грантов и проблему сохранения исключительных прав на разработки на авторами.
При этом успешность AI-продукта по сути равна успешности внедрения при коммерциализации (пользовательского опыта), а для этого у фаундеров должна быть сильная стратегическая экспертиза или хотя бы прозрачное видение того, как это возможно сделать. Proof of concept (по сути, наличие пилота и проверка гипотезы коммерциализации продукта) - неотъемлемая часть подобной сделки.
Услышала на мероприятии вчера мнение (источник уже не вспомню), что лучший способ мотивировать фаундера - это сделать equity swap (то есть, дать ему долю в компании-покупателе), об этом необходимо ещё подумать отдельно.
Тема ждёт своего исследователя. Займусь плотнее этим, тем более что есть определенный опыт сделок с ИИ-таргетами.
Вчера коллеги из ФРИИ на своём закрытом мероприятии презентовали и затем опубликовали исследование по Tech M&A (без участия крупнейших экосистемных игроков) на основе своих данных. Выборка не является широкой (около 50 респондентов, имена не раскрываются), но все равно вопросы поставлены широко и заставляют задуматься о многих разумных вещах.
Согласно файлу, базовые параметры процесса в искомой части Tech M&A: рыночный «sweet spot» по выручке целей 50–800 млн, стандартный DD занимает 60–120 дней, а earn‑out обычно 12–36 месяцев с ориентацией на EBITDA и KPI.
В исследовании не отмечены отдельно GenAI-стартапы - хотела бы об этом немного поговорить отдельно.
При покупке ИИ‑стартапов следует не только задать классические вопросы, но и учесть специфику зарождающегося рынка + DeepTech сегмента: как оценить команду и IP, когда таргет не генерирует «типичную» выручку, как структурировать earn‑out под нестабильные метрики, каким образом выстроить механизм удержания, чтобы ключевые инженеры не ушли через пару месяцев после закрытия сделки.
В данном сегменте рынка, как мне представляется, будет преобладать формат acquihire. По моему опыту, в сфере AI (и аналогично в DeepTech) сделки проходят достаточно быстро, и в ДД подобного таргета на ранней стадии обращают внимание на историю грантов и проблему сохранения исключительных прав на разработки на авторами.
При этом успешность AI-продукта по сути равна успешности внедрения при коммерциализации (пользовательского опыта), а для этого у фаундеров должна быть сильная стратегическая экспертиза или хотя бы прозрачное видение того, как это возможно сделать. Proof of concept (по сути, наличие пилота и проверка гипотезы коммерциализации продукта) - неотъемлемая часть подобной сделки.
Услышала на мероприятии вчера мнение (источник уже не вспомню), что лучший способ мотивировать фаундера - это сделать equity swap (то есть, дать ему долю в компании-покупателе), об этом необходимо ещё подумать отдельно.
Тема ждёт своего исследователя. Займусь плотнее этим, тем более что есть определенный опыт сделок с ИИ-таргетами.
👍8🔥3👀1
Forwarded from Губкин | Про AI и B2B-продукты
Карта_рынка_GenAI_red_mad_robot_2025.pdf
40.5 MB
Карта рынка GenAI в России: что происходит.
Ребята из red_mad_robot выпустили отчёт про состояние российского рынка генеративного ИИ. Получилось что-то вроде карты, которая объясняет, как устроена AI-экосистема страны: от железа и моделей до корпоративных внедрений и рынка труда.
Пролистал, местами есть интересное 👇
Итого, по состоянию на конец 2025 года можно зафиксировать: рынок ещё сырой, местами хаотичный — но именно поэтому он сейчас такой интересный.
Ребята из red_mad_robot выпустили отчёт про состояние российского рынка генеративного ИИ. Получилось что-то вроде карты, которая объясняет, как устроена AI-экосистема страны: от железа и моделей до корпоративных внедрений и рынка труда.
Пролистал, местами есть интересное 👇
1. Сегмент B2B AI взлетает — особенно там, где много рутины
Уже 70% компаний применяют GenAI.
Что внедряют быстрее всего:
• клиентская поддержка (чат-боты, ассистенты)
• корпоративные базы знаний
• HR-процессы
• генерация контента и маркетинг
Бизнес ищет быстрый возврат инвестиций, поэтому приоритет — автоматизация массовых операций.
2. Серьезный кадровый дефицит
По оценке Сбера: дефицит AI-специалистов ≈ 10 000 человек.
Количество вакансий «с AI» у hh.ru превысило 4,2 тыс., и это только верхушка.
Отсюда два вывода:
• Консалтинг и внедрение будут расти.
• Корпорации начинают строить свои R&D и Labs.
3. Рынок движется к «взрывному росту»
Ключевые факторы:
• локализация и суверенные стеки
• санкции -> окно возможностей для внутренних решений
• рост кластеров вокруг Сбера, Яндекса, Т-Банка
• быстрые внедрения в промышленности, ритейле, банках
4. Появляется новый тип сотрудника — «AI-работник»
Интересная мысль: рынок B2B SaaS пересекается с рынком интеллектуального труда.
На границе рождается новая роль — AI-сотрудник.
Он не заменяет людей полностью — но закрывает 30–60% задач там, где раньше не хватало рук.
5. Что это значит для разных сегментов
Корпорации
• строят свои R&D
• кастомизируют модели
• усиливают консалтинг и интеграцию
• конкурируют за таланты
Малый и средний бизнес
• получает доступ к инструментам уровня корпораций
• может автоматизировать маркетинг, продажи, поддержку
• не тратит миллионы на разработку — покупает готовые решения со встроенным AI
Самозанятые
• AI позволяет масштабироваться в одиночку
• порог входа на многие рынки резко падает
Итого, по состоянию на конец 2025 года можно зафиксировать: рынок ещё сырой, местами хаотичный — но именно поэтому он сейчас такой интересный.
👍3🔥3👀1
Forwarded from Неискусственный интеллект (Ruslan Dz)
Google сварил RAG'у
Корпорация бобра запустила новый сервис — File Search Tool в составе Gemini API. Такой вот рывок в рынок RAG-решений: компания фактически упаковала весь стек: от загрузки файлов и чанкинга до эмбеддингов и подстановки контекста в единый управляемый сервис. Теперь «пройтись по документам» можно без собственной инфраструктуры, без векторных баз и без ручной сборки пайплайна.
Такой шаг автоматически бьёт по десяткам стартапов, которые строили бизнес на том, чтобы предоставлять готовые RAG-платформы или продавать инструменты для интеграции поиска по документам в корпоративные процессы. Google закрывает большую часть этого «конструктора» одним продуктом, оставляя разработчикам только логику приложения и интерфейс. При этом поддерживается много форматов, есть примеры и документация, а значит даже «промПт-инженегры» справятся.
Но есть и ложка дёгтя: хранение файлов и обработка через LLM доступны только в облаке Google, локального или on-premise варианта пока не существует. Это усиливает зависимость от экосистемы Google, но не меняет факта — File Search Tool делает классический RAG менее «ремеслом» и больше Plug&Play, что и создаёт давление на рынок тех, кто пытался монетизировать эту сложность.
@anti_agi
Корпорация бобра запустила новый сервис — File Search Tool в составе Gemini API. Такой вот рывок в рынок RAG-решений: компания фактически упаковала весь стек: от загрузки файлов и чанкинга до эмбеддингов и подстановки контекста в единый управляемый сервис. Теперь «пройтись по документам» можно без собственной инфраструктуры, без векторных баз и без ручной сборки пайплайна.
Такой шаг автоматически бьёт по десяткам стартапов, которые строили бизнес на том, чтобы предоставлять готовые RAG-платформы или продавать инструменты для интеграции поиска по документам в корпоративные процессы. Google закрывает большую часть этого «конструктора» одним продуктом, оставляя разработчикам только логику приложения и интерфейс. При этом поддерживается много форматов, есть примеры и документация, а значит даже «промПт-инженегры» справятся.
Но есть и ложка дёгтя: хранение файлов и обработка через LLM доступны только в облаке Google, локального или on-premise варианта пока не существует. Это усиливает зависимость от экосистемы Google, но не меняет факта — File Search Tool делает классический RAG менее «ремеслом» и больше Plug&Play, что и создаёт давление на рынок тех, кто пытался монетизировать эту сложность.
@anti_agi
Google
Introducing the File Search Tool in Gemini API
File Search is a fully managed Retrieval Augmented Generation (RAG) system built directly into the Gemini API.
👍1 1
Сегодня просто день новостей в мире корпоративного ИИ, и это прекрасно!
Исследование по сделкам Tech M&A
Всем привет! O2 Consulting совместно с другими ведущими юридическими фирмами из top-tier и крупными финансовыми консультантами проводит исследование по ключевым аспектам сделок Tech M&A в 2024-2025 году.
Основной фокус исследования на вопросах IP / IT при подготовке и структурировании сделок с технологическими активами (включая AI-продукты), включая due diligence программных продуктов.
Ваша покорная слуга🌻 напишет в исследовании секцию по GenAI таргетам: как делать их due diligence, как структурировать и сопровождать сделки с такими объектами.
Исследование проводится на data-driven основе.
Поэтому мы приглашаем вас принять участие в одном из онлайн-опросов (анонимно), данные которого мы также включим в исследование, прокомментируем и поделимся с вами.
Ссылка на опрос:
ФОРМА ЗАКРЫТА
Примерное время прохождения опроса: 10 минут
Срок закрытия опроса: 20 ноября
Благодарим за участие!
Всем привет! O2 Consulting совместно с другими ведущими юридическими фирмами из top-tier и крупными финансовыми консультантами проводит исследование по ключевым аспектам сделок Tech M&A в 2024-2025 году.
Основной фокус исследования на вопросах IP / IT при подготовке и структурировании сделок с технологическими активами (включая AI-продукты), включая due diligence программных продуктов.
Ваша покорная слуга
Исследование проводится на data-driven основе.
Поэтому мы приглашаем вас принять участие в одном из онлайн-опросов (анонимно), данные которого мы также включим в исследование, прокомментируем и поделимся с вами.
Ссылка на опрос:
ФОРМА ЗАКРЫТА
Примерное время прохождения опроса: 10 минут
Срок закрытия опроса: 20 ноября
Благодарим за участие!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4 1
Forwarded from Loader from SVO
Глубокий_правовой_анализ_крупные_сделки.pdf
167.2 KB
Кстати, о юридическом ИИ.
Если в начале этого года я довольно скептически отнесся к тем результатам ответов ИИ на юридические вопросы, то теперь мое отношение к ИИ сильно изменилось.
Я понял, что ключевое значение имеет не только архитектура нейросети, но и big data, к которой он обращается.
Я уже писал, что сейчас вовлечен в один стартап, связанный с созданием юридического ИИ, который был (а) не галлюцинировал и (б) давал бы профессиональные развернутые ответы на юридические вопросы.
Результат нашей работы - в приложенном файле. Тем, что у нас получается, я очень доволен.
Мы пока еще находимся на стадии альфа-тестирования, впереди еще много работы - есть масса идей, которые мы реализуем в нашем инструменте. Но контуры будущего продукта уже понятны.
Если в начале этого года я довольно скептически отнесся к тем результатам ответов ИИ на юридические вопросы, то теперь мое отношение к ИИ сильно изменилось.
Я понял, что ключевое значение имеет не только архитектура нейросети, но и big data, к которой он обращается.
Я уже писал, что сейчас вовлечен в один стартап, связанный с созданием юридического ИИ, который был (а) не галлюцинировал и (б) давал бы профессиональные развернутые ответы на юридические вопросы.
Результат нашей работы - в приложенном файле. Тем, что у нас получается, я очень доволен.
Мы пока еще находимся на стадии альфа-тестирования, впереди еще много работы - есть масса идей, которые мы реализуем в нашем инструменте. Но контуры будущего продукта уже понятны.
🔥4👍2
Google запускает Antigravity и Gemini 3 Pro: что это может значить для M&A?
Google снова опережает рынок, анонсируя Antigravity - новую платформу для "агент-ориентированной" разработки, и Gemini 3 Pro - мощнейшую модель, которая уже доступна в Google AI Studio (бесплатно, если разрешать использовать свои диалоги для обучения). Доступ открыт только с VPN.
Antigravity - попытка переосмыслить подход к написанию кода. Главное отличие Antigravity от обычных IDE (типа Cursor) в том, что агентам дан прямой доступ к редактору кода, терминалу и браузеру одновременно. Разработчик представляется архитектором, который управляет командой ИИ-агентов.Похоже на роль юриста высокого уровня в сделках, не правда ли?
Эти ИИ-агенты на базе Gemini 3 Pro должны смочь выполнять задачи в рамках длинного многоступенчатого процесса (почти) автономно. Ключевой момент: агент имеет права на действия (редактирование, запуск, доступ к инструментам), а не просто «советует», и именно это превращает его из умного поисковика в прообраз будущих цифровых сотрудников.
Что это значит для M&A?
Подлинная автоматизация due diligence. Представьте, что через 1–2 года у вас будет "агент" для проверки документов, автоматического анализа договоров и выявления рисков. Время на этап due diligence упадёт в разы, а риск ошибки снизится.
Создание ресерчей по темам. ИИ-агент сможет собрать из кучи источников информацию по компании, составить финансово-юридический профиль, выстроить сценарии интеграции в структурированный анализ.
Управление workflow. Всё, что сейчас делают менеджеры и юристы, от координации этапов до контроля сроков - может быть делегировано ИИ-агентам как "цифровым сотрудникам".Что, конечно, сделает нас еще беспомощнее перед цифровой сингулярностью
Google говорит, что будущее за ИИ-агентами. Для M&A это означает, что "белые воротнички" будут работать по-новому: не столько ручками, сколько как архитекторы и руководители "агентских команд". Возможность делегировать целые задачи, а не просто просить написать шаблон - это фундаментальный сдвиг.
Какие задачи были бы первыми на очереди автоматизации?
PS Ваша покорная слуга🌻 выступает с темой автоматизации DD на конференции по сделкам M&A 20 ноября, будет что обсудить в кулуарах.
Google снова опережает рынок, анонсируя Antigravity - новую платформу для "агент-ориентированной" разработки, и Gemini 3 Pro - мощнейшую модель, которая уже доступна в Google AI Studio (бесплатно, если разрешать использовать свои диалоги для обучения). Доступ открыт только с VPN.
Antigravity - попытка переосмыслить подход к написанию кода. Главное отличие Antigravity от обычных IDE (типа Cursor) в том, что агентам дан прямой доступ к редактору кода, терминалу и браузеру одновременно. Разработчик представляется архитектором, который управляет командой ИИ-агентов.
Эти ИИ-агенты на базе Gemini 3 Pro должны смочь выполнять задачи в рамках длинного многоступенчатого процесса (почти) автономно. Ключевой момент: агент имеет права на действия (редактирование, запуск, доступ к инструментам), а не просто «советует», и именно это превращает его из умного поисковика в прообраз будущих цифровых сотрудников.
Что это значит для M&A?
Подлинная автоматизация due diligence. Представьте, что через 1–2 года у вас будет "агент" для проверки документов, автоматического анализа договоров и выявления рисков. Время на этап due diligence упадёт в разы, а риск ошибки снизится.
Создание ресерчей по темам. ИИ-агент сможет собрать из кучи источников информацию по компании, составить финансово-юридический профиль, выстроить сценарии интеграции в структурированный анализ.
Управление workflow. Всё, что сейчас делают менеджеры и юристы, от координации этапов до контроля сроков - может быть делегировано ИИ-агентам как "цифровым сотрудникам".
Google говорит, что будущее за ИИ-агентами. Для M&A это означает, что "белые воротнички" будут работать по-новому: не столько ручками, сколько как архитекторы и руководители "агентских команд". Возможность делегировать целые задачи, а не просто просить написать шаблон - это фундаментальный сдвиг.
Какие задачи были бы первыми на очереди автоматизации?
PS Ваша покорная слуга
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🤔2😱2
Нейроюрист - В С Ё
В среду была на закрытом мероприятии Яндекса, предшествующем запуску Нейроюриста (официально вышел вчера, 20.11.2025). Спасибо большое Роме Янковскому за приглашение!
Были все известные энтузиасты рынка, было очень приятно и задорно, все в красивом антураже и с участием продуктовой команды (которую я замучила вопросами про RAG).
Действительно, у меня возникли большие сомнения и скепсис насчет того, что это решение будет эффективнее того же Perplexity, особенно на длинной дистанции. Но интерфейс и его удобство, а также уверенные ответы команды на мои заковыристые вопросы и, в конце концов, желание поддержать российскую новеллу сбивают мой скепсис почти до нуля.
Буду пользоваться и рекомендовать. Спасибо за такой большой труд Роме и всем коллегам из Яндекса!
В среду была на закрытом мероприятии Яндекса, предшествующем запуску Нейроюриста (официально вышел вчера, 20.11.2025). Спасибо большое Роме Янковскому за приглашение!
Были все известные энтузиасты рынка, было очень приятно и задорно, все в красивом антураже и с участием продуктовой команды (
ИИ-помощник отвечает как квалифицированный юрист. Он пригодится для консультаций, проведения исследований, самопроверки и не только. К примеру, если спросить его: «Может ли гендиректор работать на трёх работах по совместительству?» — он даст подробный ответ, который учитывает законодательство, судебную практику и разъяснения Минтруда России.
Ответ будет подкреплён ссылками на материалы в системе «Гарант».
Помимо «Гаранта», Нейроюрист умеет работать с файлами пользователя. Это могут быть документы, PDF-файлы, презентации, изображения, аудио- и видеозаписи. Скажем, можно показать ему макеты рекламных баннеров и попросить проверить их на предмет соответствия законодательству.
Нейроюрист разбирается в самых востребованных сферах права: трудовом, корпоративном, информационном, обязательственном и рекламном, а также даёт ответы по законодательству о защите прав потребителей и интеллектуальной собственности.
В основе помощника лежит языковая модель Alice AI LLM.
Её дообучили юристы: они предоставили образцы ответов, разметили данные и познакомили Нейроюриста со спецификой.
«Главная особенность нашего помощника — он создан юристами для юристов и максимально адаптирован для задач российских пользователей. В отличие от генеративных нейросетей общего применения, Нейроюрист знаком с иерархией источников права и учитывает её при составлении ответов. К примеру, он знает, что Постановления Пленума Верховного Суда имеют приоритет над единичным решением арбитражного суда при толковании нормы права, и при этом принимает во внимание наличие различающейся судебной практики по вопросу», — говорит директор юридического департамента Яндекса Юлия Попелышева.
Действительно, у меня возникли большие сомнения и скепсис насчет того, что это решение будет эффективнее того же Perplexity, особенно на длинной дистанции. Но интерфейс и его удобство, а также уверенные ответы команды на мои заковыристые вопросы и, в конце концов, желание поддержать российскую новеллу сбивают мой скепсис почти до нуля.
Буду пользоваться и рекомендовать. Спасибо за такой большой труд Роме и всем коллегам из Яндекса!
Telegram
Форма права • Роман Янковский
Давно ничего не писал в канал — простите, у меня была уважительная причина.
Вчера мы официально выпустили продукт, над которым я работал последние 9 месяцев. Это Нейроюрист — ИИ-система для юристов от Яндекса. Поздравляю нашу большую команду и рынок legal…
Вчера мы официально выпустили продукт, над которым я работал последние 9 месяцев. Это Нейроюрист — ИИ-система для юристов от Яндекса. Поздравляю нашу большую команду и рынок legal…
🔥11 4
Софья_Смирнова_Влияние_ИИ_на_Due_Diligence_и_процессы_сопровождения.pdf
756.7 KB
а вот ваша покорная слуга вчера выступала с презентацией по ИИ в due diligence 🌻
Хотите презентацию?
Добавила⬇️
Хотите презентацию?
Добавила
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19
Forwarded from Форма права • Роман Янковский
Исследование вымышленных правовых систем с помощью RAG
В науке права есть тема, которую непонятно куда отнести: это вымышленные правовые системы. То есть правовые системы, основанные на лоре несуществующих миров. Сюда относится как теоретико-правовые исследования аниме, так и, условно, работы на тему "Репрезентация американской правовой системы в сериале "Форс-мажоры". В принципе, квалификация фантазийных правоотношений — из той же серии («на каком режиме сидел Сириус в Азкабане»).
Это интересная тема не только для курсовых работ, но и для серьезных исследований. Наверное, читатели вспомнят легендарную статью "Первоначальное деликтное притязание граждан Эсгарота в лице капитана лучников Барда к Торину Оукеншильду: квалификация и оценка обоснованности в свете гражданских законов и обычаев свободных народов Средиземья". То есть тема, буквально — вправе ли были жители разрушенного Эсгарота потребовать часть сокровищ у гномов, захвативших Одинокую гору.
Эта статья на полном серьезе была выпущена в сборнике, посвященном внедоговорным обязательствам, в 2015 году. Малое число цитирований не должно вводить вас в заблуждение: она очень популярна, буквально все мои знакомые читали эту работу. В свое время это было самое интересное, что можно найти в "Консультанте" :) Кстати, статья вышла под псевдонимом и автор до сих пор публично себя не раскрыл.
Так вот. В нашем "Нейроюристе" есть продвинутая RAG-система (как NotebookLM). Пользователь может загрузить до 1000 документов и задавать вопросы по ним. Я думаю, это прекрасная возможность для исследования вымышленных правовых систем. Для примера я загрузил маленький датасет с правовыми документами вселенной "Гарри Поттера" (полтора десятка НПА, несколько меморандумов и протокол дисциплинарного слушания по делу ГП). Система довольно бодро решает кейсы по ним. Как думаете, какую вымышленную вселенную стоит еще попробовать? (в ней должен быть достаточно разработанный правовой компонент).
Полагаю, можно также использовать инструмент для исторических правовых реконструкций. Например, загрузить Дигесты и порешать задачки по римскому праву. Есть у кого-то Дигесты в текстовом формате под рукой?
В науке права есть тема, которую непонятно куда отнести: это вымышленные правовые системы. То есть правовые системы, основанные на лоре несуществующих миров. Сюда относится как теоретико-правовые исследования аниме, так и, условно, работы на тему "Репрезентация американской правовой системы в сериале "Форс-мажоры". В принципе, квалификация фантазийных правоотношений — из той же серии («на каком режиме сидел Сириус в Азкабане»).
Это интересная тема не только для курсовых работ, но и для серьезных исследований. Наверное, читатели вспомнят легендарную статью "Первоначальное деликтное притязание граждан Эсгарота в лице капитана лучников Барда к Торину Оукеншильду: квалификация и оценка обоснованности в свете гражданских законов и обычаев свободных народов Средиземья". То есть тема, буквально — вправе ли были жители разрушенного Эсгарота потребовать часть сокровищ у гномов, захвативших Одинокую гору.
Эта статья на полном серьезе была выпущена в сборнике, посвященном внедоговорным обязательствам, в 2015 году. Малое число цитирований не должно вводить вас в заблуждение: она очень популярна, буквально все мои знакомые читали эту работу. В свое время это было самое интересное, что можно найти в "Консультанте" :) Кстати, статья вышла под псевдонимом и автор до сих пор публично себя не раскрыл.
Так вот. В нашем "Нейроюристе" есть продвинутая RAG-система (как NotebookLM). Пользователь может загрузить до 1000 документов и задавать вопросы по ним. Я думаю, это прекрасная возможность для исследования вымышленных правовых систем. Для примера я загрузил маленький датасет с правовыми документами вселенной "Гарри Поттера" (полтора десятка НПА, несколько меморандумов и протокол дисциплинарного слушания по делу ГП). Система довольно бодро решает кейсы по ним. Как думаете, какую вымышленную вселенную стоит еще попробовать? (в ней должен быть достаточно разработанный правовой компонент).
Полагаю, можно также использовать инструмент для исторических правовых реконструкций. Например, загрузить Дигесты и порешать задачки по римскому праву. Есть у кого-то Дигесты в текстовом формате под рукой?
🔥6
Forwarded from Кружок Пронина
Интересная статья от Forbes про применение искусственного интеллекта в инвестициях.
И, честно говоря, она снова поднимает мой скепсис насчёт полноценного использования ИИ в этой сфере.
Что в статье заявляется?
1️⃣ Персонализированные предложения инвесторам.
ИИ умеет находить корреляции в поведении клиентов, анализировать массивы данных и предлагать персональные инвестиционные решения. Фактически — это продолжение развития машинного обучения и прогнозных моделей. Там больше высшей математики, чем реального «искусственного интеллекта».
Важно понимать: такие технологии давно работают, например, в кредитном скоринге — и да, их можно адаптировать под инвестиционные рекомендации.
2️⃣ Работа с пользователями — голосом и текстом.
Здесь тоже без «прорывов». Голосовые и текстовые интерфейсы развиваются больше десяти лет.
ИИ сегодня разговаривает с нами нормально — но это, по сути, улучшенные коммуникационные технологии, а не новый этап в индустрии.
3️⃣ И самая спорная часть — аналитика.
В статье говорится, что ИИ может заменить аналитиков.
Мы в Malina Ventures протестировали большинство популярных моделей — от Perplexity до платных версий ChatGPT — и результат однозначный: полностью заменить работу аналитика ИИ пока не способен.
Почему?
• страдает фактология: ИИ пропускает данные или выдаёт неточности;
• глубина исследований ниже — мы вручную находили больше конкретики;
• выводы часто требуют интерпретации и опыта, а здесь ИИ «плавает»;
• остаётся проблема галлюцинаций.
В итоге каждое исследование приходится перепроверять и дополнять, а значит — использовать ИИ как основной инструмент в аналитике нельзя. Он помогает в отдельных задачах, но не закрывает весь цикл.
Что действительно понравилось?
ИИ периодически формулирует нестандартные вопросы и сценарии, которые заставляют шире взглянуть на проект.
Вот здесь — да — он работает как хороший дополнительный инструмент, который даёт новый угол зрения.
Вывод.
ИИ уже давно полезен в рутинной аналитике, коммуникациях и в работе с массивами данных, но до замены инвестаналитиков ему далеко. Скорее, это сильный вспомогательный механизм в руках опытной команды, чем самостоятельный игрок.
И, честно говоря, она снова поднимает мой скепсис насчёт полноценного использования ИИ в этой сфере.
Что в статье заявляется?
1️⃣ Персонализированные предложения инвесторам.
ИИ умеет находить корреляции в поведении клиентов, анализировать массивы данных и предлагать персональные инвестиционные решения. Фактически — это продолжение развития машинного обучения и прогнозных моделей. Там больше высшей математики, чем реального «искусственного интеллекта».
Важно понимать: такие технологии давно работают, например, в кредитном скоринге — и да, их можно адаптировать под инвестиционные рекомендации.
2️⃣ Работа с пользователями — голосом и текстом.
Здесь тоже без «прорывов». Голосовые и текстовые интерфейсы развиваются больше десяти лет.
ИИ сегодня разговаривает с нами нормально — но это, по сути, улучшенные коммуникационные технологии, а не новый этап в индустрии.
3️⃣ И самая спорная часть — аналитика.
В статье говорится, что ИИ может заменить аналитиков.
Мы в Malina Ventures протестировали большинство популярных моделей — от Perplexity до платных версий ChatGPT — и результат однозначный: полностью заменить работу аналитика ИИ пока не способен.
Почему?
• страдает фактология: ИИ пропускает данные или выдаёт неточности;
• глубина исследований ниже — мы вручную находили больше конкретики;
• выводы часто требуют интерпретации и опыта, а здесь ИИ «плавает»;
• остаётся проблема галлюцинаций.
В итоге каждое исследование приходится перепроверять и дополнять, а значит — использовать ИИ как основной инструмент в аналитике нельзя. Он помогает в отдельных задачах, но не закрывает весь цикл.
Что действительно понравилось?
ИИ периодически формулирует нестандартные вопросы и сценарии, которые заставляют шире взглянуть на проект.
Вот здесь — да — он работает как хороший дополнительный инструмент, который даёт новый угол зрения.
Вывод.
ИИ уже давно полезен в рутинной аналитике, коммуникациях и в работе с массивами данных, но до замены инвестаналитиков ему далеко. Скорее, это сильный вспомогательный механизм в руках опытной команды, чем самостоятельный игрок.
Forbes.ru
Молодой ленивый сотрудник: как используют ИИ инвестиционные компании и брокеры
Искусственный интеллект все больше проникает в финансовую сферу. По данным Банка России, ИИ применяет в своей работе каждая пятая финансовая организация в России. Еще треть компаний планирует внедрить искусственный интеллект в свои бизнес-процессы в