Аишка
969 subscribers
707 photos
66 videos
2 files
455 links
Side-канал @contentreview с новостями из области искусственного интеллекта (AI)

Наши каналы:
Основной (телеком и IT) – @contentreview
Песочница (БигТех) – @BigTechSandbox
Электричка – @econtentreview
Download Telegram
Коллеги в шутку накинулись на чат-бот Grok за то, что он выдаёт неправильную дату и «живёт» в 2023 году. Хотя его собрат на сайте как раз отвечает без всяких проблем.

Тут есть нюанс – ни одна нейросеть не знает, какие сейчас год, день или время, они в принципе не понимают таких категорий. И это не зависит от количества параметров или даты выпуска. Это всё равно, что задавать вопрос «Какой сейчас день?» книге и потом выбирать случайное слово на случайной странице в надежде, что там окажется заветный правильный ответ.

Именно поэтому так важно снабжать нейросети дополнительной информацией, контекстом. Это можно делать через системный промпт (который скрыт от пользователя, но даёт много полезных инструкций и данных), доступ к поиску, API разных сервисов, внутренней документации. Такой подход называется RAG (Retrieval-Augmented Generation). И именно поэтому любой сервис с доступом к Интернету или дополнительной информации с серверов способен ответить на вопросы о дате, времени, погоде и так далее.

Тут кроется и опасность. Например, если Алиса без всяких проблем узнала дату, время и погоду, то Нейро взял время из поисковой выдачи и в итоге оно оказалось неверным. Он не стал задавать уточняющих вопросов о моей локации, что позволило бы избежать ошибки.

Есть цитата «На практике случайность — это в основном неполная информация». То же самое применимо к выдаче нейросетей и основанных на них сервисах. Поэтому не стоит ожидать от нейросетей чуда, лучше всегда уточнять, откуда именно они берут информацию и на что ссылаются в ответе.

P.S. Вопросы задавались 26 марта в промежуток с 15 до 16 часов по МСК
👍1
Как картинки в стиле Ghibli заставили индустрию ИИ задуматься об авторских правах

OpenAI уже втянута в несколько крупных судебных разбирательства, каждое из которых может кардинально изменить правила использования творческого контента. Иск от The New York Times – самый показательный: газета требует компенсацию за тысячи статей, использованных для обучения ChatGPT без согласования и оплаты.

Параллельно группа известных писателей – включая Джорджа Мартина – подала коллективный иск с требованием немедленно прекратить использование литературных произведений. В Индии крупнейшие СМИ также требуют компенсацию и удаление защищённых авторским правом данных, которые использовались для обучения моделей OpenAI.

Механизм нарушения прост: ИИ-модели обучаются на огромных массивах текстов, изображений, программных кодов. Сами OpenAI признают: полноценное обучение без защищенного контента невозможно. Компания прикрывается концепцией «добросовестного использования», но юристы скептично относятся к «добросовестности» компании, которая собирает любые крупицы данных по всему Интернету без согласия правообладателей и потом на них зарабатывает.

И вот на днях OpenAI запустила новый инструмент генерации изображений, который мгновенно завирусился благодаря тренду «фото в стиле Ghibli». За сутки пользователи создали десятки мемов: от портретов Илона Маска в стиле Миядзаки до фотографий президента Трампа в духе «Унесенных призраками». Такое уже случалось и раньше, например, с произведениями Уэса Андерсона, но не в подобном масштабе.

Да, стиль сам по себе не защищен авторским правом, но модель и не училась «копировать» стиль самостоятельно – она просто получила в дата-сете миллионы кадров из фильмов студии без явного разрешения. И ещё только предстоит разобраться, как быть с авторскими правами в данном случае. Мы в редакции используем сгенерированные картинки как раз потому, что в ближайшие 10-20 лет юридические споры вокруг GenAI вряд ли прекратятся, да и самим ИИ-компаниям придётся сильно постараться, чтобы доказать «добросовестность» использования чужого контента.
👍5
Microsoft, Nvidia и OpenAI спешат в Индию – что их так привлекает?

В гонке искусственного интеллекта появился неожиданный и амбициозный игрок — Индия. Страна, которую еще недавно рассматривали как технологического аутсайдера в гонке ИИ, сегодня формирует новый подход к развитию технологии.


Ключевой особенностью индийского пути является “bottom-up” (снизу-вверх) подход. Вместо того, чтобы копировать западные или китайские модели, Индия создает свою экосистему. Её называют «цифровой общественной инфраструктурой» (Digital Public Infrastructure). Биометрическая идентификация, моментальные платежи, открытый обмен данными — все это делает технологии максимально доступными для почти полутора миллиарда граждан. Напоминает процесс цифровизации в России.

Именно поэтому наравне с программой «Делай в Индии» по локализации производства правительство поддерживает и создание «суверенного ИИ», чтобы минимизировать зависимость от технологий других стран. Правительство инвестирует 1,25 миллиарда долларов в проект IndiaAI Mission. Tata Consultancy Services вкладывает более 1,5 миллиарда в генеративный ИИ. Microsoft готовится инвестировать 3 миллиарда в Индию в течение ближайших двух лет. А пока свой ИИ в разработке, правительство поддержало идею развернуть модели DeepSeek на местных серверах и пользоваться локально.

В Индии ИИ рассматривают как инструмент социальной трансформации. Одна из очевидных задач – сплотить Индию, где говорят на множестве разных языков, и предоставить всем одинаковый доступ к цифровым государственным услугам. Технологии также активно внедряются в сельское хозяйство, здравоохранение, образование.

Кто стал ключевым игроком в этом процессе? Microsoft, который в партнёрстве с местными компаниями будет разрабатывать ИИ-решения для Индии: государственная компания RailTel будет вместе с ними продвигать облачные технологии и ИИ на железных дорогах, Apollo Hospitals – в сети больниц, upGrad – в интеграции помощников на рабочем месте, и так далее. Те же Microsoft собираются к концу 2025 года обучить по меньшей мере 2 млн человек в Индии тонкостям работы с искусственным интеллектом.

Правительство пускает зарубежные компании на свой рынок, но с дополнительными условиями, которые их «приземляют» и дают возможность развиваться местным игрокам. Такая политика даёт свои плоды: стартап Krutrim стал первым индийским AI-единорогом, получив 50 миллионов долларов инвестиций. Они разрабатывают большие языковые модели для индийских языков и планируют построить крупнейший в Индии суперкомпьютер в партнерстве с Nvidia. К Krutrim присоединяются другие компании вроде Sarvam AI, Ola, Yotta Data Services. Ati Motors, например, разрабатывает автономных мобильных роботов для промышленности и привлек 20 миллионов долларов инвестиций. Компания тоже использует платформу Nvidia, Jetson, и планирует в дальнейшем интегрировать в своих роботов искусственный интеллект.

OpenAI ведет переговоры с подразделением JioBrain компании Reliance Industries о расширении присутствия в стране. Компания хочет, чтобы JioBrain продавала и распространяла их продукты. Индийский рынок важен для OpenAI, так как он второй по размеру, а количество пользователей утроилось за последний год. Да и в целом использование генеративного ИИ в стране выше среднемировых показателей – 92% против 75%.

Конечно, пока развивать ИИ Индии придётся с опорой на открытые и зарубежные технологии. До появления «суверенного» индийского искусственного интеллекта стране предстоит преодолеть серьезные барьеры: нехватку квалифицированных кадров, развитие инфраструктуры и риски предвзятости данных. Но тенденция развития уже видна.
👍3
OpenAI внедряет генерацию изображений на основе GPT-4o в свой популярный чат-бот ChatGPT. Функция получила название «Изображения в ChatGPT» и доступна на всех уровнях подписки: Plus, Pro, Team и Free. Бесплатный уровень предлагает лимит использования.

Благодаря улучшенной привязке атрибутов к объектам, генерация изображений стала более точной и надежной. Визуализация текста также была усовершенствована, что значительно облегчает процесс создания связного текста без опечаток. В основе технологии, как уточняется, лежит метод авторегрессии, а не диффузионная модель. Это может способствовать улучшению визуализации текста и возможностей привязки.

Система оснащена надежными средствами защиты от несанкционированного использования. Она предотвращает удаление водяных знаков, блокирует создание сексуальных подделок и отклоняет запросы на создание CSAM. Все изображения включают стандартные метаданные C2PA, что позволяет легко идентифицировать их как созданные OpenAI. В остальном пользователь может свободно использовать изображения в рамках политики использования.
2
#нейродайджест CRAI за неделю

Как картинки в стиле Ghibli заставили индустрию ИИ задуматься об авторских правах
Генерация изображений в стиле Ghibli вызвала новую волну дискуссий об авторских правах и использовании чужого контента для обучения ИИ.

Microsoft, Nvidia и OpenAI спешат в Индию – что их так привлекает?
Индия формирует свою экосистему ИИ с "bottom-up" подходом, привлекая крупные технологические компании и инвестируя в суверенный ИИ. На что стоит обратить внимание и какое будущее ждёт индийский искусственный интеллект?

Иллюзия близости: чат-боты делают нас одинокими?
Новое исследование OpenAI и MIT обнаружило усиление чувства одиночества у тех людей, которые чаще общаются с ИИ.

Нейросети и даты: почему Grok «живёт» в 2023 году?
Объяснение, почему нейросети не знают текущую дату и время, и как подход RAG (Retrieval-Augmented Generation) помогает им получать актуальную информацию.

Пузырь на рынке ИИ: скепсис Alibaba и китайские инвестиции
Председатель Alibaba заявил о признаках «пузыря» на рынке американского ИИ, но при этом Китай настолько же активно инвестирует в развитие собственного ИИ. Кому верить?

ИИ в Одноклассниках: предсказание желаний и «умные» пуши
Одноклассники внедрили новую рекомендательную систему на базе ИИ, анализирующую поведение пользователей и предсказывающую их интересы.

Генерация изображений в ChatGPT vs Google: отличия и тренды.
Сравнение новой функции генерации изображений в ChatGPT с аналогичной от Google. Различия в скорости, качестве и функциональности.

Официальный релиз телеграм-бота Grok: сырая интеграция или ранний анонс?
Официальный релиз телеграм-бота Grok разочаровал сыростью интеграции, устаревшей моделью и ограниченными возможностями.
👍41
О чём лучше не говорить с чат-ботами

Про принцип «если вы не платите за продукт, вы и есть продукт» слышали уже, наверное, все. Правда реалии таковы, что даже если платите – всё равно остаётесь товаром, потому что крупнейшие ИИ-компании отчаянно нуждаются в данных и обратной связи от своих пользователей.

Чем больше пользователи рассказывают ИИ-помощникам информации о своих болезнях, финансовых проблемах, делятся конфиденциальными документами с просьбой их проанализировать – тем больше релевантных данных о них собирает компания. И ни один сервис в мире не застрахован от утечек, перепродажи или просто использования данных в своих интересах – например, для рекламного таргетинга.

Примеры утечек в истории уже были. В марте 2023 года сбой в ChatGPT позволил пользователям видеть заголовки чужих чатов. Под угрозой оказались имена, электронные адреса и платежная информация.

Сотрудники Samsung использовали ChatGPT для работы и поделились с ним конфиденциальными данными – исходным кодом полупроводникового оборудования и протоколами встреч. В итоге информация, попадающая под NDA, стала частью дата-сета компании.

Коллеги из WSJ убеждают, что доверять ИИ не стоит паспорта, медицинские результаты, банковские счета, корпоративные секреты и учетные данные других сервисов. В случае с компаниями всё обстоит ещё серьёзнее: Samsung, например, после инцидента сначала ограничили размер запроса к ChatGPT, а потом и вовсе запретили генеративный ИИ на корпоративных устройствах.

При этом всегда остаётся возможность отказаться от участия в программе «улучшения продукта». Anthropic по умолчанию не используют чаты для обучения, а OpenAI, Microsoft и Google предлагают отказаться от этого в настройках.

Поможет сохранить анонимность и регулярное удаление истории разговоров – большинство компаний окончательно стирают «удаленные» данные через 30 дней. А функция «временного чата» в ChatGPT позволит вообще миновать этот этап и (по крайней мере, со слов компании) пообщаться с ИИ приватно. Хотя это всё равно не повод делиться с ним паролями.
3👍1
Проклятье голосовых ассистентов

В центре внимания оказалась компания Amazon с её новым голосовым помощником Alexa+, который запустился без большинства обещанных функций.

На февральской презентации Amazon показывали «умного» ассистента, способного бронировать билеты на концерты, заказывать столики в ресторанах и вести естественные диалоги. Вместо этого пользователи получат только базовые возможности – вызов Uber и рекомендации по приготовлению пищи.

Возможности вроде заказа еды, распознавания членов семьи и придумывания сказок для детей вообще придётся ждать ещё «несколько» месяцев, но сколько точно никто не знает. То же касается и веб-интерфейса Alexa – его запуск отложен. В России тем временем все эти функции давно доступны через Алису и её интеграцию с экосистемой Яндекса.

Amazon не одинока в своих трудностях. Apple вот тоже отложили выпуск ИИ-версии Siri, что вызвало шквал критики и даже судебный иск за «ложную рекламу». Разработка действительно интеллектуальных голосовых помощников оказалась сложнее, чем предполагали технологические компании, путающие, видимо, способность языковых моделей генерировать текст с реальным интеллектом.

Ещё во время анонса мы писали, что убыточная и бесполезная Alexa в текущем виде компании не нужна, а интеграция ИИ на волне «хайпа» – отчаянная попытка привлечь новых пользователей. Можно поздравить Amazon – они умудрились упустить и эту возможность. Хочется верить, что компания сможет в ближайшие месяцы реализовать все запланированные функции, но верится с трудом.
😁7😢1
Как Nvidia ходит по лезвию бритвы – между американскими санкциями и китайскими деньгами

Китайские технологические гиганты ByteDance, Alibaba и Tencent в первом квартале 2025 года разместили заказы на чипы Nvidia на сумму не меньше 16 миллиардов долларов. Как они это сделали, учитывая санкции и скандалы о перепродаже чипов в обход ограничений? Помог чип H20.

H20 – это не просто чип. Сегодня это чуть ли не единственный «легальный пропуск» Nvidia на большой китайский рынок. Когда одному из их главных потребителей запретили покупать передовые GPU, Nvidia пошли на хитрость и разработали модели «на грани»: достаточно мощные, чтобы устроить покупателей из Китая, и вписывающиеся в ограничения американских регуляторов. Так появились H20, L20 и L2.

DeepSeek смогли оптимизировать потребление памяти во время обучения модели настолько, что им хватило даже урезанных видеокарт. Большой взлёт спроса был после релиза модели R1 и её всестороннего внедрения чуть ли не в кофемашины и зубные щётки в Китае.

Ирония ситуации в том, что ограничения породили настоящий бум спроса. Китайские компании скупают H20 из-за опасений, что дальше не будет даже их. Особенно активно это делают всё те же DeepSeek. В итоге изначально компромиссный H20 неожиданно стал для Nvidia одним из самых прибыльных.

Пока что «довольны» все – и Nvidia, которая продолжает зарабатывать, и китайские компании, которым оставили официальные канал закупки видеокарт. Ну, разве что американские регуляторы начинают понимать, что санкции имеют обратный эффект, мотивируя страны искать обходные пути и развивать свои альтернативы.
👍3
Нейро от Яндекса теперь стал экспертом

Яндекс выпустил бета-версию нового сервиса Нейроэксперт. В него можно загружать свои документы и затем просто задавать вопросы на обычном языке. Ответы будут даваться строго на основе загруженных файлов и ссылок, что позволяет снизить вероятность галлюцинаций и ошибок. Пока инструмент в бете и можно загрузить до 25 источников, но в будущем лимит увеличится.

В отличие от аналогов, Нейроэксперт поддерживает больше форматов. Помимо стандартных PDF и текстовых файлов можно добавить презентации, аудио, изображения и даже видео. Что важно для российских пользователей – через «Добавление ссылки на статью» можно добавлять видео напрямую с платформ (не только из Ютуба, но и из ВК Видео и Рутуба), документы из Яндекс Диска и так далее. Поддерживаются даже сайты, которые NotebookLM добавить не даёт.

Получился гибкий инструмент, который позволяет работать с источниками проще, чем конкуренты. Пользователи также могут менять стиль ответов ИИ – например, заставить его отвечать только таблицами или в другом нужном формате, поставив обработку информации на поток.

Без недостатков в бете не обошлось. Картинки сервис понимает пока поверхностно – может допускать ошибки в процессе распознавания, поэтому лучше важную информацию добавлять в текстовом виде. Нейроэксперт также уступает западным аналогам в точности цитирования: если NotebookLM дает прямые ссылки на конкретные фрагменты текста, российский сервис часто ограничивается названием источника и цитатой, не даёт перейти к нужному месту оригинала, может не найти в источнике имена или отдельные факты по запросу.

Несмотря на эти недостатки (которые компания ещё сможет исправить), получился полезный продукт. Он доступен из России без ограничений и поддерживает больше форматов, чем конкуренты. Для российских пользователей Нейроэксперт может даже стать безальтернативным решением, учитывая сложности с доступом к западным сервисам.
🔥2