Аишка
976 subscribers
715 photos
67 videos
2 files
461 links
Side-канал @contentreview с новостями из области искусственного интеллекта (AI)

Наши каналы:
Основной (телеком и IT) – @contentreview
Песочница (БигТех) – @BigTechSandbox
Электричка – @econtentreview
Download Telegram
Пока писали пост про генерацию подкастов, столкнулись со странной особенностью текстов про NotebookLM от Гугла — люди часто воспринимают его либо просто как сервис для генерации подкастов, либо как «умные заметки» для студентов типа Notion. Сегодня хотим написать, почему считаем его чем-то большим — фактически, полноценной кастомизируемой RAG системой для пользователей и одним из самых полезных сервисов для работы с информацией.

Сначала пару слов про то, что такое RAG (Retrieval Augmented Generation). Это специальный метод работы с большими языковыми моделями, где пользователи не просто задают вопрос (надеясь, что нужная информация попадалась модели во время тренировки) — а снабжают модель всем необходимым контекстом. По такому принципу работает, например, Нейро от Яндекса — сначала модель получает запрос, потом идёт с ним в поиск, собирает актуальную информацию с веб-страниц и уже на основе этой информации, со ссылками и контекстом даёт ответ пользователю.

У такого подхода очень много плюсов, потому что он позволяет избежать донастройки модели, легко обновлять базу данных новыми сведениями и в целом дешевле и проще в использовании. Но из описания понятно, что самый главный его плюс — возможность свести к минимуму «галлюцинации» модели (это когда она не знает ответ и начинает его самозабвенно на ходу придумывать).

Так вот NotebookLM — это сервис, который позволяет вам загрузить до 50 самых разных источников (сайты, документы, аудио, видео), сформировав тот самый контекст для работы нейросети. Каждый источник может содержать до 500000 слов (то есть примерно 1000 стандартных книжных страниц). Сервис будет «понимать» содержание всех источников, вплоть до ссылок на конкретные строчки конкретных документов, что позволит легко проверить результаты работы нейросети. При этом в основе сервиса одна из лучших мультимодальных моделей Гугла — Gemini 2.0 — которая легко понимает ваши запросы. Понятно, что Гугл предупреждают: «Ответы NotebookLM могут быть неточны. Обязательно проверяйте их» — но пока это всё равно самый надёжный способ работы с ИИ.

В итоге полностью меняется подход работы с данными — больше не нужно самостоятельно изучать, например, API какого-нибудь сервиса, 7 томов исследований или 10 часов лекций. Достаточно загрузить их сюда, задать вопросы о деталях документов, сказать найти неточности или странные аномалии в данных, попросить предложить темы и структуру эссе или статей, которые могут на этих источниках основываться — и тем самым посмотреть на объект изучения с разных сторон. В данном случае функционал платформы не ограничен просто кратким пересказом, чем сегодня практически невозможно удивить пользователя.

При этом каждый ответ нейросети сопровождается ссылкой на конкретную цитату из источника — то есть можно пройти и проверить, не придумала ли вдруг она что-то лишнее.

Ну и самое удивительное, что сервис отлично работает на русском языке (кроме генерации подкастов) и пока что полностью бесплатный. Полноценных аналогов у него нет, ну или мы не нашли, хотя есть многообещающие конкуренты вроде NotebookLlama или более простые альтернативы, такие как ChatPDF, боты ChatGPT и Perplexity, которые тоже позволяют загрузить файл и задать вопросы по его содержанию.
👍2💋1
Аишка
Perplexity, аналог Яндекс Нейро, также успешно провел три раунда финансирования за последний год и планирует еще один, что может увеличить его стоимость до 9 миллиардов долларов
На фоне громкого обсуждения релиза OpenAI своего нового поколения думающей модели o3 потерялась ещё одна важная новость — Perplexity на днях купили стартап Carbon и пообещали прийти в Google Docs, Notion и Slack

Carbon, стартап из Сиэтла, специализируется на RAG-системах — подключает внешние данные к большим языковым моделям. Учитывая, что это основная деятельность Perplexity, поглощение кажется очень логичным.

Теперь компания обещает, что уже в начале 2025 года сделает поиск по файлам и рабочим сообщениям пользователей в Notion, Google Docs, Slack и других корпоративных приложениях — то есть уже не просто будет предоставлять услуги поиска по Интернету, а зайдёт на территорию корпоративного поиска к конкурентам вроде Glean или Google Cloud Search.

Всего год назад Perplexity купили Spellwise от бывшего главы разработки экспериментальных проектов Яндекса — клавиатуру для IOS, которая помогала с помощью ИИ писать или редактировать тексты (сейчас так умеет Яндекс Клавиатура, например). Компания предпочитает делать точечные покупки, которые потом бесшовно интегрируются в их флагманский продукт — поиск.

За день до этого Блумберг поделился новостью от своих источников, что Perplexity всё-таки привлекли новый раунд инвестиций в 500 миллионов долларов и теперь их оценка выросла до 9 миллиардов, увеличившись в 3 раза всего лишь с июня.

Учитывая планы расширить сегмент рынка и уйти в корпоративный поиск, проблем с привлечением инвестиций, скорее всего, не будет и дальше: в числе инвесторов Perplexity — New Enterprise Associates, инвесткомпания Bezos Expeditions, Nvidia, бывший гендиректор YouTube Сьюзен Воджицки и так далее.
Компании перестарались с внедрением функции суммаризации текста везде, где только можно

Сегодня появилась возможность не читать полностью практически ничего. Уведомления, письма, сайты, видео, целые книги — всё укладывается в несколько абзацев текста. Скоро, вероятно, и в Интернет мы будем ходить «суммированный»: одни нейросети будут генерировать контент по запросу вместо людей, другие — отображать этот сгенерированный контент в пересказанном виде, как в испорченном телефоне. Хорошая ли это тенденция?

Огромная проблема любых нейросетей — галлюцинации, от которых практически невозможно избавиться. Если речь идёт просто о сжатом пересказе статьи с чьим-то мнением, то с этим ещё можно смириться. Но как быть с более серьёзными кейсами?

Например, с поиском. Когда Google добавили в свой поиск AI ассистента, он сразу стал рекомендовать пользователям есть камни хотя бы раз в день. Понятно, что вопрос был глупый — «сколько камней в день мне нужно есть». Но ведь это просто гиперболизированная иллюстрация того, как галлюцинирует нейросеть.

Нейро в этом плане работает тоже не идеально — можете сами попробовать спросить поиск Яндекса, сколько ног у лошади. Причём разработчики сервиса постоянно напоминают, что ИИ может ошибаться в подобных вопросах. Но ведь ошибка может быть и в каком-то важном ответе — мы в редакции неоднократно ловили что Нейро, что Perplexity в галлюцинациях, противоречиях предыдущим сообщениям и в целом странной работе с источниками (когда для ответа берётся случайная фраза из статьи на условном Дзене, которая вообще не об этом).

Недавний громкий кейс — проблемы Apple Intelligence в уведомлениях IOS 18.2. Иногда он просто выдаёт глупости, но в худшем случае — искажает содержание уведомления. На днях пользователям показали ложные новости с BBC про самоубийство Луиджи Манджионе и с NY Times про арест Нетаньяху. Хотя нейросеть просто «работала» — она прочитала текст уведомлений и суммировала их на свой лад. Представьте, как легко будет получить некорректную информацию из таких уведомлений, если привыкнуть не читать оригиналы?

Недавно Яндекс Почту добавили Нейрофильтр, который призван отобрать самые «важные» письма и показать их вам в сокращённом виде. При этом вариантов настроить критерии «важности» нет, а суммированный текст часто сокращается буквально до нескольких слов, при прочтении которых легко как раз таки упустить что-то важное. Понятно, что можно всегда зайти в тело письма проверить — но зачем тогда вообще сокращать, если всё равно каждый раз приходится заходить и перепроверять?

Создаётся ощущение, что компании по всему миру усиленно пытаются сделать нейросети привычной частью взаимодействия пользователя с их сервисами. Но как только пользователь привыкнет к сокращённым текстам, пересказам, сгенерированным ответам — есть риск, что он перестанет ожидать от них подвоха и проверять правильность информации.

Очень подходит сюда цитата нашего главреда — «Люди тоже галлюцинируют, но в этом случае у каждой галлюцинации есть имя и фамилия». В случае с нейросетями никаких отественных нет, хотя бы потому, что мы сами не до конца понимаем, откуда именно берётся ответ и каким он будет в следующий раз. А у нейросетей нет страха наказания за враньё и фейки, которые в определённых обстоятельствах могут сломать жизнь живому человеку.

Одно из решений проблемы — ограничение «креативности» моделей и предоставление контекста, с которым она будет работать (те самые RAG системы). Но даже такой вариант не идеален.

Как будто бы пора перестать добавлять суммаризацию всего и всюду для «экономии» времени пользователей, нет такого ощущения?
👍2🤔1
Media is too big
VIEW IN TELEGRAM
Нетфликс активно использует ИИ в своих продуктах — хотя мало об этом рассказывает

Нейросети, например, отвечают за алгоритмы рекомендации и персонализации контента на платформе, о чем уже было написано много статей. Они анализируют поведение пользователей, ищут закономерности и сходства в их предпочтениях, а также изучают жанр, актёрский состав, диалоги, музыку и эффекты в продуктах, чтобы адаптировать рекомендации под интересы каждого пользователя в режиме реального времени.

Для этого компания использует продвинутые внутренние технологии, вроде связки инструментов SepFormer и Bandit. Эти инструменты позволяют разделить музыку, диалоги и фоновые звуки в сведённых треках для более глубокого анализа и последующего улучшения качества звука.

Изображение тоже нужно анализировать — и для этого существует платформа Video Annotator. Она использует возможности больших мультимодальных языковых моделей для распознавания образов на видео и картинках. Это важно для поиска и обнаружения контента, персонализации и создания рекламы.

ИИ также анализирует показатели проектов компании за прошлые годы, изучая сценарии, героев, темы и динамику сюжета. Это позволяет предсказать, какие элементы будут наиболее привлекательны для зрителей. На основе этих данных продюсеры могут принимать более обоснованные решения при создании новых шоу и сериалов.

И вот в соцсетях недавно появилось и набрало много просмотров новое видео якобы с демонстрацией того, как Нетфликс использует нейросеть для липсинка (вероятнее всего, если это не просто случайное совпадение озвучки и движения губ, что пользователь попал в группу А/Б-тестирования этой функции). Такая технология обеспечивает синхронизацию речи с движениями губ актёров, что делает локализацию более естественной. Учитывая стремление Нетфликса завоевать международный рынок и создавать продукты с учётом локальных особенностей, такое нововведение может уменьшить языковой барьер при потреблении контента.

У Нетфликса в дубляже вообще большой бэкграунд — в 2021 году они обработали более 5 миллионов минут видео для улучшения качества озвучки. Можно предположить, что компания готовит технологии, подобные переводу и дубляжу с липсинком от Heygen. Автоматический перевод уже не является чем-то новым — его тестируют в YouTube и давно добавили в Яндекс Браузере — но проблема заключается в том, чтобы сделать его максимально бесшовным и естественным. Текущие решения не могут.

Из-за более концентрированной русскоязычной аудитории у наших онлайн-кинотеатров пока нет необходимости активно дублировать контент. Однако они, а в частности Кинопоиск, тоже нашли применение нейросетям — интегрировав технологии распознавания актёров и музыки в кадре. В первом случае используется нейросеть DeepDive, которая совмещает компьютерное зрение с доступом к базе данных изображений Кинопоиска.

Будем внимательно следить за тем, окажется ли видео правдивым и релизнет ли Нетфликс в итоге автоматический липсинк, не говоря уж о дубляже. Ведь это может привести к революции в индустрии дубляжа и перевода и сильному её сокращению, если не вымиранию.
Лаборатория искусственного интеллекта Сбера совместно со студентами ИТМО создали и опубликовали в открытом доступе библиотеку RIDE.

Эта библиотека предназначена для ускорения расчета кратчайшего пути на графе. Грубо говоря, это инструмент, который помогает компьютерам быстро находить кратчайший путь между двумя точками на карте — и это можно использовать для навигации, доставки или дизайна сложных транспортных систем.

Можно предположить, что в дальнейшем эту технологию будут применять для улучшения сервисов дочерних компаний Сбера — 2ГИС и Ситидрайв.

Учитывая, что конкурировать с Яндекс Картами очень сложно, в 2ГИС выбрали несколько иной подход — они ориентируются на сегменты B2B и B2G, интегрируя современные технологии. Например, можно вспомнить 2ГИС Про — решение для работы с большими данными и их визуализации на картах; а также запущенное в этом месяце приложение Линза, которое с помощью искусственного интеллекта позволяет осуществлять мониторинг городской среды, распознавать объекты с помощью камеры и анализировать полученные данные на серверах компании.

Предполагается, что этот сервис будет полезен для государственных проектов и служб, связанных с мониторингом городской инфраструктуры. Благодаря ИИ и машинному зрению коммунальные службы смогут в реальном времени получать с камер смартфонов данные о состоянии дорожного покрытия, знаков, фонарей и мусора, видеть их на карте, фиксировать инциденты и оперативно их устранять.

У Яндекса есть собственное решение для анализа больших данных — DataLens, которое используется для анализа самых разных данных, включая информацию на картах. Однако конкретного решения для B2B или B2C мы не нашли — видимо, 2ГИС тоже, раз поспешили занять эту нишу.
👍2
«Яндекс» связал рост финансовых показателей с интеграцией ИИ в массовые сервисы

В декабре «Яндекс» сообщил журналистам, что связывают рост всех своих финансовых показателей «с развитием и интеграцией ИИ в массовые сервисы». По данным компании, «уже сейчас 99 процентов выручки рекламной сети "Яндекса" обеспечивают инструменты, которые с помощью ИИ управляют кампаниями». Говоря же о генеративном ИИ, в «Яндексе» сказали, что внедрили большую языковую модель YandexGPT в 20 собственных сервисов. В их числе и потребительские платформы, например «Алиса», «Поиск», «Браузер» и другие.

Хотя в Альянсе ИИ (объединяет «Яндекс», VK, «Уралхим», «Северсталь» и т. п.) настаивают, что важно всего видеть реальную пользу от ИИ, выражающуюся в деньгах, но срок окупаемости может составлять до нескольких лет, и в нем нужно учитывать не только стоимость разработки, но и стоимость инфраструктуры и вычислительной техники.

Так что логично, что вложения в развитие ИИ могут не давать быстрого эффекта на финансовые показатели: технология относительно недавно вышла в массовую эксплуатацию и сценариев ее монетизации пока не так много. Однако у «Яндекса», например, с апреля действует подписка на опцию «Алиса Про» с интегрированной в нее генеративной сетью YandexGPT 3. Таким образом компания делает первые шаги к монетизации.
Недавно в Гугле назвали 5 основных ИИ-трендов для бизнеса в 2025 году. Среди них:

Мультимодальный искусственный интеллект, который будет обрабатывает информацию сразу из текста, изображений, аудио и видео, обеспечивая более широкое понимание контекста.

ИИ-агенты, которые будут автоматизировать сложные задачи и рабочие процессы бизнеса. Такие агенты уже внедряются для выполнения функций техподдержки, кодинга, обработки данных и «креатива» (генерации идей и медиаконтента), просто масштаб внедрения и связность действий, в том числе благодаря мультимодальности, вырастут.

Поиск на основе ИИ, который позволит любому предприятию внедрить поиск по внутренней базе данных, документации, товарам и так далее, выйдя за рамки ключевых слов. Для доступа к данным легко будет использовать изображения, аудио, видео и разговорные запросы. Причём, по прогнозам Гугла, рынок корпоративного поиска к 2031 году вырастет почти до 13 миллиардов долларов. Видимо, это понимают и Perplexity, раз инвестируют деньги в покупку RAG стартапов.

• Дальнейшее улучшение клиентского опыта за счёт персонализации взаимодействия с клиентами, предоставления рекомендаций, улучшения поиска и повышения лояльности к бренду.

Безопасность на основе ИИ для обнаружения и предотвращения угроз, автоматизации задач безопасности и ускорения времени реагирования. Учитывая растущее число угроз и растущий же рынок кибербезопасности, потребность в защите сетевой инфраструктуры может стать новым драйвером инвестиций в искусственный интеллект.

А что в России? Помимо уже упомянутых Гуглом трендов, которые будут актуальны и для нашего рынка тоже, есть и другие, более специфичные.

Например, государственная поддержка ИИ — в этом году федеральный проект «Искусственный интеллект» был включён в нацпроект «Экономика данных», а национальную стратегию развития ИИ продлили до 2030 года.

Это подстегнёт развитие отечественных генеративных нейросетей, в то время как большая часть стран в мире пользуется готовыми зарубежными продуктами. Ждём новых моделей от Яндекса со Сбером, а также fine-tuned модели на базе решений в открытом доступе от энтузиастов (вроде Saiga и Vikhr) и крупных игроков рынка — МТС, Т-Банка, Авито и так далее.

Пока ИИ применяется довольно локально и в некоторых сферах, поэтому помимо банковской сферы и здравоохранения стоит ожидать его активного внедрения в кибербезопасность, транспорт, логистику, образование, энергетику и промышленность.

Ещё один тренд — экспорт российских ИИ-решений. В июле 2024 года на ИННОПРОМе Российский экспортный центр и Федеральный центр прикладного развития искусственного интеллекта заключили соглашение о сотрудничестве, направленное на рост экспорта отечественного ПО и радиоэлектронной продукции на зарубежные рынки. В рамках соглашения они будут способствовать продвижению отечественным ИТ-брендов и решений за пределами России. Однако важно даже не это, а сами продукты — благодаря выгодному соотношению цены и качества российских решений, они с высокой вероятностью будут пользоваться спросом на рынках СНГ, Азии и Латинской Америки.

Самое неприятное — это нехватка кадров, которая сохранится в 2025 году и будет мешать компаниям расти.
👍2👎1
Неплохой вариант понять, насколько сложно устроена LLM — посмотреть визуализацию всех этапов работы нейросети

Брендан Байкрофт подготовил наглядную 3Д-модель LLM и сделал гайд по всем этапам её работы (именно inference) с пояснениями. Здесь мы видим и обработку ввода, и его токенизацию, превращение в вектора, генерацию логитов и так далее, вплоть до вывода наиболее вероятного последующего токена.

К сожалению, пока набор моделек небольшой, но даже на нём можно наглядно проследить эволюцию GPT от поколения к поколению. Начинаешь лучше ценить скорость работы современных, куда более сложных LLMок, учитывая количество операций, которые им приходится совершать для генерации каждого следующего токена.

Сам гайд на английском, но текст легко переводится при желании. Да и это просто красиво…
🤩2
Что за САПФИР?

На базе фонда «Сколково» в начале 2025 года будет запущено Стратегическое агентство поддержки и формирования ИИ-разработок (САПФИР), которое станет координационным центром для развития этой отрасли. Его задача — объединить усилия бизнеса, науки и государства, чтобы превратить ИИ в один из драйверов экономики.

Курировать направление будет Минэкономразвития, а руководителем станет заместитель главного управляющего директора по экспертизе и финансовой поддержке «Сколково» Татьяна Союзнова.

Резиденты «Сколково» уже показали примеры успешной интеграции ИИ в продукты: система «К-Скай» первой в стране получила статус медицинского изделия с ИИ, а нейроимплант от компании «Сенсор-Тех» ELVIS по примеру Neuralink установили примату — он призван помочь ослепшим людям частично вернуть зрение.

Нейроимпланты достались не только обезьянам, но и крысе — лаборатория «Нейри» совместно с МГУ подключили мозг крысы к ИИ — «искусственной интуиции» (в итоге инвазивный интерфейс с ИИ подсказывает крысе правильные ответы на вопросы). Есть и проекты для улучшения логистики — «Моринтех» оптимизирует ледовые маршруты Северного морского пути, а «Тераплан» ускорил доставку Почты России.

Государство планирует направить 5% федерального бюджета на науку в 2025 году на исследования в сфере ИИ. Причём ещё 15% расходов пойдут на разработки, где ИИ станет ключевым инструментом. А в 2025 году пройдет новая волна отбора исследовательских центров с фокусом на создании «сильного ИИ» — технологий, которые стремятся приблизиться к человеческому мышлению (привет, AGI).

ИИ для России — не просто тренд, а стратегический ресурс. Согласно Национальной стратегии развития ИИ, к 2030 году прирост ВВП страны от его применения составит 11,2 трлн рублей.

Создание САПФИРа и наращивание финансирования исследований в области ИИ — продолжения тренда на поддержку и консолидацию этой отрасли, а также иллюстрация намерения России занять заметное место в гонке с США, Китаем и ЕС. Россия, несмотря на более скромные инвестиции по сравнению с глобальными игроками, делает ставку на синергию государства, науки и бизнеса. А САПФИР, как предполагается, должен стать центральной площадкой для координации этих усилий.
Forwarded from Content Review
Сегодня всем нам хотелось бы услышать, что прошедший год стал самым сложным, и дальше будет легче. Мы все эти годы старались не давать ложных надежд, и если посмотреть на тексты почившей в Бозе рубрики «утренняя реплика», то, в принципе, обо всем мы уже предупреждали. И, увы, не можем сказать, что следующий год (годы) будет легче. Нет, все будет только хуже.

Вне зависимости от геополитической ситуации, ничего хорошего от наших депутатов и чиновников ждать не стоит. Более того, если в прошлом их деятельность хоть как-то была прогнозируема, а инициативы являлись скорее способом прощупать пределы горизонта, то черная дыра, раскрывшаяся в августе, показала, что если горизонт и был нащупан, то это горизонт событий. За которым, как известно, неведомое нечто, никто оттуда пока еще не возвращался.

Сообразно изменилась и риторика нашего профильного ведомства. Все хорошо, надои растут, приступаем к посеву озимых. На этом фоне депутат, открывший для себя приставку на AOSP с накатанным на нее APK с сервисом облачных игр, и упорно называющий ее игровой консолью – меньшее из зол. Куда мрачнее выглядят те, кто стоит за спиной и строчит очередные удивительные инициативы. Ведь у них еще столько разных идей.

С другой стороны, во весь рост разворачивается кризис доверия всех ко всем. Декабрь 2024 года стал если не рекордным по количеству хайпожорских интерпретаций информационных поводов, то точно вехой в этом направлении. Если раньше официальные информационные агентства еще хоть как-то держали себя в руках, то теперь формулировки, искажающие суть события, проникли и в эти ленты. Самое страшное заключается в том, что согласно закону о СМИ, что прошло по лентам официальных агентств, то является, условно говоря, истиной. Является ли истиной утверждение «IP телефонию запретили»? Вопрос риторический. Так и хочется крикнуть: «только не ешь желтый снег». Но чем дальше, тем больше понимаем, что это крик в пустоту.

Но если вам кажется, что это просто у нас тут все на взводе, то вы глубоко ошибаетесь. Нейросети уже развились до достаточного уровня, чтобы наполнить сеть текстами с той или иной степенью галюцинаций. Судя по тому, как радостно вещают на профильных конференциях о том, как здорово использовать GPT (не важно чей) в контентной работе, нас ждет масса удивительных открытий, а скандалы, связанные с дезинформацией из-за того, что какой-то журналист подсел на нейросервисы, станут обычным делом.

В результате медиапространство все больше будет напоминать островное государство, которое в виде небольших островков зиждется в огромном океане сгенерированных текстов, где правда и вымысел густо перемешаны, и верить, увы, никому нельзя. Персонаж «Мастера и Маргариты», утверждавший, что не бывает «второй свежести», потеряет свой шарм и актуальность: нас ждут тексты третьей и четвертой свежести, прошедшие через несколько процессов «обогащения», пересказа и обработки GPT. Анекдот про Пушкина, сидящего на столбе и всех посылающего известно куда, перестанет быть анекдотом.

Вглядываясь в густой туман галюционирующих нейросетей и видя в этом тумане лишь горящие глаза депутатов, сложно сохранять оптимизм. Но мы все же считаем, что нам с вами очень повезло. Мы находимся в самом центре стремительно меняющегося мира. Нейросети – это не только галюцинации, но и уникальные инструменты, сильно облегчающие нам жизнь. А депутаты – ну, в 90-е были и похуже. Ничего, пережили. И этих переживем.

Так что выше нос. Все будет ровно. Будем держаться вместе, так победим. Этот год будет до ужаса интересным. С праздником.
🔥2
Яндекс Клавиатура пробует поздравить собеседника за вас

В приложение добавили кнопку «Поздравить», которая подключает YandexGPT и генерит текст поздравления в заданном стиле

Нашлась замена открыткам с блестками в Вотсапе?
😁2🤨1👻1
Настало время подводить итоги 2024 года в сфере ИИ. Поговорить об этом нам помогут 2 доклада о положении вещей в мире, и 1 — в России (подробности об источниках в конце)

2024 год стал поворотной точкой в развитии искусственного интеллекта, что подтверждает почти 100 миллиардов долларов инвестиций в компании этого сектора. Лидером года стала OpenAI: создатель ChatGPT привлек 6,6 миллиарда долларов, а её оценка в октябре достигла 157 миллиардов. Генеративные модели, такие как GPT-4o от OpenAI, Gemini от Google, a также Claude, Deepseek и так далее задали новый стандарт качества — эти системы не только обрабатывают текст, но и работают с видео, аудио и другими мультимодальными данными в реальном времени. Google даже считают развитие мультимодальных моделей главным трендом 2025 года.

Интересно, что средняя компания, занимающаяся ИИ и достигшая более 30 миллионов долларов годового дохода, потратила на это всего 20 месяцев (по сравнению с 65 месяцами для столь же перспективных SaaS-компаний).

ИИ в реальных отраслях
Технологии искусственного интеллекта продолжили находить применение в самых разных сферах. В здравоохранении ИИ помогал разрабатывать персонализированные терапии, в образовании улучшал образовательные программы, а в производстве оптимизировал рабочие процессы. Финансовые компании автоматизировали операции с помощью ИИ, а медиаиндустрия использовала технологии для создания контента. Рынок наполнился специализированными решениями: от AI-powered developer tools для программистов до legal tech для юристов.

Рост конкуренции и технологическая гонка
Доминирование NVIDIA в производстве чипов для ИИ остаётся непреложным, однако компании Google (чип Axion), Meta (экстремисты в РФ, чип MTIA) и Amazon (чип Trainium2) активно наращивают производство своих решений. Хотя рыночная капитализация NVIDIA достигла 3 триллионов долларов как раз за счёт GPU для тренировки ИИ-моделей, и потеря этого рынка будет для компании очень неприятным ударом. В то же время модели Gemini 2.0, Claude 3.5 Sonnet и Grok 2 догоняют GPT-4. Правда, выпущенная под Новый год GPT o3 смогла удивить всех и на какое-то время подтвердить лидерство OpenAI, но Google и Deepseek уже дышат в спину, выпустив следом свои reasoning решения.

Регулирование
Вопросы регулирования и безопасности технологий выходят на первый план. Государства обсуждают новые правила защиты данных, предотвращения предвзятости алгоритмов и минимизации рисков от злоупотребления ИИ. Компании сталкиваются с растущим вниманием к вопросам ответственности за действия ИИ-систем.

Проблемы и риски по итогам 2024
Искусственный интеллект сталкивается с рядом вызовов в области безопасности, этики и экономики. Модели ИИ требуют более сложных протоколов защиты, а их использование сопровождается этическими дилеммами — предвзятостью, вопросами авторских прав и рисками дезинформации. Особую тревогу вызывают дипфейки, используемые в мошенничестве. В экономике ИИ порождает высокие расходы, нехватку кадров и вопросы о рентабельности, а на международной арене усиливается борьба между США и Китаем за технологическое лидерство.

Ситуация в России
В России развитие ИИ идёт медленнее, чем в США или Китае. Исследования показывают, что уровень готовности страны к внедрению ИИ оценивается в 3,5 из 10 баллов. Лидерами внедрения остаются ИКТ, финансы, ТЭК и высшее образование. А вот культура, спорт и социальная сфера, только начинают этот путь. Основные барьеры — нехватка кадров, недостаток финансирования и низкая осведомлённость о возможностях технологий. Тем не менее, Россия может войти в пятёрку стран лидеров по технологиям ИИ. В 2024 году 43% организаций уже использовали его в той или иной форме, а 36% из них получили существенный или многократный экономический эффект.

Источники: State of AI Report от Air Street Capital, Global AI Report от Rackspace и доклад о готовности приоритетных отраслей российской экономики к внедрению искусственного интеллекта в 2024 году от Национального центра развития искусственного интеллекта при Правительстве РФ.
👍3
В обновлении iOS 18.1 появилась возможность получать короткие сообщения с новостными сводками, которые готовил искусственный интеллект. Однако практически сразу к этим сводкам возникли вопросы у тех, чья информация в них использовалась. В декабре 2024 года BBC возмутилась тем, что Apple разослал новостное уведомление о том, что Луиджи Манджоне, убивший генерального директора United Healthcare, застрелился. Это было абсолютной дезинформацией, но BBC возмутило то, что Apple подписал сводку брендом BBC. Выходило так, как будто это BBC распространяет недостоверную информацию.

Apple не стала реагировать, сделав вид, что это просто случайность. Но журналисты продолжили следить за тем, как AI Apple работает с информацией. Выяснилось, что Apple продолжает рассылать новостные уведомления с враньем, подписывая его как информацию от BBC.

В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.

Главной проблемой в BBC и других медиа считают не то, что Apple коряво обрабатывает доступные ей новостные источники, а то, что она подписывает эту информацию чужим брендом. Пользователь получает уведомление от условного BBC Sport, хотя BBC Sport не имеет никакого отношения к этой информации, это всего лишь источник, на основе которого ИИ Apple сделал какие-то собственные выводы.

BBC призывает отключить Apple AI до тех пор, пока ИИ не научится обрабатывать информацию так, чтобы не превращать ее в дезинформацию. Apple отмалчивается. Тем временем все больше медиа прописывают в robot.txt прямой запрет нейросетям использовать их контент для обучения и использования в обогащенных ответах на поисковые запросы.
🔥3
OpenAI не хватает Интернета? Релиз GPT-5 откладывается

OpenAI продолжает разработку больших языковых моделей. GPT-5 (с кодовым названием Orion), со слов генерального директора Сэма Альтмана, может быть похожа на «виртуальный мозг» с «более глубокими мыслительными способностями» и станет значительно более мощной, функциональной и «разумной», чем GPT-4. Однако на пути к созданию этой модели компания столкнулась с множеством препятствий, которые могут как затормозить выпуск модели, так и поставить под вопрос её эффективность.

Создание моделей уровня GPT-5 требует колоссальных вычислительных мощностей. Шестимесячная тренировка может обойтись OpenAI примерно в 500 миллионов долларов. Общие затраты на создание и запуск модели могут превысить миллиард долларов (и это при том, что за 2024 год они привлекли в сумме 6,6 миллиардов долларов инвестиций).

Ещё одна важная проблема — нехватка качественных данных для обучения. OpenAI уже использовала большую часть доступной информации из открытых источников. Они нанимают специалистов в программировании, математике, физике и так далее, чтобы те создавали синтетические данные, расписывали пошагово решение задач и создавали рассуждения, на которых обучают модель. Этот подход, хотя и эффективный, очень дорогой и трудоемкий. Коллеги из WSJ пишут, что «в мире может не хватить данных, чтобы сделать Orion достаточно умным».

Поиск и создание данных для обучения Orion — одна из ключевых проблем, с которыми сталкивается OpenAI. Ещё одна проблема — внутренняя конкуренция за ресурсы. Например, Sora, генератор видео на основе ИИ, развивается параллельно с Orion и отбирает часть команды и мощностей.

Внутренние проблемы компании также усугубляют ситуацию. Уход соучредителей, ведущих инженеров и даже временное увольнение Сэма Альтмана создали напряжённую атмосферу в команде.

Несмотря на все трудности, потенциал у GPT-5 остаётся впечатляющим. Ожидается, что эта версия будет многократно мощнее GPT-4. Помимо большего числа параметров у модели будет улучшенная память — она сможет запоминать больше информации из предыдущих взаимодействий.

Однако конкуренция в сфере ИИ растёт. Те же Google и Anthropic активно разрабатывают свои языковые модели. Илон Маск недавно анонсировал Grok 3, претрейн которого стал самым масштабным в истории: более 200 миллионов часов работы H100 GPU, в 10 раз больше Grok 2.
1🔥21🍾1
В Китае создали экспериментальную сеть для быстрой передачи данных, обучения ИИ и не только

Китай завершил этап создания экспериментальной суперсети CENI (China Environment for Network Innovations) — уникальной платформы для тестирования технологий интернета будущего. Это масштабный национальный проект, который объединяет инновационные разработки в области оптической связи, детерминированных сетей и больших данных.

CENI была запущена в 2021 году под руководством Университета Цинхуа с целью стать «песочницей» для испытания технологий, способствующих созданию интернета нового поколения. Ученые планируют использовать её для проверки устойчивости систем к кибератакам, оптимизации передачи данных и разработки новых бизнес-моделей.

Сегодня сеть охватывает 40 ведущих университетов Китая, крупнейшие города и 13 провинций, а её протяжённость — 13000 километров. В ближайшем будущем планируется расширить сеть и увеличить количество подключенных вузов и компаний до 100.

CENI основана на передовых технологиях, обеспечивающих рекордные показатели передачи данных, нулевую потерю пакетов и задержку менее 20 микросекунд даже при пиковой нагрузке. Она способна передавать данные на расстояние более 2000 километров без необходимости в усилителях сигнала. По словам Лю Юньцзе, одного из главных разработчиков сети, её можно сравнить с «высокоскоростной железной дорогой для компьютеров», обеспечивающей стабильную передачу больших данных.

Новая сеть станет основой для обучения моделей ИИ, требующих обработки огромных массивов данных, создания промышленных интернет-приложений, разработки технологий для «умных городов» и формирования единой вычислительной инфраструктуры страны. В ходе эксперимента удалось с точностью до сантиметров и без задержек контролировать робота в 500 километрах от отеля, где был оператор.

CENI — не только инструмент укрепления кибербезопасности, но и ключевой элемент для реализации стратегии «Данные с востока — вычисления на западе», направленной на передачу данных из восточных регионов Китая в западные центры обработки. Это позволяет использовать возобновляемую энергию в ЦОДах, сократить затраты и улучшить экологические показатели. Также CENI — часть интегрированной национальной вычислительной сети, которая должна стать основой для «цифрового Китая». В долгосрочной перспективе эта инфраструктура должна ускорить развитие ИИ, поддержать рост цифровой экономики и повысить глобальную конкурентоспособность страны.
🔥2
NVIDIA решили начать год красиво — с кучи анонсов на конференции CES 2025. Главной темой, как это водится в последнее время, стал ИИ

Ключевым анонсом была новая линейка графических процессоров GeForce RTX 50 серии, основанная на архитектуре Blackwell. RTX 5090, флагман этой серии, содержит 92 миллиарда транзисторов и обеспечивает производительность ИИ в 3352 триллиона операций в секунду (TOPS), что делает его самым мощным графическим процессором GeForce на сегодняшний день. Этот скачок производительности, по словам NVIDIA, обусловлен оптимизацией для нейронного рендеринга, новыми потоковыми мультипроцессорами, оптимизированными для нейронных шейдеров, и пятым поколением тензорных ядер. Внедрение вычислений FP4 обещает значительное увеличение производительности в играх и других приложениях, использующих ИИ.

Однако NVIDIA не ограничилась аппаратными решениями. Компания представила анонсы и обновления ПО и платформ, основанных на ИИ: Cosmos, RTX Neural Shaders, DLSS 4, Reflex 2, NVIDIA ACE, Project G-Assist, Project R2X, AI Blueprints и NIM.

Подробно про всё рассказывать не будем, но ИИ используется примерно везде:
• DLSS 4 генерирует до 3 дополнительных кадров на каждый отрисованный благодаря трансформерам.
• ACE нужен для создания реалистичных цифровых персонажей с помощью генеративного ИИ (они могут воспринимать окружение, планировать и действовать как живые игроки).
• Project G-Assist — экспериментальный ИИ-помощник для ПК.
• Project R2X — управляемый зрением аватар для ПК, предоставляющий информацию, помогающий с приложениями, видеоконференциями, чтением и обобщением документов.
• AI Blueprints — шаблоны для создания, тестирования и запуска ИИ-агентов.
• NIM — микросервисы для создания ИИ-агентов для поддержки клиентов, обнаружения мошенничества и оптимизации цепочек поставок.

Особого внимания заслуживает платформа NVIDIA Cosmos, предназначенная для разработки моделей мира, которые помогут в создании роботов и автономных транспортных средств (AV) следующего поколения. Cosmos — модель для генерации физически аккуратного видео, обученная на 9000 триллионах токенов из 20 миллионов часов реального взаимодействия. Она предоставляет разработчикам возможность генерировать огромные объемы синтетических данных, необходимых для обучения физического ИИ, и находится в открытом доступе.

Другой важный анонс — Project DIGITS, настольный компьютер с ИИ, основанный на суперчипе NVIDIA GB10 Grace Blackwell. GB10 обеспечивает производительность ИИ до 1 петафлопс с точностью FP4 и включает графический процессор Blackwell с ядрами CUDA последнего поколения и тензорными ядрами пятого поколения. Project DIGITS по цене от 3000 долларов предоставит разработчикам доступ к мощностям, ранее доступным только в крупных дата-центрах. На одном ПК можно запустить модели вплоть до 200 млрд параметров, если соединить два — даже 405B модель.

Технология RTX Neural Shaders, позволяющая обучать и использовать небольшие нейронные сети внутри шейдеров, обещает революцию в графике. Сжатие текстур до 7 раз, ускорение обработки материалов до 5 раз и улучшенное непрямое освещение — лишь некоторые из возможностей этой технологии.

Анонсы NVIDIA на CES 2025 показывают стратегию укрепления их доминирования в сфере ИИ, где компания уже контролирует значительную долю рынка и получает от ИИ-ускорителей на порядок больше прибыли (в 10 раз), чем от игровых видеокарт. NVIDIA предлагает не только мощнейшее железо, но и развитую программную экосистему для различных ИИ-задач, от создания цифровых персонажей до тренировки роботов. Сейчас компания осознанно демократизирует доступ к передовым ИИ-технологиям, чтобы расширить рынок и укрепить свои позиции.
👍2