Аишка
929 subscribers
691 photos
66 videos
2 files
440 links
Side-канал @contentreview с новостями из области искусственного интеллекта (AI)

Наши каналы:
Основной (телеком и IT) – @contentreview
Песочница (БигТех) – @BigTechSandbox
Электричка – @econtentreview
Download Telegram
Пока OpenAI, Google и другие компании соревнуются в размерах моделей и количестве параметров, Apple решили пойти против течения. Компания создала модульную систему для моделей ИИ – с иным подходом и целями.

Модель для айфонов и макбуков
Обычная нейросеть работает как «конвейер» – каждый слой что-то добавляет к результату и передаёт дальше. В Apple разбили этот конвейер на две части. Первая часть делает основную обработку текста – понимает смысл, анализирует контекст, готовит черновик ответа. Вторая часть отшлифовывает результат и готовит финальный текст. И вот из неё как раз убрали лишние элементы, которые требовали много памяти, и донастроили, чтобы не терять качество. Теперь нейросеть экономнее и быстрее работает на телефоне.

Модель для облака

Для облачной версии языковой модели Apple создали систему «экспертов» – несколько специализированных блоков, которые активируются по требованию. Условно, если спросить про готовку – включится кулинарный модуль, про математику – математический. В компании внесли несколько улучшений и сделали Parallel-Track Mixture-of-Experts. Как видно из названия, модель генерирует текст не последовательно, а параллельно, синхронизируясь в отдельных точках. Это позволяет сильно ускорить процесс.

Другие языки и отбор данных
Apple также отчитались об увеличении объёма неанглийского контента в четыре раза – с 8% до 30%. Видимо, компания готовится к дальнейшему расширению списка регионов, где работает Apple Intelligence. В компании подтвердили, что купили для тренировки моделей лицензии у издателей и отбирали данные, а не просто обучались на «всём интернете». За счёт тщательного отбора данных и оптимизации можно заставить работать качественно даже модель с малым количеством параметров.

Почему это важно?
Конечно, малые модели Apple не сравнятся с флагманскими от OpenAI или Google, но зато и стоить компании в будущем почти ничего не будут – редактуру текста и работу с медиа перенесут с облаков на устройства пользователей. История чем-то напоминает противостояние iPhone и Android: пока последние гнались за характеристиками – ядрами, памятью, мегапикселями – Apple делала устройства с меньшими цифрами, но лучшей оптимизацией. Сейчас они надеются повторить тот же подход – делать маленькие нишевые модели, вызываемые «по требованию», а не большие и универсальные.
🔥41
После вдумчивого осмысления ChatGPT поделился «Азбукой российского искусственного интеллекта». Теперь мы все вместе можем разобраться в теме. Не благодарите.
😁13👏1
Появилась интересная новость из мира нейропоиска – Perplexity ведёт переговоры с производителями смартфонов о предустановке браузера Comet AI. На словах он «призван бросить вызов мобильному доминированию Chrome». На практике же до этого пока далеко.

Мобильной версии браузера ещё нет. Да и громко анонсированная десктопная по-прежнему доступна только узкому кругу подписчиков, которые платят компании 200 долларов в месяц и параллельно выступают бета-тестерами. Большинство существующих обзоров Comet ограничивается описанием функциональности, а не повседневного опыта использования. Странный пока получается продукт Шрёдингера – вроде есть, а вроде и нет. В отличие от Яндекс Браузера, кстати, но об этом мы уже писали.

Конкретные соглашения о предустановке или использовании Perplexity в качестве основного поисковика не заключены. В нынешней ситуации переговоры с Apple или Samsung выглядят скорее медийным ходом: для Perplexity, недавно получившей оценку в 18 миллиардов долларов – будучи убыточной, как почти все ИИ-стартапы – публичная активность важна сама по себе. Но пока вместо серьёзной конкуренции с Chrome наблюдается скорее удачная симуляция бурной деятельности.

А самое смешное, что Comet «использует поисковый движок Perplexity» – правда, не уточняется, что он пока сильно зависит от выдачи Google. Да, официально Perplexity это не признает и старается снизить зависимость от их поиска: они уже создают собственный индекс при помощи краулера PerplexityBot и приобрели лицензию на Brave Search API. Но это всё равно капля в море – невозможно за несколько лет построить такой же поиск, какой Google строил с 1998 года.

Что мы имеем в итоге? Нейропоиск, который зависит от поиска Google. Браузер, который построен на основе Chromium от Google. Отсутствующий пока мобильный браузер, который будет существовать в рамках системы Android от Google. Моська, знать, сильна – лает на слона и «бросает вызов» его доминированию.
Amazon купил Bee – браслет с ИИ, который слушает и записывает всё

Гонка за новым форм-фактором ИИ-устройств продолжается. Amazon очень хочет побольше данных для рекламы товаров – для чего объявил о приобретении стартапа Bee с браслетом за 50 долларов (и подпиской ещё за 20 в месяц), который записывает разговоры в течение дня и формирует ежедневные отчёты по ним.

В данном случае беспокоит даже не приватность. Мы давно живём с умными колонками и телевизорами, которые нас слушают, так что приватность для пользователей не главный вопрос. Гораздо важнее, как хорошо будет работать устройство – и вот тут у подобного форм-фактора есть множество проблем:

• Bee, например, уже сейчас путает живые диалоги с фразами из фильмов и интернет-роликов
• Так же плохо (то есть почти никак) он различает людей во время групповых бесед или диалогов
• А самое главное – записанное аудио удаляется сразу после транскрибирования и не хранится, поэтому проверить записи ИИ нельзя
Для нормального функционирования браслета придётся решить как минимум эти проблемы.

У подобных ИИ-гаджетов вообще много ограничений. Им нужен стабильный интернет – и даже с ним будут задержки и зависания. Сам ИИ периодически «галлюцинирует», что критично, если устройство используется для заметок и планирования. А то, что человек говорил несколько дней назад, нейросеть уже не вспомнит и не будет учитывать.

Тогда зачем покупать стартап? Для Amazon эта сделка похожа скорее на попытку ответить OpenAI (с их устройством IO) и Google с Meta (признаны экстремистской организацией), которые делают акцент на умные очки. Amazon уже безуспешно пытался закрепиться в носимых устройствах, вспомним хотя бы закрытый в 2023 году проект фитнес-браслета Halo и малоизвестные очки Echo Frames. Правда, возможно, сначала стоило бы сделать нормального ИИ-ассистента, а уже потом думать об экспериментах с форм-фактором.
2
Вечно можно смотреть на то, как бот встречает капчу, кликает галочку «Я не робот» – и успешно проходит проверку на бота.

Перевод:
• Я наткнулся на капчу в Яндексе. Дай-ка попробую пройти её, кликнув чекбокс «Я не робот».
• Вижу, что чекбокс установлен. Немного подожду, пока капча будет обработана, и потом попробую продолжить.
• Отлично! Капча решена и я теперь на странице поиска Яндекса.
😁10🔥41
Google (Alphabet) отчиталась за квартал: выручка выросла на 14%, а прибыль – на 20%

Правда, роль ИИ в этом не самая большая (хотя компания уверяет в обратном).

• Выручка выросла благодаря тому, что YouTube заработал на рекламе в коротких видео и просмотрах через smart-TV; подписки Google One и YouTube Premium набрали популярность; бизнес активно пришёл в Google Cloud за мощностями для своих собственных ИИ-проектов; и AI-Overviews в поиске подтолкнули людей чаще гуглить.

• Хорошие новости закончились, когда дошли до расходов. Компания потратит на ИИ-инфраструктуру 85 миллиардов долларов в этом году вместо запланированных 75.

• Причём эти деньги идут на технологию, которая может потенциально подорвать главный бизнес компании – поисковую рекламу.

• Хотя пока опасения не подтверждаются – ИИ-функции наоборот помогают: генерируют на 10% больше запросов и не вредят рекламным доходам.

• Глава Google Сундар Пичаи уверяет, что инвестиции окупаются, но никаких конкретных цифр и направлений не называет – и даже не говорит, «окупаются» они в финансовом смысле или каком-то ином.

Правда, выбора тратить/не тратить у компании нет – нужно как минимум поддерживать паритет по инвестициям с конкурентами (а это как раз 70-80 миллиардов). Получается замкнутый круг: пока нельзя доказать эффективность трат, но и остановиться страшно.
1
Apple оказалась на обочине ИИ-гонки?

Летом 2024 года Тим Кук анонсировал «революционный» искусственный интеллект для iPhone – Apple Intelligence. Siri должна была наконец повзрослеть: научиться понимать сложные команды, работать автономно и взаимодействовать с устройством. Люди поверили, купили iPhone 16 – но уже через год стало ясно, что революции не случилось. Обновление Siri сначала перенесли на лето 2025-го, а теперь на 2026 год.

Проблема не только в задержках – Apple теряет людей. Главу команды фундаментальных моделей переманила Meta*, предложив огромный пакет акций (по слухам, многомилионный). За ним ушёл и другой ключевой исследователь. Команда MLX – разработчиков машинного обучения под Apple Silicon – едва не уволилась целиком, и удержать их удалось только контрпредложениями. На этом фоне акции Apple в 2025 году упали на 16%, тогда как Microsoft выросла на 19%, Meta* – на 25%. Отдельные аналитики уже открыто говорят, что Тим Кук – не тот, кто нужен в эпоху ИИ, называя его «логистом», а не визионером.

Про «нетакусечный» подход Apple мы уже писали – компания делает ставку на ИИ, работающий прямо на устройствах, а не в облаке. Это логично с точки зрения приватности и скорости, но накладывает множество технических ограничений. У моделей хуже качество, маленькое контекстное окно, меньше поддерживаемых языков и так далее.

Почему тогда мы не верим в окончательный «провал» компании? У Apple есть все возможности наверстать отставание: десятки миллиардов долларов на счету, больше двух миллиардов активных устройств, собственные чипы с мощными нейросетевыми ускорителями.

Если Siri 2.0 выйдет в срок и будет соответствовать обещаниям, а параллельно с этим список регионов, где работает Apple Intelligence, расширится (в особенности на Китай) – у них есть все шансы. Благо, два миллиарда лояльных пользователей простят все задержки и будут с готовностью пользоваться сервисами компании.

* компания Meta и её продукты признаны экстремистскими в России
2
Spotify начал публиковать новые песни от имени давно умерших артистов

Не успели мы отойти от полностью сгенерированной ИИ музыкальной группы, как начался следующий виток развития этой истории. На официальной странице кантри-певца Блейза Фоули, застреленного в 1989 году, внезапно появилась новая песня “Together”.

Трек сопровождала ИИ-картинка молодого парня в кожаной куртке, который даже не похож на реального музыканта. Крейг Макдональд – владелец лейбла, занимающегося распространением музыкального наследия Фоли – заявил, что это не стиль Блейза и что трек фейковый.

Песню загрузили через TikTok-сервис SoundOn без разрешения правообладателей. Это дело рук загадочной компании Syntax Error (по крайне мере, такое название было в копирайт-строке под треками). Аналогичные фейки появились на страницах других покойных музыкантов – Гая Кларка и Дэна Берка. Модерация Spotify их все пропустила.

Схема работает на скорость: пока правообладатели не заметили подделку и не подали жалобу, мошенники зарабатывают на прослушиваниях. А сам Spotify не удаляет такой контент превентивно или автоматически.

На этом фоне сервис Deezer обнаружил, что каждый пятый загружаемый трек (а это свыше 20 тысяч песен ежедневно) создан ИИ, а количество живых музыкантов постепенно снижается.
1
Будущее авторского права в эпоху генеративного ИИ интересует нас давно – и, кажется, не только нас. Спрос на книги об авторском праве вырос на 65% за последние полгода (по крайней мере, среди аудитории Строк).

Тревогу людей понять можно. Сегодня против ведущих ИИ-компаний ведутся десятки судебных процессов из-за нарушений авторских прав. Одни из самых громких исков поданы к OpenAI, Stability AI, Midjourney и Anthropic, причём в этих делах фигурируют не только индивидуальные истцы, но и крупные корпорации вроде Getty Images, Disney, Universal, The New York Times. Пока не понятно, какое решение примут в итоге и не придётся ли потом удалять весь сгенерированный в ИИ-сервисах контент.

Раньше схема работала просто: есть произведение, есть автор, использовать произведение без его разрешения нельзя. Но сегодня образовался правовой вакуум. Кто автор текста, созданного ChatGPT? Программисты OpenAI? Миллионы авторов, чьи тексты скормили модели? Пользователь, сформулировавший запрос?

Авторы ищут способ защититься от неопределённости в ситуации, когда авторские права размываются из-за ИИ. А в это время количество сгенерированного контента множится и заполняет медиа, форумы, видеоплатформы, музыкальные стриминги.

Есть подозрение, что в какой-то момент все поймут бесполезность борьбы с ИИ и примут самое простое решение – нарушить авторские права может не нейросеть или разработчик, а конкретный автор, который опубликовал конкретное сгенерированное произведение от своего имени. А пока, конечно, лучше пойти перечитать законодательство.
1
Андрей Рыбинцев стал управляющим директором по искусственному интеллекту и вошел в правление Авито.

Назначать топов именно на ИИ-направление – не самая частая история в России (да и за рубежом тоже). Обычно ИИ входит в зону ответственности технического или продуктового директора. Но в Авито не раз говорили, что делают ставку на искусственный интеллект и планируют встроить в логику компании на системном уровне.

Рыбинцев запускал модерацию контента на платформе, антифрод-системы и генеративные модели A-Vibe и A-Vision. Теперь в роли управляющего директора по ИИ будет отвечать за разработку и внедрение продуктов на базе GenAI и агентов (собственно, продолжая текущие проекты на базе A-Vibe и A-Vision).

Для этого он объединяет под своим началом 900 человек из трех департаментов:
• Data Science
• Поиска и рекомендаций
• Аналитики данных
К ним добавится новый кластер AI Experience для развития ИИ-ассистентов для пользователей.

Зачем это нужно компании – понятно. Буквально недавно Авито хвастались, что получили от первых запусков с применением GenAI 670 миллионов рублей, а в ближайшие 3 года планируют заработать на этом направлении не менее 21 миллиарда дополнительной выручки.
👍21
#нейродайджест Аишки за неделю

Stargate схлопнулся? 500 миллиардов превратились в один недостроенный дата-центр в Огайо

Персональные цены наступают: Delta к 2025 году переведет 20% тарифов на ИИ-алгоритмы

Perplexity симулирует – браузер Comet как бы есть, но как бы пока и нет

Авито ставит на искусственный интеллект

Amazon купил прослушку: браслет за 50 баксов будет записывать все разговоры владельца

Авторское право рассыпается из-за ИИ

Google тратит на искусственный интеллект 85 миллиардов долларов. Никто не знает, окупаются ли вложения

ИИ-детекторы пока не работают как надо

Apple не вывозит? Siri 2.0 перенесли на 2026 год, ключевые разработчики ушли, акции упали

Spotify публикует новые треки… умерших музыкантов. Виной всему генеративная музыка
4
Media is too big
VIEW IN TELEGRAM
Китайский гигант Tencent запустил HunyuanWorld 1.0 – генератор «трёхмерных миров» из текста и изображений. Сгенерированные видеоигры уже здесь? Такое впечатление пытались создать авторы, но нет. Мы ждали чего-то вроде Genie от Google или Muse от Microsoft – нейросетей, обученных на видеозаписях геймплея, которые генерируют игровой процесс в реальном времени. Но результат оказался сильно приземлённее.

Как работает генератор? В основе модель, которая генерирует 360-градусную панораму. Такое мы уже неоднократно видели и раньше. Дальше система разделяет сцену на слои: небо, фон, отдельные объекты. Каждый элемент получает собственную карту глубины или превращается в 3D-модель. Скалы становятся скалами, деревья – деревьями, а не просто пикселями на сфере. Результат можно экспортировать в Unity или Unreal Engine.

Главная «фишка» – режим Voyager, который якобы превращает статичную сцену в реальный мир. Видеомодель генерирует новые панорамы той же сцены по мере движения камеры. В теории это позволит создать расширяемую вселенную, но как работает процесс и работает ли – не понятно. Да и другие проблемы остаются – качество генерации напоминает съёмку с дешёвой 360-камеры, из-за низкого разрешения картинка мыльная, есть видимые швы и искажения

Радует, что это инструмент с открытым исходным кодом. Технологию можно использовать в узких нишах, вроде VR-игр или игр в духе классических Resident Evil с фиксированной камерой. Ещё для рисования быстрых концептов окружений. Но магии не случилось.
4
Ошибка 404
Isometric solid model of Klyuchevskaya Sopka (можно указать свою гору)
Коллеги поделились промптом для генерации красивых изометрических картинок гор.

Но, в принципе, не обязательно указывать именно горы, любой объект подойдёт. Вот, например, русский таёжный дата-центр.

P.S. Комментарий подписчика:
Хеликоптер запарковали на газоне, хотя парковка есть - точно русский
5😁4🔥2
Когда попытался воспользоваться новым «режимом Copilot» в браузере Edge. Не очень-то и хотелось 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4
Forwarded from TechnoME: Multimediamind
Алиса — главная ставка Яндекса на ИИ в сегменте B2C

• Алиса в Поиске уже сейчас отвечает на четверть всех запросов пользователей

• В июне аудитория нейросети Алисы в Поиске, чате и приложении превысила 43 млн человек

• За второй квартал пользователи взаимодействовали с генеративными нейросетями в сервисах Яндекса 7,6 млрд раз — почти на миллиард больше, чем в первом квартале

• В июле компания открыла бесплатный доступ к своим самым мощным генеративным моделям в чате с Алисой, чтобы как можно больше людей могли познакомиться с их возможностями

• Алиса — главная ставка Яндекса на будущее ИИ в B2C-сегменте

• Осенью готовится её следующее большое обновление.

Операционные результаты за второй квартал на карточках компания опубликовала тут, а пресс-релиз тут.
🔥74
Аишка
Когда попытался воспользоваться новым «режимом Copilot» в браузере Edge. Не очень-то и хотелось 🤷‍♂️
Бурные восторги по отношению к любому новому ИИ-браузеру Edge Copilot удивляют. Глобально ничего нового не добавили.

• обновили стартовую страницу, где теперь окно чата Copilot

• добавили ИИ возможность учитывать (очень поверхностно) информацию с открытых вкладок. В отличие от Dia, где это сделано более гибко и можно самим выбирать конкретные вкладки, здесь такой опции нет. Уже видится, как при наличии 25+ вкладок помощнику будет не хватать контекстного окна и он перестанет их переваривать.

• добавили режим Actions, который активируется на сайте Copilot при использовании браузера Edge. Он призван добавить сервису возможности агента, который сам ходит на сайты, заполняет формы и отвечает на запросы пользователя. В день доступно всего 3 бесплатных использования, в отличие от того же Comet, и за 3 раза запустить его так и не удалось 🤷‍♂️ Будем пробовать ещё

Имеем в итоге довольно вторичный ИИ-сервис внутри посредственного браузера.
Please open Telegram to view this post
VIEW IN TELEGRAM
4😁3👍1🔥1
Зачем миру новая организация по регулированию ИИ

На саммите World Artificial Intelligence Conference 2025 в Шанхае Китай предложил учредить международную организацию по развитию и регулированию ИИ – на этот раз со штаб-квартирой в Шанхае и фокусом на страны Глобального Юга.

История повторяется с завидным постоянством. Около десятка крупных международных форматов уже пытаются навести порядок в мире искусственного интеллекта, идёт перетягивание каната: американцы строят сеть институтов без участия Китая и активно прогоняют его из песочницы, европейцы внедряют обязательные стандарты для всех, кто хочет работать в ЕС. Подоспел Китай – и можно порадоваться, теперь у каждого технологического блока есть собственная «штаб-квартира по ИИ».

Действительно международного формата здесь не получится – Amazon уже тихо закрыл ИИ-лабораторию в Шанхае, IBM и Microsoft постепенно сворачивают исследования в Китае. Причём виноват в этом даже не Китай, а экспортный контроль со стороны США и усложнение логистики.

Страдает от ограничений в итоге бизнес и разработчики. Европейский AI Act требует детального аудита алгоритмов, американские институты безопасности вводят собственные протоколы тестирования, а теперь добавится китайская система сертификации (хотя в Китае и так уже был сонм жёстких норм и правил). Ну что ж, придётся нанимать больше юристов.

Кажется, что плодящиеся международные организации по регулированию ИИ приводят не к координации, а к хаосу. К Китаю, правда, вопросов нет – для них это скорее вынужденный шаг, на фоне ограничений в США и ЕС.
Этот новый режим учёбы точно доведёт ChatGPT. Уже через несколько сообщений видно, что он срывается
😁6
This media is not supported in your browser
VIEW IN TELEGRAM
NotebookLM научился делать видеопрезентации

Система смотрит загруженные документы, забирает из них диаграммы, цифры и цитаты, а потом превращает это в презентацию с закадровым голосом.

По сути, мы сейчас наблюдаем развитие сгенерированных подкастов, в которые люди и так совали набор стоковых кадров и скриншотов перед публикацией на Ютуб. Только сейчас это автоматизируют.

Ещё одна новость – теперь пользователи могут генерировать сколько угодно контента разных форматов – ментальные карты, отчёты, подкасты – из одного набора документов, выбирая нужные источники.

Google превращает платформу для работы с данными в студию для создания образовательного (и не очень) контента. Из одного исходника теперь можно получить сразу тексты, аудио, видео, схемы и таблицы.

Если вспомнить недавние обещания Гугла ограничить монетизацию сгенерированного ИИ спама на Ютубе – возникает вопрос: а они осознают, что такого станет в разы больше?

Несмотря на это, обновление выглядит классно. Там ещё и интерфейс освежили. Обещают в течение нескольких недель раскатить новые функции на всех пользователей.
👍51
Конкурент Nvidia по ИИ-чипам удваивает оценку за год

Groq, о котором мы уже писали подробнее (не путать с Grok), ведёт переговоры о привлечении 600 миллионов долларов при оценке почти в 6 миллиардов. Всего год назад компания стоила 2,8 – рост вдвое впечатляет даже на фоне ИИ-бума.

Это стартап, который делает собственные чипы для запуска нейросетей. Его основал Джонатан Росс, бывший разработчик нейросетевых чипов Google.

Чем Groq так хорош? Тем, что делает ставку на собственную архитектуру – LPU (Language Processing Unit). Их чипы заточены под языковые задачи и работают в 10 раз быстрее видеокарт Nvidia при меньшем энергопотреблении.

Результат много кому нравится, например Saudi Aramco (вложили 1,5 миллиарда в создание ИИ-центра на Ближнем Востоке на базе их чипов), Bell Canada, экстремистам из Meta и многим другим компаниям. Почему всем так нужны свои чипы и что происходит с рынком мы уже как-то писали подробно.

Раунд возглавляет техасская Disruptive. Предыдущий вела BlackRock, а за всю историю Groq привлёк уже больше 2 миллиардов долларов.

Правда, доминированию Nvidia ничего не угрожает – несмотря на то, что запускать определённые нейросети на чипах Groq прикольно и быстро, они всё ещё не универсальные и не могут использоваться для обучения моделей. У Nvidia по-прежнему 80% рынка ИИ-ускорителей, от которого Groq и десятки других стартапов пытаются отщипнуть кусок. Но пока их главный актив – не прибыль, а надежды инвесторов.