Аишка
У Шедеврума большое обновление: новая версия модели и подписка Яндекс утверждает, что новая версия модели YandexART 2.5 стала лучше следовать запросам пользователей. Она точнее воспроизводит заданное количество объектов и их параметры: форму, цвет, размер…
Сравнение генераций YandexART 2.5 Pro и Imagen 3 от Google, которая сейчас считается одной из лучших на рынке.
Условия генерации такие: одинаковый запрос (для YandexART на русском, для Imagen на английском), одинаковое соотношение сторон, 1 попытка
Условия генерации такие: одинаковый запрос (для YandexART на русском, для Imagen на английском), одинаковое соотношение сторон, 1 попытка
🔥8
Интригующая новость – появление якобы официального чат-бота для сервиса Grok в Телеграме
Интересно, что именно за этим кроется. Компания вполне может ограничиться простым созданием бота, и тогда ничего особенного не произойдёт. Ведь на платформе уже полно ботов, работающих по API с разными нейросетями (есть даже официальные, вроде Гигачата).
А существует возможность, что Телеграм планирует более тесную интеграцию с XAI и Grok’ом. Тогда мы можем увидеть появление ИИ-функций в рамках мессенджера, которых тут уже временами не хватает. Например, интеллектуальный поиск по чатам и их сортировка, суммаризация сообщений, приоритизация уведомлений и так далее. Тем более что это ещё одна фишка, которую компания может ввести для привлечения подписчиков Премиума.
Пока подробностей немного: у нас есть только намёк Павла Дурова, что команда Телеграма работает над интеграцией нейросети, странное имя бота, которое не заканчивается обязательным словом «_bot», и пользовательские эмодзи, которые тот умеет использовать при общении.
Самое странное, что модель в основе чат-бота явно устаревшая и ограниченная. Потому что она не знает последних событий (в отличие от Grok 3), не умеет работать с файлами и генерировать изображения. Да и ответы, субъективно, менее живые и «безбашенные», а ведь именно этим Grok изначально и полюбился многим пользователям. И ещё страннее ситуация становится потому, что для доступа к боту нужен Премиум, хотя все функции работают бесплатно с последней версией ИИ на официальном сайте. Так что сейчас причин пользоваться им как будто бы и нет – ну если не считать того, что официальный сайт не работает в России, тогда как бот доступен.
Интересно, что именно за этим кроется. Компания вполне может ограничиться простым созданием бота, и тогда ничего особенного не произойдёт. Ведь на платформе уже полно ботов, работающих по API с разными нейросетями (есть даже официальные, вроде Гигачата).
А существует возможность, что Телеграм планирует более тесную интеграцию с XAI и Grok’ом. Тогда мы можем увидеть появление ИИ-функций в рамках мессенджера, которых тут уже временами не хватает. Например, интеллектуальный поиск по чатам и их сортировка, суммаризация сообщений, приоритизация уведомлений и так далее. Тем более что это ещё одна фишка, которую компания может ввести для привлечения подписчиков Премиума.
Пока подробностей немного: у нас есть только намёк Павла Дурова, что команда Телеграма работает над интеграцией нейросети, странное имя бота, которое не заканчивается обязательным словом «_bot», и пользовательские эмодзи, которые тот умеет использовать при общении.
Самое странное, что модель в основе чат-бота явно устаревшая и ограниченная. Потому что она не знает последних событий (в отличие от Grok 3), не умеет работать с файлами и генерировать изображения. Да и ответы, субъективно, менее живые и «безбашенные», а ведь именно этим Grok изначально и полюбился многим пользователям. И ещё страннее ситуация становится потому, что для доступа к боту нужен Премиум, хотя все функции работают бесплатно с последней версией ИИ на официальном сайте. Так что сейчас причин пользоваться им как будто бы и нет – ну если не считать того, что официальный сайт не работает в России, тогда как бот доступен.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересный способ применения нового портала OpenAI, где можно протестировать их голосовой ИИ – озвучка
Его вполне можно использовать как (пока ещё) бесплатный инструмент для собственных нужд. Озвучить можно практически любой текст: неплохо получаются доклады, статьи, подкасты, книги и даже, что удивило, стихотворения.
Пока выходит не сильно естественно, тем более что основной язык для ИИ, конечно, не русский. Но через пару поколений мысль обратиться к диктору у кого-то вряд ли возникнет. Петь и смеяться ИИ, к сожалению, пока не умеет. Но ему и не надо – компания делает инструмент, а не напарника для общения, за напарником нужно идти к Sesame.
Раз всё это теперь доступно по API разработчикам, то стоит ждать ещё больше синтетических озвучек и специализированных приложений для работы с голосовыми ассистентами в ближайшее время.
Его вполне можно использовать как (пока ещё) бесплатный инструмент для собственных нужд. Озвучить можно практически любой текст: неплохо получаются доклады, статьи, подкасты, книги и даже, что удивило, стихотворения.
Пока выходит не сильно естественно, тем более что основной язык для ИИ, конечно, не русский. Но через пару поколений мысль обратиться к диктору у кого-то вряд ли возникнет. Петь и смеяться ИИ, к сожалению, пока не умеет. Но ему и не надо – компания делает инструмент, а не напарника для общения, за напарником нужно идти к Sesame.
Раз всё это теперь доступно по API разработчикам, то стоит ждать ещё больше синтетических озвучек и специализированных приложений для работы с голосовыми ассистентами в ближайшее время.
👍2🔥1
#нейродайджест CRAI за неделю
• Nvidia: ИИ-фабрики, роботы, «агентный интеллект» и многое другое
Nvidia анонсировала новую архитектуру видеокарт Blackwell и «агентный ИИ», который умеет рассуждать и планировать. Это может привести к революции в робототехнике и автономных системах.
• У Шедеврума большое обновление: новая версия модели и подписка
Яндекс выпустил обновленную модель YandexART 2.5 с улучшенным качеством генерации изображений и подпиской Pro. Что в неё входит и стал ли сервис лучше?
• Google совершает рекордную сделку, чтобы укрепиться на рынке кибербеза
Google приобрела стартап Wiz за 32 миллиарда долларов, стремясь догнать конкурентов на рынке облачных технологий. Почему это важно?
• Нейросети играют с нами в испорченный телефон
Исследование показало, что нейросети часто ошибаются при проверке фактов и врут до последнего. Подписки не помогают.
• OpenAI открывает двери в мир голосового ИИ
Новый портал OpenAI позволяет тестировать голосовой ИИ и использовать его для озвучки.
• Perplexity сняли рекламу в духе «Игры в кальмара»
Сервис сделал укол в сторону Google и позвал в рекламу актера Ли Джонджэ.
• «Фишт»: российский мини-компьютер для нейросетей
Ростех запустил производство «Фишт», мини-компьютера для прикладных нейросетей. Его будут использовать в Интернете вещей и роботах.
• Grok в Telegram: тайный проект Дурова или просто бот?
Появление «официального» чат-бота Grok в Telegram вызывает много вопросов. Возможна ли глубокая интеграция ИИ в мессенджер?
• Ernie от Baidu: китайский прорыв или локальный феномен?
Baidu представила новые модели Ernie, которые сравнивают с GPT-4.5. Но доступ к ним ограничен, что делает их не слишком полезными для мировой аудитории.
• YandexART 2.5 Pro против Imagen 3: сравнение результатов генерации
Сравнение генераций двух мощных ИИ-моделей.
• Nvidia: ИИ-фабрики, роботы, «агентный интеллект» и многое другое
Nvidia анонсировала новую архитектуру видеокарт Blackwell и «агентный ИИ», который умеет рассуждать и планировать. Это может привести к революции в робототехнике и автономных системах.
• У Шедеврума большое обновление: новая версия модели и подписка
Яндекс выпустил обновленную модель YandexART 2.5 с улучшенным качеством генерации изображений и подпиской Pro. Что в неё входит и стал ли сервис лучше?
• Google совершает рекордную сделку, чтобы укрепиться на рынке кибербеза
Google приобрела стартап Wiz за 32 миллиарда долларов, стремясь догнать конкурентов на рынке облачных технологий. Почему это важно?
• Нейросети играют с нами в испорченный телефон
Исследование показало, что нейросети часто ошибаются при проверке фактов и врут до последнего. Подписки не помогают.
• OpenAI открывает двери в мир голосового ИИ
Новый портал OpenAI позволяет тестировать голосовой ИИ и использовать его для озвучки.
• Perplexity сняли рекламу в духе «Игры в кальмара»
Сервис сделал укол в сторону Google и позвал в рекламу актера Ли Джонджэ.
• «Фишт»: российский мини-компьютер для нейросетей
Ростех запустил производство «Фишт», мини-компьютера для прикладных нейросетей. Его будут использовать в Интернете вещей и роботах.
• Grok в Telegram: тайный проект Дурова или просто бот?
Появление «официального» чат-бота Grok в Telegram вызывает много вопросов. Возможна ли глубокая интеграция ИИ в мессенджер?
• Ernie от Baidu: китайский прорыв или локальный феномен?
Baidu представила новые модели Ernie, которые сравнивают с GPT-4.5. Но доступ к ним ограничен, что делает их не слишком полезными для мировой аудитории.
• YandexART 2.5 Pro против Imagen 3: сравнение результатов генерации
Сравнение генераций двух мощных ИИ-моделей.
Иллюзия близости: чат-боты делают нас одинокими?
Новое исследование OpenAI и MIT обнаружило усиление чувства одиночества у тех людей, которые чаще общаются с ИИ. Оно длилось месяц и включало более 1000 участников, которые получали задания на общение с чат-ботами. Кто-то получал строго профессиональные задания, кто-то – связанные с обсуждением деталей личной жизни и эмоций.
Оказалось, что люди, проводящие больше времени в беседах с ChatGPT, демонстрируют повышенный уровень одиночества и эмоциональной зависимости от чат-бота. Они начинают меньше общаться с другими живыми людьми.
Почему так? Сказывается темп современной жизни. Люди заняты своими делами, уровень одиночества растёт, и общение с ИИ, который умеет имитировать человеческие качества (внимание, эмпатию, постоянную доступность, надёжность) – становится заманчивым для доверчивых и эмпатичных людей. Особенно это актуально для детей и подростков, у которых только формируются паттерны и привычки социального взаимодействия.
У исследования был неочевидный вывод: из 3 вариантов ИИ – текстового, нейтрального голосового и эмоционального голосового – самым опасным оказался текстовый, потому что он ближе всего подобрался к «реальному» человеческому общению. Сказывается эффект зловещей долины, который пока полностью не смог преодолеть ни один голосовой ИИ (хотя проекты вроде Sesame стремительно приближают этот момент).
Самый опасный вывод исследования – люди, которые получали именно «профессиональные» задания, не общались с ИИ на личные темы и сохраняли эмоциональную дистанцию, в итоге попали в ещё более сильную зависимость от него. Это подверждает и выводы другого исследования, где изучался феномен «чрезмерной опоры» (overreliance) на ИИ.
Постоянное обращение к «профессиональному» помощнику при отсутствии поддержки и поощрения может приводить к нездоровой привязанности у некоторых пользователей, которые начинают делегировать ИИ каждое своё решение. В итоге не понятно, что хуже – искать в ИИ «друга» или консультанта по жизненным вопросам.
Новое исследование OpenAI и MIT обнаружило усиление чувства одиночества у тех людей, которые чаще общаются с ИИ. Оно длилось месяц и включало более 1000 участников, которые получали задания на общение с чат-ботами. Кто-то получал строго профессиональные задания, кто-то – связанные с обсуждением деталей личной жизни и эмоций.
Оказалось, что люди, проводящие больше времени в беседах с ChatGPT, демонстрируют повышенный уровень одиночества и эмоциональной зависимости от чат-бота. Они начинают меньше общаться с другими живыми людьми.
Почему так? Сказывается темп современной жизни. Люди заняты своими делами, уровень одиночества растёт, и общение с ИИ, который умеет имитировать человеческие качества (внимание, эмпатию, постоянную доступность, надёжность) – становится заманчивым для доверчивых и эмпатичных людей. Особенно это актуально для детей и подростков, у которых только формируются паттерны и привычки социального взаимодействия.
У исследования был неочевидный вывод: из 3 вариантов ИИ – текстового, нейтрального голосового и эмоционального голосового – самым опасным оказался текстовый, потому что он ближе всего подобрался к «реальному» человеческому общению. Сказывается эффект зловещей долины, который пока полностью не смог преодолеть ни один голосовой ИИ (хотя проекты вроде Sesame стремительно приближают этот момент).
Самый опасный вывод исследования – люди, которые получали именно «профессиональные» задания, не общались с ИИ на личные темы и сохраняли эмоциональную дистанцию, в итоге попали в ещё более сильную зависимость от него. Это подверждает и выводы другого исследования, где изучался феномен «чрезмерной опоры» (overreliance) на ИИ.
Постоянное обращение к «профессиональному» помощнику при отсутствии поддержки и поощрения может приводить к нездоровой привязанности у некоторых пользователей, которые начинают делегировать ИИ каждое своё решение. В итоге не понятно, что хуже – искать в ИИ «друга» или консультанта по жизненным вопросам.
👍2
Интересный пример прикладного использования ИИ от Одноклассников. Их новая рекомендательная система на базе искусственного интеллекта анализирует нюансы поведения пользователей, их интересы и активность. Компания уверяет, что алгоритмы способны не просто отслеживать, но и предугадывать желания юзеров.
Ключевой элемент такой системы — «умные» push-уведомления. Они разделены на два типа: обязательные (новые сообщения, заявки в друзья) и рекомендательные. Вторые как раз нацелены на то, чтобы предложить пользователям более персонализированный контент и увеличить время, проведённое в приложении. Это то, чего не хватает иногда в Телеграме – автоматической сортировки и группировки уведомлений по темам, важности или другим фильтрам.
Интересно, борется ли как-то компания с раздражающим влиянием постоянных пуш-уведомлений, чтобы вместо фактора роста вовлечённости они не стали элементом, отпугивающим пользователей. Но вроде бы система работает, раз соцсеть впервые за пять лет смогла нарастить месячную аудиторию на 1,2 миллиона.
Ключевой элемент такой системы — «умные» push-уведомления. Они разделены на два типа: обязательные (новые сообщения, заявки в друзья) и рекомендательные. Вторые как раз нацелены на то, чтобы предложить пользователям более персонализированный контент и увеличить время, проведённое в приложении. Это то, чего не хватает иногда в Телеграме – автоматической сортировки и группировки уведомлений по темам, важности или другим фильтрам.
Интересно, борется ли как-то компания с раздражающим влиянием постоянных пуш-уведомлений, чтобы вместо фактора роста вовлечённости они не стали элементом, отпугивающим пользователей. Но вроде бы система работает, раз соцсеть впервые за пять лет смогла нарастить месячную аудиторию на 1,2 миллиона.
Forwarded from Половников
Про генерацию изображений
Для медиа генерация иллюстраций – это очень важная история. Во-первых, далеко не у всех есть деньги на иллюстраторов, фотографов и бильдредакторов (а некоторые, оказывается, даже не знают, что это такое – бильдредактор). Во-вторых, благодаря шайкам юристов таскать картинки из сети стало небезоспасно. А тут – ввел промпт, получил иллюстрацию. Да, неидеальную. Зато на ближайшие 10-20 лет чистую от авторских прав. Ибо ни один GenAI не выиграет суд о защите авторского права, ибо даже если он докажет то, что иллюстрацию сгенерировал он, то ему придется доказать, что у него были лицензии и разрешение для использования всех изображений, которые использовались для обучения.
Но это лирика. А вот реальный кейс. Написал тут заметку про то, что Nokia похоронили раньше времени. Иллюстрация возникла в голове сама собой, потому и промпт использовался следующий: «кладбище, могила со свежей землей, из могилы торчит рука, рука сжимает мобильный телефон, телефон Nokia 3310, телефон ярко желтого цвета».
Прогнал через Dalli, Grok, ChatGPT, Шедеврум и Кандинского.
Dalli и Grok в целом с задачей справились, но у Grok почему-то могила выкопанная, а телефон не очень-то похож на 3310.
ChatGPT просто отказался рисовать что-то про кладбище. Какой нежный.
Шедеврум справился с телефоном, ну, почти, а кладбище заменил грядкой, на которую кто-то его высаживает. На кладбище должен, видимо, напоминать кирпичик справа.
Кандинский справился с кладбищем, вместо кнопочной Nokia забубенил смартфон Samsung и добавил какую-то желтую фигню по центру.
Конечно, можно помучаться с промптом, прогнать через несколько нейронок, поиграть с негативным промптингом. Но зачем мучаться, если есть GenAI, который скорее справится с задачей, а есть GenAI, который скорее не справится с задачей?
Для медиа генерация иллюстраций – это очень важная история. Во-первых, далеко не у всех есть деньги на иллюстраторов, фотографов и бильдредакторов (а некоторые, оказывается, даже не знают, что это такое – бильдредактор). Во-вторых, благодаря шайкам юристов таскать картинки из сети стало небезоспасно. А тут – ввел промпт, получил иллюстрацию. Да, неидеальную. Зато на ближайшие 10-20 лет чистую от авторских прав. Ибо ни один GenAI не выиграет суд о защите авторского права, ибо даже если он докажет то, что иллюстрацию сгенерировал он, то ему придется доказать, что у него были лицензии и разрешение для использования всех изображений, которые использовались для обучения.
Но это лирика. А вот реальный кейс. Написал тут заметку про то, что Nokia похоронили раньше времени. Иллюстрация возникла в голове сама собой, потому и промпт использовался следующий: «кладбище, могила со свежей землей, из могилы торчит рука, рука сжимает мобильный телефон, телефон Nokia 3310, телефон ярко желтого цвета».
Прогнал через Dalli, Grok, ChatGPT, Шедеврум и Кандинского.
Dalli и Grok в целом с задачей справились, но у Grok почему-то могила выкопанная, а телефон не очень-то похож на 3310.
ChatGPT просто отказался рисовать что-то про кладбище. Какой нежный.
Шедеврум справился с телефоном, ну, почти, а кладбище заменил грядкой, на которую кто-то его высаживает. На кладбище должен, видимо, напоминать кирпичик справа.
Кандинский справился с кладбищем, вместо кнопочной Nokia забубенил смартфон Samsung и добавил какую-то желтую фигню по центру.
Конечно, можно помучаться с промптом, прогнать через несколько нейронок, поиграть с негативным промптингом. Но зачем мучаться, если есть GenAI, который скорее справится с задачей, а есть GenAI, который скорее не справится с задачей?
👍2
Коллеги обратили внимание на слова председателя компании Alibaba, который заявил о признаках наличия «пузыря» на рынке американского ИИ. Разделяем скептический настрой Джо Цая… Но возникают несколько вопросов.
Например, возьмём «чрезмерные инвестиции с опережением спроса» на американском рынке и «спекулятивные» вложения в дата-центры. А есть ли такой спрос на рынке Китая? Особенно учитывая, опираясь на ту же статью, «пробуксовывающий» рост его экономики в последние годы, высокую безработицу и слабую потребительскую активность?
А если его нет, то почему Alibaba, другие китайские компании и даже Банк Китая синхронно инвестируют сопоставимые с американскими компаниями деньги в развитие своего собственного ИИ? Одни только Alibaba планируют вложить минимум 52 миллиарда долларов в облачную инфраструктуру и ИИ за следующие 3 года. Является ли это вынужденным ответом на американские инвестиции, или Китай и его компании нашли способ создать спрос на рынке и научить ИИ приносить прибыль?
Зачем компания, говоря о чрезмерности инвестиций и опережении спроса, объявила о возобновлении найма сотрудников после 12 кварталов сокращений?
Оправдан ли рост на 24% гонконгского индекса Hang Seng Tech, включающий ведущие технологические компании (и Alibaba тоже)? Особенно учитывая, что значимыми катализаторами роста стали встреча Си Цзиньпина с лидерами технологического сектора и энтузиазм вокруг моделей DeepSeek. Не является ли такой рост также спекулятивным и схожим по своей природе с хайпом вокруг ИИ в США?
Пока слова председателя Alibaba, не лишённые оснований, напоминают скорее словесную интервенцию с целью повлиять на рынок – потому что сама компания старается по темпам инвестиций и разработки ИИ не отставать от американских коллег.
Например, возьмём «чрезмерные инвестиции с опережением спроса» на американском рынке и «спекулятивные» вложения в дата-центры. А есть ли такой спрос на рынке Китая? Особенно учитывая, опираясь на ту же статью, «пробуксовывающий» рост его экономики в последние годы, высокую безработицу и слабую потребительскую активность?
А если его нет, то почему Alibaba, другие китайские компании и даже Банк Китая синхронно инвестируют сопоставимые с американскими компаниями деньги в развитие своего собственного ИИ? Одни только Alibaba планируют вложить минимум 52 миллиарда долларов в облачную инфраструктуру и ИИ за следующие 3 года. Является ли это вынужденным ответом на американские инвестиции, или Китай и его компании нашли способ создать спрос на рынке и научить ИИ приносить прибыль?
Зачем компания, говоря о чрезмерности инвестиций и опережении спроса, объявила о возобновлении найма сотрудников после 12 кварталов сокращений?
Оправдан ли рост на 24% гонконгского индекса Hang Seng Tech, включающий ведущие технологические компании (и Alibaba тоже)? Особенно учитывая, что значимыми катализаторами роста стали встреча Си Цзиньпина с лидерами технологического сектора и энтузиазм вокруг моделей DeepSeek. Не является ли такой рост также спекулятивным и схожим по своей природе с хайпом вокруг ИИ в США?
Пока слова председателя Alibaba, не лишённые оснований, напоминают скорее словесную интервенцию с целью повлиять на рынок – потому что сама компания старается по темпам инвестиций и разработки ИИ не отставать от американских коллег.
👍3❤2