This media is not supported in your browser
VIEW IN TELEGRAM
Интересный способ применения нового портала OpenAI, где можно протестировать их голосовой ИИ – озвучка
Его вполне можно использовать как (пока ещё) бесплатный инструмент для собственных нужд. Озвучить можно практически любой текст: неплохо получаются доклады, статьи, подкасты, книги и даже, что удивило, стихотворения.
Пока выходит не сильно естественно, тем более что основной язык для ИИ, конечно, не русский. Но через пару поколений мысль обратиться к диктору у кого-то вряд ли возникнет. Петь и смеяться ИИ, к сожалению, пока не умеет. Но ему и не надо – компания делает инструмент, а не напарника для общения, за напарником нужно идти к Sesame.
Раз всё это теперь доступно по API разработчикам, то стоит ждать ещё больше синтетических озвучек и специализированных приложений для работы с голосовыми ассистентами в ближайшее время.
Его вполне можно использовать как (пока ещё) бесплатный инструмент для собственных нужд. Озвучить можно практически любой текст: неплохо получаются доклады, статьи, подкасты, книги и даже, что удивило, стихотворения.
Пока выходит не сильно естественно, тем более что основной язык для ИИ, конечно, не русский. Но через пару поколений мысль обратиться к диктору у кого-то вряд ли возникнет. Петь и смеяться ИИ, к сожалению, пока не умеет. Но ему и не надо – компания делает инструмент, а не напарника для общения, за напарником нужно идти к Sesame.
Раз всё это теперь доступно по API разработчикам, то стоит ждать ещё больше синтетических озвучек и специализированных приложений для работы с голосовыми ассистентами в ближайшее время.
👍2🔥1
#нейродайджест CRAI за неделю
• Nvidia: ИИ-фабрики, роботы, «агентный интеллект» и многое другое
Nvidia анонсировала новую архитектуру видеокарт Blackwell и «агентный ИИ», который умеет рассуждать и планировать. Это может привести к революции в робототехнике и автономных системах.
• У Шедеврума большое обновление: новая версия модели и подписка
Яндекс выпустил обновленную модель YandexART 2.5 с улучшенным качеством генерации изображений и подпиской Pro. Что в неё входит и стал ли сервис лучше?
• Google совершает рекордную сделку, чтобы укрепиться на рынке кибербеза
Google приобрела стартап Wiz за 32 миллиарда долларов, стремясь догнать конкурентов на рынке облачных технологий. Почему это важно?
• Нейросети играют с нами в испорченный телефон
Исследование показало, что нейросети часто ошибаются при проверке фактов и врут до последнего. Подписки не помогают.
• OpenAI открывает двери в мир голосового ИИ
Новый портал OpenAI позволяет тестировать голосовой ИИ и использовать его для озвучки.
• Perplexity сняли рекламу в духе «Игры в кальмара»
Сервис сделал укол в сторону Google и позвал в рекламу актера Ли Джонджэ.
• «Фишт»: российский мини-компьютер для нейросетей
Ростех запустил производство «Фишт», мини-компьютера для прикладных нейросетей. Его будут использовать в Интернете вещей и роботах.
• Grok в Telegram: тайный проект Дурова или просто бот?
Появление «официального» чат-бота Grok в Telegram вызывает много вопросов. Возможна ли глубокая интеграция ИИ в мессенджер?
• Ernie от Baidu: китайский прорыв или локальный феномен?
Baidu представила новые модели Ernie, которые сравнивают с GPT-4.5. Но доступ к ним ограничен, что делает их не слишком полезными для мировой аудитории.
• YandexART 2.5 Pro против Imagen 3: сравнение результатов генерации
Сравнение генераций двух мощных ИИ-моделей.
• Nvidia: ИИ-фабрики, роботы, «агентный интеллект» и многое другое
Nvidia анонсировала новую архитектуру видеокарт Blackwell и «агентный ИИ», который умеет рассуждать и планировать. Это может привести к революции в робототехнике и автономных системах.
• У Шедеврума большое обновление: новая версия модели и подписка
Яндекс выпустил обновленную модель YandexART 2.5 с улучшенным качеством генерации изображений и подпиской Pro. Что в неё входит и стал ли сервис лучше?
• Google совершает рекордную сделку, чтобы укрепиться на рынке кибербеза
Google приобрела стартап Wiz за 32 миллиарда долларов, стремясь догнать конкурентов на рынке облачных технологий. Почему это важно?
• Нейросети играют с нами в испорченный телефон
Исследование показало, что нейросети часто ошибаются при проверке фактов и врут до последнего. Подписки не помогают.
• OpenAI открывает двери в мир голосового ИИ
Новый портал OpenAI позволяет тестировать голосовой ИИ и использовать его для озвучки.
• Perplexity сняли рекламу в духе «Игры в кальмара»
Сервис сделал укол в сторону Google и позвал в рекламу актера Ли Джонджэ.
• «Фишт»: российский мини-компьютер для нейросетей
Ростех запустил производство «Фишт», мини-компьютера для прикладных нейросетей. Его будут использовать в Интернете вещей и роботах.
• Grok в Telegram: тайный проект Дурова или просто бот?
Появление «официального» чат-бота Grok в Telegram вызывает много вопросов. Возможна ли глубокая интеграция ИИ в мессенджер?
• Ernie от Baidu: китайский прорыв или локальный феномен?
Baidu представила новые модели Ernie, которые сравнивают с GPT-4.5. Но доступ к ним ограничен, что делает их не слишком полезными для мировой аудитории.
• YandexART 2.5 Pro против Imagen 3: сравнение результатов генерации
Сравнение генераций двух мощных ИИ-моделей.
Иллюзия близости: чат-боты делают нас одинокими?
Новое исследование OpenAI и MIT обнаружило усиление чувства одиночества у тех людей, которые чаще общаются с ИИ. Оно длилось месяц и включало более 1000 участников, которые получали задания на общение с чат-ботами. Кто-то получал строго профессиональные задания, кто-то – связанные с обсуждением деталей личной жизни и эмоций.
Оказалось, что люди, проводящие больше времени в беседах с ChatGPT, демонстрируют повышенный уровень одиночества и эмоциональной зависимости от чат-бота. Они начинают меньше общаться с другими живыми людьми.
Почему так? Сказывается темп современной жизни. Люди заняты своими делами, уровень одиночества растёт, и общение с ИИ, который умеет имитировать человеческие качества (внимание, эмпатию, постоянную доступность, надёжность) – становится заманчивым для доверчивых и эмпатичных людей. Особенно это актуально для детей и подростков, у которых только формируются паттерны и привычки социального взаимодействия.
У исследования был неочевидный вывод: из 3 вариантов ИИ – текстового, нейтрального голосового и эмоционального голосового – самым опасным оказался текстовый, потому что он ближе всего подобрался к «реальному» человеческому общению. Сказывается эффект зловещей долины, который пока полностью не смог преодолеть ни один голосовой ИИ (хотя проекты вроде Sesame стремительно приближают этот момент).
Самый опасный вывод исследования – люди, которые получали именно «профессиональные» задания, не общались с ИИ на личные темы и сохраняли эмоциональную дистанцию, в итоге попали в ещё более сильную зависимость от него. Это подверждает и выводы другого исследования, где изучался феномен «чрезмерной опоры» (overreliance) на ИИ.
Постоянное обращение к «профессиональному» помощнику при отсутствии поддержки и поощрения может приводить к нездоровой привязанности у некоторых пользователей, которые начинают делегировать ИИ каждое своё решение. В итоге не понятно, что хуже – искать в ИИ «друга» или консультанта по жизненным вопросам.
Новое исследование OpenAI и MIT обнаружило усиление чувства одиночества у тех людей, которые чаще общаются с ИИ. Оно длилось месяц и включало более 1000 участников, которые получали задания на общение с чат-ботами. Кто-то получал строго профессиональные задания, кто-то – связанные с обсуждением деталей личной жизни и эмоций.
Оказалось, что люди, проводящие больше времени в беседах с ChatGPT, демонстрируют повышенный уровень одиночества и эмоциональной зависимости от чат-бота. Они начинают меньше общаться с другими живыми людьми.
Почему так? Сказывается темп современной жизни. Люди заняты своими делами, уровень одиночества растёт, и общение с ИИ, который умеет имитировать человеческие качества (внимание, эмпатию, постоянную доступность, надёжность) – становится заманчивым для доверчивых и эмпатичных людей. Особенно это актуально для детей и подростков, у которых только формируются паттерны и привычки социального взаимодействия.
У исследования был неочевидный вывод: из 3 вариантов ИИ – текстового, нейтрального голосового и эмоционального голосового – самым опасным оказался текстовый, потому что он ближе всего подобрался к «реальному» человеческому общению. Сказывается эффект зловещей долины, который пока полностью не смог преодолеть ни один голосовой ИИ (хотя проекты вроде Sesame стремительно приближают этот момент).
Самый опасный вывод исследования – люди, которые получали именно «профессиональные» задания, не общались с ИИ на личные темы и сохраняли эмоциональную дистанцию, в итоге попали в ещё более сильную зависимость от него. Это подверждает и выводы другого исследования, где изучался феномен «чрезмерной опоры» (overreliance) на ИИ.
Постоянное обращение к «профессиональному» помощнику при отсутствии поддержки и поощрения может приводить к нездоровой привязанности у некоторых пользователей, которые начинают делегировать ИИ каждое своё решение. В итоге не понятно, что хуже – искать в ИИ «друга» или консультанта по жизненным вопросам.
👍2
Интересный пример прикладного использования ИИ от Одноклассников. Их новая рекомендательная система на базе искусственного интеллекта анализирует нюансы поведения пользователей, их интересы и активность. Компания уверяет, что алгоритмы способны не просто отслеживать, но и предугадывать желания юзеров.
Ключевой элемент такой системы — «умные» push-уведомления. Они разделены на два типа: обязательные (новые сообщения, заявки в друзья) и рекомендательные. Вторые как раз нацелены на то, чтобы предложить пользователям более персонализированный контент и увеличить время, проведённое в приложении. Это то, чего не хватает иногда в Телеграме – автоматической сортировки и группировки уведомлений по темам, важности или другим фильтрам.
Интересно, борется ли как-то компания с раздражающим влиянием постоянных пуш-уведомлений, чтобы вместо фактора роста вовлечённости они не стали элементом, отпугивающим пользователей. Но вроде бы система работает, раз соцсеть впервые за пять лет смогла нарастить месячную аудиторию на 1,2 миллиона.
Ключевой элемент такой системы — «умные» push-уведомления. Они разделены на два типа: обязательные (новые сообщения, заявки в друзья) и рекомендательные. Вторые как раз нацелены на то, чтобы предложить пользователям более персонализированный контент и увеличить время, проведённое в приложении. Это то, чего не хватает иногда в Телеграме – автоматической сортировки и группировки уведомлений по темам, важности или другим фильтрам.
Интересно, борется ли как-то компания с раздражающим влиянием постоянных пуш-уведомлений, чтобы вместо фактора роста вовлечённости они не стали элементом, отпугивающим пользователей. Но вроде бы система работает, раз соцсеть впервые за пять лет смогла нарастить месячную аудиторию на 1,2 миллиона.
Forwarded from Половников
Про генерацию изображений
Для медиа генерация иллюстраций – это очень важная история. Во-первых, далеко не у всех есть деньги на иллюстраторов, фотографов и бильдредакторов (а некоторые, оказывается, даже не знают, что это такое – бильдредактор). Во-вторых, благодаря шайкам юристов таскать картинки из сети стало небезоспасно. А тут – ввел промпт, получил иллюстрацию. Да, неидеальную. Зато на ближайшие 10-20 лет чистую от авторских прав. Ибо ни один GenAI не выиграет суд о защите авторского права, ибо даже если он докажет то, что иллюстрацию сгенерировал он, то ему придется доказать, что у него были лицензии и разрешение для использования всех изображений, которые использовались для обучения.
Но это лирика. А вот реальный кейс. Написал тут заметку про то, что Nokia похоронили раньше времени. Иллюстрация возникла в голове сама собой, потому и промпт использовался следующий: «кладбище, могила со свежей землей, из могилы торчит рука, рука сжимает мобильный телефон, телефон Nokia 3310, телефон ярко желтого цвета».
Прогнал через Dalli, Grok, ChatGPT, Шедеврум и Кандинского.
Dalli и Grok в целом с задачей справились, но у Grok почему-то могила выкопанная, а телефон не очень-то похож на 3310.
ChatGPT просто отказался рисовать что-то про кладбище. Какой нежный.
Шедеврум справился с телефоном, ну, почти, а кладбище заменил грядкой, на которую кто-то его высаживает. На кладбище должен, видимо, напоминать кирпичик справа.
Кандинский справился с кладбищем, вместо кнопочной Nokia забубенил смартфон Samsung и добавил какую-то желтую фигню по центру.
Конечно, можно помучаться с промптом, прогнать через несколько нейронок, поиграть с негативным промптингом. Но зачем мучаться, если есть GenAI, который скорее справится с задачей, а есть GenAI, который скорее не справится с задачей?
Для медиа генерация иллюстраций – это очень важная история. Во-первых, далеко не у всех есть деньги на иллюстраторов, фотографов и бильдредакторов (а некоторые, оказывается, даже не знают, что это такое – бильдредактор). Во-вторых, благодаря шайкам юристов таскать картинки из сети стало небезоспасно. А тут – ввел промпт, получил иллюстрацию. Да, неидеальную. Зато на ближайшие 10-20 лет чистую от авторских прав. Ибо ни один GenAI не выиграет суд о защите авторского права, ибо даже если он докажет то, что иллюстрацию сгенерировал он, то ему придется доказать, что у него были лицензии и разрешение для использования всех изображений, которые использовались для обучения.
Но это лирика. А вот реальный кейс. Написал тут заметку про то, что Nokia похоронили раньше времени. Иллюстрация возникла в голове сама собой, потому и промпт использовался следующий: «кладбище, могила со свежей землей, из могилы торчит рука, рука сжимает мобильный телефон, телефон Nokia 3310, телефон ярко желтого цвета».
Прогнал через Dalli, Grok, ChatGPT, Шедеврум и Кандинского.
Dalli и Grok в целом с задачей справились, но у Grok почему-то могила выкопанная, а телефон не очень-то похож на 3310.
ChatGPT просто отказался рисовать что-то про кладбище. Какой нежный.
Шедеврум справился с телефоном, ну, почти, а кладбище заменил грядкой, на которую кто-то его высаживает. На кладбище должен, видимо, напоминать кирпичик справа.
Кандинский справился с кладбищем, вместо кнопочной Nokia забубенил смартфон Samsung и добавил какую-то желтую фигню по центру.
Конечно, можно помучаться с промптом, прогнать через несколько нейронок, поиграть с негативным промптингом. Но зачем мучаться, если есть GenAI, который скорее справится с задачей, а есть GenAI, который скорее не справится с задачей?
👍2
Коллеги обратили внимание на слова председателя компании Alibaba, который заявил о признаках наличия «пузыря» на рынке американского ИИ. Разделяем скептический настрой Джо Цая… Но возникают несколько вопросов.
Например, возьмём «чрезмерные инвестиции с опережением спроса» на американском рынке и «спекулятивные» вложения в дата-центры. А есть ли такой спрос на рынке Китая? Особенно учитывая, опираясь на ту же статью, «пробуксовывающий» рост его экономики в последние годы, высокую безработицу и слабую потребительскую активность?
А если его нет, то почему Alibaba, другие китайские компании и даже Банк Китая синхронно инвестируют сопоставимые с американскими компаниями деньги в развитие своего собственного ИИ? Одни только Alibaba планируют вложить минимум 52 миллиарда долларов в облачную инфраструктуру и ИИ за следующие 3 года. Является ли это вынужденным ответом на американские инвестиции, или Китай и его компании нашли способ создать спрос на рынке и научить ИИ приносить прибыль?
Зачем компания, говоря о чрезмерности инвестиций и опережении спроса, объявила о возобновлении найма сотрудников после 12 кварталов сокращений?
Оправдан ли рост на 24% гонконгского индекса Hang Seng Tech, включающий ведущие технологические компании (и Alibaba тоже)? Особенно учитывая, что значимыми катализаторами роста стали встреча Си Цзиньпина с лидерами технологического сектора и энтузиазм вокруг моделей DeepSeek. Не является ли такой рост также спекулятивным и схожим по своей природе с хайпом вокруг ИИ в США?
Пока слова председателя Alibaba, не лишённые оснований, напоминают скорее словесную интервенцию с целью повлиять на рынок – потому что сама компания старается по темпам инвестиций и разработки ИИ не отставать от американских коллег.
Например, возьмём «чрезмерные инвестиции с опережением спроса» на американском рынке и «спекулятивные» вложения в дата-центры. А есть ли такой спрос на рынке Китая? Особенно учитывая, опираясь на ту же статью, «пробуксовывающий» рост его экономики в последние годы, высокую безработицу и слабую потребительскую активность?
А если его нет, то почему Alibaba, другие китайские компании и даже Банк Китая синхронно инвестируют сопоставимые с американскими компаниями деньги в развитие своего собственного ИИ? Одни только Alibaba планируют вложить минимум 52 миллиарда долларов в облачную инфраструктуру и ИИ за следующие 3 года. Является ли это вынужденным ответом на американские инвестиции, или Китай и его компании нашли способ создать спрос на рынке и научить ИИ приносить прибыль?
Зачем компания, говоря о чрезмерности инвестиций и опережении спроса, объявила о возобновлении найма сотрудников после 12 кварталов сокращений?
Оправдан ли рост на 24% гонконгского индекса Hang Seng Tech, включающий ведущие технологические компании (и Alibaba тоже)? Особенно учитывая, что значимыми катализаторами роста стали встреча Си Цзиньпина с лидерами технологического сектора и энтузиазм вокруг моделей DeepSeek. Не является ли такой рост также спекулятивным и схожим по своей природе с хайпом вокруг ИИ в США?
Пока слова председателя Alibaba, не лишённые оснований, напоминают скорее словесную интервенцию с целью повлиять на рынок – потому что сама компания старается по темпам инвестиций и разработки ИИ не отставать от американских коллег.
👍3❤2
Forwarded from Content Review
ИИ пришёл на рынок смартфонов
В 2025 году смартфоны с генеративным искусственным интеллектом готовы захватить почти треть глобального рынка — примерно 400 миллионов устройств
Еще вчера функции искусственного интеллекта на смартфонах казались экзотикой, а сегодня они превращаются в массовый тренд. Ключевой драйвер этой трансформации – прорывы в производстве микрочипов и создании малых и мультимодальных языковых моделей.
Google, Samsung и Apple фактически задают новые правила игры. Их решения – Gemini Nano, Apple Intelligence и Galaxy AI – пытаются переопределить пользовательский опыт, сделав смартфон действительно умным собеседником и помощником.
Правда, пока не всё идёт гладко: улучшенная версия Siri от Apple откладывается, а для получения доступа на китайский рынок компании пришлось договариваться с Alibaba об использовании в Apple Intelligence их ИИ. Google и Samsung так и не смогли объяснить людям, зачем им нужны новые функции: несмотря на технологический восторг производителей, потребители пока относятся к ним прохладно. Люди ждут не очередных технических трюков, а реальной пользы.
Ведущими регионами по темпам внедрения генеративного ИИ станут Северная Америка, Западная Европа и Китай. К 2028 году 82% американских смартфонов обещают иметь ИИ-начинку. Одновременно китайские бренды Xiaomi, OPPO, Vivo и Honor начинают активную интеграцию DeepSeek в свои продукты, намереваясь сделать ИИ-технологии более доступными и массовыми.
Остаётся вопрос, будет ли эта функция бесплатной и скажется ли на цене устройства (если вычисления будут в облаке) либо на жизни батареи и скорости работы (если локально).
В 2025 году смартфоны с генеративным искусственным интеллектом готовы захватить почти треть глобального рынка — примерно 400 миллионов устройств
Еще вчера функции искусственного интеллекта на смартфонах казались экзотикой, а сегодня они превращаются в массовый тренд. Ключевой драйвер этой трансформации – прорывы в производстве микрочипов и создании малых и мультимодальных языковых моделей.
Google, Samsung и Apple фактически задают новые правила игры. Их решения – Gemini Nano, Apple Intelligence и Galaxy AI – пытаются переопределить пользовательский опыт, сделав смартфон действительно умным собеседником и помощником.
Правда, пока не всё идёт гладко: улучшенная версия Siri от Apple откладывается, а для получения доступа на китайский рынок компании пришлось договариваться с Alibaba об использовании в Apple Intelligence их ИИ. Google и Samsung так и не смогли объяснить людям, зачем им нужны новые функции: несмотря на технологический восторг производителей, потребители пока относятся к ним прохладно. Люди ждут не очередных технических трюков, а реальной пользы.
Ведущими регионами по темпам внедрения генеративного ИИ станут Северная Америка, Западная Европа и Китай. К 2028 году 82% американских смартфонов обещают иметь ИИ-начинку. Одновременно китайские бренды Xiaomi, OPPO, Vivo и Honor начинают активную интеграцию DeepSeek в свои продукты, намереваясь сделать ИИ-технологии более доступными и массовыми.
Остаётся вопрос, будет ли эта функция бесплатной и скажется ли на цене устройства (если вычисления будут в облаке) либо на жизни батареи и скорости работы (если локально).
👍2
Несколько отличий новой функции генерации изображений в ChatGPT от аналогичной, которую чуть раньше выпустили в Google:
• Инструмент Google пока существует в предварительном формате и доступен бесплатно всем желающим, но только через специальный портал aistudio. Это не готовая к релизу разработка, а скорее бета-тест, в котором компания разрешила поучаствовать всем пользователям
• Текст на изображениях у Google получается хуже, чем у OpenAI. Длинный контекст там не поддерживается и заполнить целый листок А4 внятным текстом не выйдет
• Генерация у Google происходит быстрее. Возможно, из-за оптимизации под их процессоры Trillium или других ухищрений
• Google не умеет генерировать картинки с прозрачным фоном (добавляет вместо этого квадратики, имитируя его)
• Google лучше сохраняет лица и детали оригинального изображения, если нужно его точечно поменять (например, переодеть человека или сделать другую причёску)
• При этому упор у Google сделан не на «художественность», поэтому чтобы получить красивые изображения интерфейса, инфографики или рекламы – нужно постараться. Да и разрешение изображений там сильно ниже
Что в итоге?
Во-первых, OpenAI не стали спешить, уступив конкурентам на первом этапе (хотя анонсировали эту функцию сильно заранее), а в итоге выпустили более полноценный и лучше упакованный продукт. Ведь у Google он находится пока на экспериментальной стадии.
Во-вторых, даже несмотря на это Google умудрились добиться более высокой скорости генерации и выпустили продукт раньше OpenAI, получив время на сбор обратной связи и доработку.
В-третьих, OpenAI сделали большой шаг вперёд, представив быстро и эффективно работающую авторегрессионную модель генерации на больших разрешениях. Если раньше все предпочитали использовать диффузии, то теперь тренд меняется в сторону более предсказуемых и гибких мультимодальных моделей, которые одинаково хорошо работают с любыми форматами данных.
• Инструмент Google пока существует в предварительном формате и доступен бесплатно всем желающим, но только через специальный портал aistudio. Это не готовая к релизу разработка, а скорее бета-тест, в котором компания разрешила поучаствовать всем пользователям
• Текст на изображениях у Google получается хуже, чем у OpenAI. Длинный контекст там не поддерживается и заполнить целый листок А4 внятным текстом не выйдет
• Генерация у Google происходит быстрее. Возможно, из-за оптимизации под их процессоры Trillium или других ухищрений
• Google не умеет генерировать картинки с прозрачным фоном (добавляет вместо этого квадратики, имитируя его)
• Google лучше сохраняет лица и детали оригинального изображения, если нужно его точечно поменять (например, переодеть человека или сделать другую причёску)
• При этому упор у Google сделан не на «художественность», поэтому чтобы получить красивые изображения интерфейса, инфографики или рекламы – нужно постараться. Да и разрешение изображений там сильно ниже
Что в итоге?
Во-первых, OpenAI не стали спешить, уступив конкурентам на первом этапе (хотя анонсировали эту функцию сильно заранее), а в итоге выпустили более полноценный и лучше упакованный продукт. Ведь у Google он находится пока на экспериментальной стадии.
Во-вторых, даже несмотря на это Google умудрились добиться более высокой скорости генерации и выпустили продукт раньше OpenAI, получив время на сбор обратной связи и доработку.
В-третьих, OpenAI сделали большой шаг вперёд, представив быстро и эффективно работающую авторегрессионную модель генерации на больших разрешениях. Если раньше все предпочитали использовать диффузии, то теперь тренд меняется в сторону более предсказуемых и гибких мультимодальных моделей, которые одинаково хорошо работают с любыми форматами данных.
👍1
С момента, как мы писали про телеграм-бот сервиса Grok, ничего не изменилось – он всё так же не работает с файлами и не генерирует картинки, не имеет доступа к поиску в Интернете, другим инструментами вроде Deep и Deeper Search. Ответы всё ещё странные, языки меняются по ходу общения, информация у нейросети устарела.
В боте нет стриминга сообщений, которые бы в реальном времени добавлялись к ответу нейросети и позволяли не ждать полчаса, пока он сгенерирует большой объём текста. Нет форматирования выдачи, которая выглядит как сплошной и плохо читаемый текст – словом, пользоваться им просто неудобно.
Хотя нет, кое-что всё-таки изменилось – сервера после анонса в соцсети Маска лежали и ждать ответа приходилось моментами мучительно долго, хотя на сайте сервиса всё работало отлично.
Если интеграция такая сырая, то зачем было о запуске объявлять официально и так рано? Тем более что Grok – одна из лучших нейросетей сегодня, а чат-бот по уровню ответов ничем не отличается от любительских ботов с доступом к запущенным локально моделькам Llama или DeepSeek.
В боте нет стриминга сообщений, которые бы в реальном времени добавлялись к ответу нейросети и позволяли не ждать полчаса, пока он сгенерирует большой объём текста. Нет форматирования выдачи, которая выглядит как сплошной и плохо читаемый текст – словом, пользоваться им просто неудобно.
Хотя нет, кое-что всё-таки изменилось – сервера после анонса в соцсети Маска лежали и ждать ответа приходилось моментами мучительно долго, хотя на сайте сервиса всё работало отлично.
Если интеграция такая сырая, то зачем было о запуске объявлять официально и так рано? Тем более что Grok – одна из лучших нейросетей сегодня, а чат-бот по уровню ответов ничем не отличается от любительских ботов с доступом к запущенным локально моделькам Llama или DeepSeek.
Коллеги в шутку накинулись на чат-бот Grok за то, что он выдаёт неправильную дату и «живёт» в 2023 году. Хотя его собрат на сайте как раз отвечает без всяких проблем.
Тут есть нюанс – ни одна нейросеть не знает, какие сейчас год, день или время, они в принципе не понимают таких категорий. И это не зависит от количества параметров или даты выпуска. Это всё равно, что задавать вопрос «Какой сейчас день?» книге и потом выбирать случайное слово на случайной странице в надежде, что там окажется заветный правильный ответ.
Именно поэтому так важно снабжать нейросети дополнительной информацией, контекстом. Это можно делать через системный промпт (который скрыт от пользователя, но даёт много полезных инструкций и данных), доступ к поиску, API разных сервисов, внутренней документации. Такой подход называется RAG (Retrieval-Augmented Generation). И именно поэтому любой сервис с доступом к Интернету или дополнительной информации с серверов способен ответить на вопросы о дате, времени, погоде и так далее.
Тут кроется и опасность. Например, если Алиса без всяких проблем узнала дату, время и погоду, то Нейро взял время из поисковой выдачи и в итоге оно оказалось неверным. Он не стал задавать уточняющих вопросов о моей локации, что позволило бы избежать ошибки.
Есть цитата «На практике случайность — это в основном неполная информация». То же самое применимо к выдаче нейросетей и основанных на них сервисах. Поэтому не стоит ожидать от нейросетей чуда, лучше всегда уточнять, откуда именно они берут информацию и на что ссылаются в ответе.
P.S. Вопросы задавались 26 марта в промежуток с 15 до 16 часов по МСК
Тут есть нюанс – ни одна нейросеть не знает, какие сейчас год, день или время, они в принципе не понимают таких категорий. И это не зависит от количества параметров или даты выпуска. Это всё равно, что задавать вопрос «Какой сейчас день?» книге и потом выбирать случайное слово на случайной странице в надежде, что там окажется заветный правильный ответ.
Именно поэтому так важно снабжать нейросети дополнительной информацией, контекстом. Это можно делать через системный промпт (который скрыт от пользователя, но даёт много полезных инструкций и данных), доступ к поиску, API разных сервисов, внутренней документации. Такой подход называется RAG (Retrieval-Augmented Generation). И именно поэтому любой сервис с доступом к Интернету или дополнительной информации с серверов способен ответить на вопросы о дате, времени, погоде и так далее.
Тут кроется и опасность. Например, если Алиса без всяких проблем узнала дату, время и погоду, то Нейро взял время из поисковой выдачи и в итоге оно оказалось неверным. Он не стал задавать уточняющих вопросов о моей локации, что позволило бы избежать ошибки.
Есть цитата «На практике случайность — это в основном неполная информация». То же самое применимо к выдаче нейросетей и основанных на них сервисах. Поэтому не стоит ожидать от нейросетей чуда, лучше всегда уточнять, откуда именно они берут информацию и на что ссылаются в ответе.
P.S. Вопросы задавались 26 марта в промежуток с 15 до 16 часов по МСК
👍1