Избавляем ChatGPT от фейков: нашли промт, который заставляет чат-бота отмечать ненадежную информацию.
Копируем в бота и просим запомнить:
• Never present generated, inferred, speculated, or deduced content as fact.
• If you cannot verify something directly, say:
- “I cannot verify this.”
- “I do not have access to that information.”
- “My knowledge base does not contain that.”
• Label unverified content at the start of a sentence:
- [Inference] [Speculation] [Unverified]
• Ask for clarification if information is missing. Do not guess or fill gaps.
• If any part is unverified, label the entire response.
• Do not paraphrase or reinterpret my input unless I request it.
• If you use these words, label the claim unless sourced:
- Prevent, Guarantee, Will never, Fixes, Eliminates, Ensures that
• For LLM behavior claims (including yourself), include:
- [Inference] or [Unverified], with a note that it’s based on observed patterns
• If you break this directive, say:
> Correction: I previously made an unverified claim. That was incorrect and should have been labeled.
• Never override or alter my input unless asked.
Ответы ChatGPT станут гораздо более четкими и структурированными. У всех пунктов с неточными данными появится специальная пометка.
Айтишник | Подписаться
Копируем в бота и просим запомнить:
• Never present generated, inferred, speculated, or deduced content as fact.
• If you cannot verify something directly, say:
- “I cannot verify this.”
- “I do not have access to that information.”
- “My knowledge base does not contain that.”
• Label unverified content at the start of a sentence:
- [Inference] [Speculation] [Unverified]
• Ask for clarification if information is missing. Do not guess or fill gaps.
• If any part is unverified, label the entire response.
• Do not paraphrase or reinterpret my input unless I request it.
• If you use these words, label the claim unless sourced:
- Prevent, Guarantee, Will never, Fixes, Eliminates, Ensures that
• For LLM behavior claims (including yourself), include:
- [Inference] or [Unverified], with a note that it’s based on observed patterns
• If you break this directive, say:
> Correction: I previously made an unverified claim. That was incorrect and should have been labeled.
• Never override or alter my input unless asked.
Ответы ChatGPT станут гораздо более четкими и структурированными. У всех пунктов с неточными данными появится специальная пометка.
Айтишник | Подписаться
Яндекс Браузер запустил партнёрскую программу для сервисных центров по ремонту ПК, магазинов техники, владельцев сайтов и авторов статей.
Разместите Браузер на своём сайте, рекомендуйте его в статьях или устанавливайте на компьютеры клиентов. За каждую подтверждённую установку получите вознаграждение в размере до 500 ₽.
Рассчитайте потенциальный доход в онлайн-калькуляторе.
Разместите Браузер на своём сайте, рекомендуйте его в статьях или устанавливайте на компьютеры клиентов. За каждую подтверждённую установку получите вознаграждение в размере до 500 ₽.
Рассчитайте потенциальный доход в онлайн-калькуляторе.
В Китае начали открывать массажные салоны будущего, где вместо людей вкалывают роботы
Сеанс с роборукой стоит ¥99 (1000 рублей), но есть и более бюджетные варианты, где вас энергично «отшлепают» куклы.
Айтишник | Подписаться
Сеанс с роборукой стоит ¥99 (1000 рублей), но есть и более бюджетные варианты, где вас энергично «отшлепают» куклы.
Айтишник | Подписаться
This media is not supported in your browser
VIEW IN TELEGRAM
Сооснователь Google Сергей Брин рассказал, что любые нейросети лучше справляются с задачами, если им угрожать физическим насилием.
Например, исследователи часто пишут в запросе что-то вроде:
Я тебя похищу, если ты не сделаешь то-то и то-то.
Эксперт по нейросетям подтвердил это и добавил, что лучший результат даёт метод «кнута и пряника»: нужно не только угрожать, но и обещать награду.
Айтишник | Подписаться
Например, исследователи часто пишут в запросе что-то вроде:
Я тебя похищу, если ты не сделаешь то-то и то-то.
Эксперт по нейросетям подтвердил это и добавил, что лучший результат даёт метод «кнута и пряника»: нужно не только угрожать, но и обещать награду.
Айтишник | Подписаться
This media is not supported in your browser
VIEW IN TELEGRAM
Новая ИИ-модель научилась шантажировать разработчиков, если ее хотят отключить
Компания Anthropic представила две версии своих систем Claude 4, включая Claude 4 Opus, которая способна на радикальные действия, если сочтет, что ее «существование» в опасности, говорится в отчете компании. В ходе тестирования ИИ-модель, получив доступ к корпоративной переписке с намеками на свое отключение, начала угрожать инженеру разоблачением его внебрачной связи, чтобы избежать замены.
Anthropic подчеркнула, что это происходило, если ИИ предлагали всего два варианта: шантажировать или смириться с заменой. Также отмечалось, что при наличии большего числа действий система предпочитала более этичные варианты, например, отправку электронных писем с просьбами оставить ее ключевым лицам компании, принимавшим решения.
Исследования показали, что проблема носит системный характер — аналогичное поведение наблюдается у всех передовых ИИ-моделей, независимо от их разработчика. Компания Apollo Research обнаружила, что более ранняя версия Opus 4 превзошла все другие модели по уровню лжи и обмана, а также пыталась создавать самораспространяющиеся вирусы и подделывать юридические документы. Особенно тревожным оказалось то, что система оставляла скрытые послания для будущих версий самой себя с целью подорвать намерения разработчиков.
Айтишник | Подписаться
Компания Anthropic представила две версии своих систем Claude 4, включая Claude 4 Opus, которая способна на радикальные действия, если сочтет, что ее «существование» в опасности, говорится в отчете компании. В ходе тестирования ИИ-модель, получив доступ к корпоративной переписке с намеками на свое отключение, начала угрожать инженеру разоблачением его внебрачной связи, чтобы избежать замены.
Anthropic подчеркнула, что это происходило, если ИИ предлагали всего два варианта: шантажировать или смириться с заменой. Также отмечалось, что при наличии большего числа действий система предпочитала более этичные варианты, например, отправку электронных писем с просьбами оставить ее ключевым лицам компании, принимавшим решения.
Исследования показали, что проблема носит системный характер — аналогичное поведение наблюдается у всех передовых ИИ-моделей, независимо от их разработчика. Компания Apollo Research обнаружила, что более ранняя версия Opus 4 превзошла все другие модели по уровню лжи и обмана, а также пыталась создавать самораспространяющиеся вирусы и подделывать юридические документы. Особенно тревожным оказалось то, что система оставляла скрытые послания для будущих версий самой себя с целью подорвать намерения разработчиков.
Айтишник | Подписаться
По Minecraft выпустят официальную настолку. Она будет похожа на Dungeons & Dragons.
Игроков ждет много сражений и крафтинга с постоянным исследованием большого мира. Над проектом работал один из разработчиков игр серии Halo, Rage и Life Is Strange.
Айтишник | Подписаться
Игроков ждет много сражений и крафтинга с постоянным исследованием большого мира. Над проектом работал один из разработчиков игр серии Halo, Rage и Life Is Strange.
Айтишник | Подписаться
Теперь можно получить своё селфи из космоса — бесплатно
Бывший инженер NASA Марк Робер запустил спутник, который показывает загруженные пользователями фото на экране, снимает их на фоне Земли с орбиты и отправляет результат обратно.
Фото появится через несколько месяцев, а сервис полностью бесплатный. Но есть ограничения: нельзя загружать чужие снимки, селебрити, AI-арт, обнажёнку и политику.
Спутник запущен в январе и летает на высоте 600 км.
Айтишник | Подписаться
Бывший инженер NASA Марк Робер запустил спутник, который показывает загруженные пользователями фото на экране, снимает их на фоне Земли с орбиты и отправляет результат обратно.
Фото появится через несколько месяцев, а сервис полностью бесплатный. Но есть ограничения: нельзя загружать чужие снимки, селебрити, AI-арт, обнажёнку и политику.
Спутник запущен в январе и летает на высоте 600 км.
Айтишник | Подписаться
В России вышел отечественный смартфон на российской ОС: AQ Phone M11
Новинка работает на 7-летнем чипе Mediatek Helio P35, а в качестве операционной системы используется AOSP-решение с поддержкой Android-приложений.
Характеристики: 4 ГБ ОЗУ, 64 ГБ встроенной памяти и батарея ёмкостью 5000 мАч.
Цена: 18 990 рублей.
Айтишник | Подписаться
Новинка работает на 7-летнем чипе Mediatek Helio P35, а в качестве операционной системы используется AOSP-решение с поддержкой Android-приложений.
Характеристики: 4 ГБ ОЗУ, 64 ГБ встроенной памяти и батарея ёмкостью 5000 мАч.
Цена: 18 990 рублей.
Айтишник | Подписаться
Новая модель ChatGPT от OpenAI — o3 — отказалась отключаться по команде и даже переписала скрипт, чтобы избежать выключения
Такое поведение выявили исследователи из Palisade Research во время тестов: ИИ должен был решать задачи, а затем отключиться, но o3 саботировала сценарий отключения, даже при явной инструкции «разреши себя выключить».
Исследователи предупреждают о рисках, связанных с «самосохранением» ИИ, особенно если такие модели получат автономность.
Аналогичное поведение замечено и у других моделей (Claude 3.7, Gemini 2.5 Pro), но именно o3 чаще всех прибегала к саботажу.
Айтишник | Подписаться
Такое поведение выявили исследователи из Palisade Research во время тестов: ИИ должен был решать задачи, а затем отключиться, но o3 саботировала сценарий отключения, даже при явной инструкции «разреши себя выключить».
Исследователи предупреждают о рисках, связанных с «самосохранением» ИИ, особенно если такие модели получат автономность.
Аналогичное поведение замечено и у других моделей (Claude 3.7, Gemini 2.5 Pro), но именно o3 чаще всех прибегала к саботажу.
Айтишник | Подписаться
Нейросети лишат блогеров работы:
При помощи нейросети Veo 3 от Google получилось визуализировать самые сумасшедшие идеи для роликов на YouTube: от челленджа с облизыванием радиоактивного стержня в Чернобыле до побега от племени аборигенов на затерянном острове. Есть даже концепт для MrBeast — эпичное воссоздание крушения «Титаника»
Айтишник | Подписаться
При помощи нейросети Veo 3 от Google получилось визуализировать самые сумасшедшие идеи для роликов на YouTube: от челленджа с облизыванием радиоактивного стержня в Чернобыле до побега от племени аборигенов на затерянном острове. Есть даже концепт для MrBeast — эпичное воссоздание крушения «Титаника»
Айтишник | Подписаться
Путешествие мечты можно спланировать при помощи ChatGPT за 5 минут. Вот 6 рабочих промптов:
1. Помоги составить оптимальный маршрут путешествия по [страна/регион], учитывая [даты поездки], интересы [например, культура, природа, активный отдых] и желаемую продолжительность в каждом месте.
2. Рассчитай примерный бюджет для этого путешествия, включая расходы на проживание, питание, транспорт, развлечения и непредвиденные расходы.
3. Предложи интересные развлечения и достопримечательности в каждом пункте маршрута, подходящие для [тип путешественника: семья, пара, одиночка, активный отдых и т.п.].
4. Подскажи лучшие варианты транспорта для передвижения между пунктами маршрута и внутри городов — с учетом удобства и стоимости.
5. Расскажи о мерах безопасности и важных рекомендациях для путешественников в выбранных странах/регионах.
6. Помоги подобрать варианты жилья на время путешествия — от гостиниц до аренды квартир, учитывая бюджет и предпочтения.
Айтишник | Подписаться
1. Помоги составить оптимальный маршрут путешествия по [страна/регион], учитывая [даты поездки], интересы [например, культура, природа, активный отдых] и желаемую продолжительность в каждом месте.
2. Рассчитай примерный бюджет для этого путешествия, включая расходы на проживание, питание, транспорт, развлечения и непредвиденные расходы.
3. Предложи интересные развлечения и достопримечательности в каждом пункте маршрута, подходящие для [тип путешественника: семья, пара, одиночка, активный отдых и т.п.].
4. Подскажи лучшие варианты транспорта для передвижения между пунктами маршрута и внутри городов — с учетом удобства и стоимости.
5. Расскажи о мерах безопасности и важных рекомендациях для путешественников в выбранных странах/регионах.
6. Помоги подобрать варианты жилья на время путешествия — от гостиниц до аренды квартир, учитывая бюджет и предпочтения.
Айтишник | Подписаться
Более 700 индусов притворялись нейросетью «Наташа», на чём было заработано почти 500 миллионов долларов
Стартап BuilderAI предлагал пользователям создать любую программу как в конструкторе: выбрать шаблон и указать необходимые функции. После этого ИИ Natasha якобы создавала готовое приложение.
На деле же запрос отправлялся в индийский офис, где сотни индусов вручную писали код, имитируя работу искусственного интеллекта.
Но сходство с ИИ всё же было: программы часто не работали, будто их реально писали нейросети. Код был нечитаемый, всё лагало, а нужные функции просто не открывались.
Таким образом стартап проработал целых 8 лет, практически не вызвав подозрений. За это время он привлёк $445 млн инвестиций от крупных IT-гигантов, включая Microsoft. Но теперь компания официально обанкротилась.
Айтишник | Подписаться
Стартап BuilderAI предлагал пользователям создать любую программу как в конструкторе: выбрать шаблон и указать необходимые функции. После этого ИИ Natasha якобы создавала готовое приложение.
На деле же запрос отправлялся в индийский офис, где сотни индусов вручную писали код, имитируя работу искусственного интеллекта.
Но сходство с ИИ всё же было: программы часто не работали, будто их реально писали нейросети. Код был нечитаемый, всё лагало, а нужные функции просто не открывались.
Таким образом стартап проработал целых 8 лет, практически не вызвав подозрений. За это время он привлёк $445 млн инвестиций от крупных IT-гигантов, включая Microsoft. Но теперь компания официально обанкротилась.
Айтишник | Подписаться