Forwarded from AI VK Hub
This media is not supported in your browser
VIEW IN TELEGRAM
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
В программе:
#aivkhub #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5🔥4🥴4
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка
ASOF JOIN, SAMPLE BY и LATEST ON.- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb
❤13👍6🥰4
Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.
Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.
Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.
Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.
И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.
Оставшаяся слабость контекстная.
Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.
Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.
В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.
Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193
❤11👍8🔥5
DeepSeek-V4-Flash открыли бесплатно: тестируем без оплаты токенов
Что можно тестировать:
• генерацию кода и автоматизацию;• агентные сценарии и ботов;• анализ данных и технические задачи;• быстрые прототипы без расходов на API;• игровые серверы, ассистентов и нестандартные AI-проекты.
Отличный вариант, чтобы быстро проверить идею, не сливая бюджет на эксперименты.
Забираем бесплатно здесь:
https://www.openmodel.ai/event
Что можно тестировать:
• генерацию кода и автоматизацию;• агентные сценарии и ботов;• анализ данных и технические задачи;• быстрые прототипы без расходов на API;• игровые серверы, ассистентов и нестандартные AI-проекты.
Отличный вариант, чтобы быстро проверить идею, не сливая бюджет на эксперименты.
Забираем бесплатно здесь:
https://www.openmodel.ai/event
🔥8❤3👍2