CriticGPT: ИИ для поиска ошибок ИИ
OpenAI рассказала о новой модели CriticGPT, основанной на GPT-4, для выявления ошибок в коде, сгенерированном GPT-4.
Возможности CriticGPT:
🔶 Анализ кода, созданного ChatGPT и выявление неточностей
🔶 Написание критических замечаний к ответам ChatGPT
🔶 Помощь людям-тренерам в оценке выходных данных ИИ
🔶 Балансировка между агрессивным поиском проблем и точностью обнаружения
Ключевые факты:
Модель обучена с помощью RLHF (Усиление обучения с помощью людского фидбэка), как и ChatGPT, но на данных с намеренно внесенными ошибками. CriticGPT способна находить как искусственно внесенные, так и естественные ошибки ChatGPT. По мнению тренеров, критика CriticGPT лучше, чем критика ChatGPT в 63% случаев при работе с естественными ошибками.
Было обнаружено, что можно генерировать более длинные и всесторонние критические замечания, используя дополнительный поиск во время тестирования против модели вознаграждения критики. Этот поиск, называемый Принудительным выбором с использованием поиска по лучам (FSBS), позволяет балансировать агрессивность поиска проблем в коде и настраивать компромисс между точностью и полнотой обнаружения ошибок. В результате генерируются замечания, максимально полезные для RLHF. Подробнее в документе.
Ограничения CriticGPT включают возможные галлюцинации, сложность оценки длинных и комплексных задач, а также проблемы с обнаружением ошибок, распределенных по всему ответу.
OpenAI планирует интегрировать подобные CriticGPT модели в процесс обучения своих ИИ-систем и видит в этом подходе перспективу для создания более совершенных инструментов оценки сложных ИИ-систем.
Так то 63% не супер сильно отличается от 50…
@sergiobulaev - об AI и не только
OpenAI рассказала о новой модели CriticGPT, основанной на GPT-4, для выявления ошибок в коде, сгенерированном GPT-4.
Возможности CriticGPT:
🔶 Анализ кода, созданного ChatGPT и выявление неточностей
🔶 Написание критических замечаний к ответам ChatGPT
🔶 Помощь людям-тренерам в оценке выходных данных ИИ
🔶 Балансировка между агрессивным поиском проблем и точностью обнаружения
Ключевые факты:
Модель обучена с помощью RLHF (Усиление обучения с помощью людского фидбэка), как и ChatGPT, но на данных с намеренно внесенными ошибками. CriticGPT способна находить как искусственно внесенные, так и естественные ошибки ChatGPT. По мнению тренеров, критика CriticGPT лучше, чем критика ChatGPT в 63% случаев при работе с естественными ошибками.
Было обнаружено, что можно генерировать более длинные и всесторонние критические замечания, используя дополнительный поиск во время тестирования против модели вознаграждения критики. Этот поиск, называемый Принудительным выбором с использованием поиска по лучам (FSBS), позволяет балансировать агрессивность поиска проблем в коде и настраивать компромисс между точностью и полнотой обнаружения ошибок. В результате генерируются замечания, максимально полезные для RLHF. Подробнее в документе.
Ограничения CriticGPT включают возможные галлюцинации, сложность оценки длинных и комплексных задач, а также проблемы с обнаружением ошибок, распределенных по всему ответу.
OpenAI планирует интегрировать подобные CriticGPT модели в процесс обучения своих ИИ-систем и видит в этом подходе перспективу для создания более совершенных инструментов оценки сложных ИИ-систем.
Так то 63% не супер сильно отличается от 50…
@sergiobulaev - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Прикольные свежие примеры видео генераций Gen3, часть промптов:
@sergiobulaev - об AI и всём таком
1. Сверхбыстрый дезориентирующий круговой гиперлапс-пролет через все этапы жизни
2. Кинематографический кадр отвратительного монстра, поднимающегося из реки Темзы в Лондоне
3. Видео таймлапс с видом сверху, показывающее процесс создания карандашного рисунка рукой художника, от начала до конца - это изображение девушки с волосами кролика
4. Стильная женщина на улице Токио
5. Пролёт сквозь замок в Ирландии, который превращается в футуристический кибер-панк город с небоскрёбами
@sergiobulaev - об AI и всём таком
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Опять занимался ботом для ULCAMP. Добавил ему возможность устанавливать, показывать и удалять напоминания, а также отправлять сообщения в поддержку.
Изучал, как работает передача и запуск функций модели (сегодня был Claude). Оказалось, всё довольно просто. Функции описываются текстом, указывается, какие параметры им нужны для работы:
Далее это описание передаётся модели вместе с промптом, и она понимает, что может применить эти функции по необходимости. Соответственно, если она решает, что надо запустить функцию в процессе генерации - она останавливается и передает ответ о необходимости запуска и предоставляет параметры.
Функцию я запускаю сам, и дальше у меня есть выбор - либо сразу предоставить результат работы пользователю, либо вернуть результат обратно и дождаться нового сгенерированного ответа. Работает довольно чётко.
Бот если что здесь, но в процессе тестирования.
@sergiobulaev - об AI и не только.
Изучал, как работает передача и запуск функций модели (сегодня был Claude). Оказалось, всё довольно просто. Функции описываются текстом, указывается, какие параметры им нужны для работы:
{
"name": "set_reminder",
"description": "Add reminder for the user to the database. In case he asks that he wants to go to some event or use a bus or any other activity connected to time. Date time format is YYYY-MM-DD HH:MM:SS",
"input_schema": {
"type": "object",
"properties": {"message": {"type": "string"}, "event": {"type": "string"}, "date-time": {"type": "string"}},
},
},
{
"name": "delete_reminder",
"description": "Delete reminder for the user. Reminder id is two digits number in string format like 01 or 22",
"input_schema": {
"type": "object",
"properties": {"reminder_id": {"type": "string"}},
},
}
Далее это описание передаётся модели вместе с промптом, и она понимает, что может применить эти функции по необходимости. Соответственно, если она решает, что надо запустить функцию в процессе генерации - она останавливается и передает ответ о необходимости запуска и предоставляет параметры.
Функцию я запускаю сам, и дальше у меня есть выбор - либо сразу предоставить результат работы пользователю, либо вернуть результат обратно и дождаться нового сгенерированного ответа. Работает довольно чётко.
Бот если что здесь, но в процессе тестирования.
@sergiobulaev - об AI и не только.
С радостью обнаружил что Anthropic перевёл меня на второй таер с лимитом 2,5 млн токенов в день, что гораздо лучше чем 1. Это заставляет надеятся что постепенно можно дойти и до действительно нормальных лимитов.
This media is not supported in your browser
VIEW IN TELEGRAM
Примерно час ушел у Андрея Карпаты, что бы сделать это видео из нескольких сцен из "Гордости и Предубеждения".
Использованный стэк:
Андрей написал, что было напряжно и он подустал копипастить.
@sergiobulaev - об AI и всём таком
Использованный стэк:
-
Claude для генерации сцен и подсказок для создания изображений на основе первой главы книги.
-
Ideogram AI для создания изображений по этим подсказкам.
- Анимировал полученные изображения с помощью
Luma Labs AI.
- Добавил озвучку, используя
ElevenLabs.
- Собрал все элементы в единое видео с помощью
Veed Studio.
Андрей написал, что было напряжно и он подустал копипастить.
@sergiobulaev - об AI и всём таком
Маленькие львёнок, котёнок, щенки и красная панда. 100% AI Gen-3. Вот тут есть ещё.
@sergiobulaev - об AI и всём таком.
@sergiobulaev - об AI и всём таком.
This media is not supported in your browser
VIEW IN TELEGRAM
Мне кажется, мой любимый момент из «Матрицы» стал актуален как никогда и отлично демонстрирует творящуюся вокруг нас революцию.
@sergiobulaev - об AI и всём таком
@sergiobulaev - об AI и всём таком
This media is not supported in your browser
VIEW IN TELEGRAM
Meta представила новую систему под названием Meta 3D Gen (3DGen) для создания 3D-объектов на основе текстовых описаний. Это результат исследований подразделения GenAI в Meta.
🔶 Система может генерировать высококачественные 3D-модели с текстурами и материалами менее чем за минуту. Это полностью автоматический процесс от начала до конца (end-to-end).
🔶 3DGen создает высококачественные текстуры высокого разрешения и карты материалов.
🔶 По сравнению с существующими решениями, 3DGen производит результаты более высокого качества в 3-10 раз быстрее.
🔶 3DGen состоит из двух основных компонентов: AssetGen (создает базовую 3D-модель) и TextureGen (улучшает текстуры и материалы).
🔶 Система может не только создавать новые 3D-объекты, но и изменять текстуры уже существующих моделей по текстовому описанию.
🔶 3DGen показывает лучшие результаты в точности соответствия текстовому описанию и качестве визуализации, особенно для сложных запросов.
🔶 Система использует технологию физически корректного рендеринга (PBR), что позволяет реалистично освещать созданные объекты.
🔶 Профессиональные 3D-художники высоко оценивают качество результатов 3DGen по сравнению с другими системами.
Технология может найти применение в создании игр, дополненной и виртуальной реальности, спецэффектов для фильмов и других областях.
@sergiobulaev - об AI и всём таком
🔶 Система может генерировать высококачественные 3D-модели с текстурами и материалами менее чем за минуту. Это полностью автоматический процесс от начала до конца (end-to-end).
🔶 3DGen создает высококачественные текстуры высокого разрешения и карты материалов.
🔶 По сравнению с существующими решениями, 3DGen производит результаты более высокого качества в 3-10 раз быстрее.
🔶 3DGen состоит из двух основных компонентов: AssetGen (создает базовую 3D-модель) и TextureGen (улучшает текстуры и материалы).
🔶 Система может не только создавать новые 3D-объекты, но и изменять текстуры уже существующих моделей по текстовому описанию.
🔶 3DGen показывает лучшие результаты в точности соответствия текстовому описанию и качестве визуализации, особенно для сложных запросов.
🔶 Система использует технологию физически корректного рендеринга (PBR), что позволяет реалистично освещать созданные объекты.
🔶 Профессиональные 3D-художники высоко оценивают качество результатов 3DGen по сравнению с другими системами.
Технология может найти применение в создании игр, дополненной и виртуальной реальности, спецэффектов для фильмов и других областях.
@sergiobulaev - об AI и всём таком