Если вдруг у вас есть желание потренировать математику в уме, в прошлом году сделал вот такого бота:
@math_learn_bot
Самое интересное было оптимизировать примеры так, что бы все вычисления можно было сделать в уме.
Т.е. никогда не будет дробной части в ответе на деление и при вычитании в сложных примерах так же левая часть от знака "-" всегда больше правой.
В общем, удобный тренажёр.
Умножение двузначных чисел особенно затягивает.
#math #тренажёр
——
@tsingular
@math_learn_bot
Самое интересное было оптимизировать примеры так, что бы все вычисления можно было сделать в уме.
Т.е. никогда не будет дробной части в ответе на деление и при вычитании в сложных примерах так же левая часть от знака "-" всегда больше правой.
В общем, удобный тренажёр.
Умножение двузначных чисел особенно затягивает.
#math #тренажёр
——
@tsingular
❤2
DeepMind: Google потратит более $100 млрд на ИИ
Демис Хассабис, глава DeepMind, принадлежащей Google, заявил, что со временем Google инвестирует более $100 млрд в разработку технологий ИИ.
Хассабис опроверг слухи о суперкомпьютере "Звездные врата" от Microsoft и OpenAI, утверждая, что Google обладает большей вычислительной мощностью, чем конкуренты.
DeepMind присоединилась к Google в 2014 году для доступа к огромным вычислительным ресурсам, необходимым для достижения искусственного общего интеллекта (ИОИ).
ИИ лихорадка в Кремниевой долине в полном разгаре.
#DeepMind #Google
-------
@tsingular
Демис Хассабис, глава DeepMind, принадлежащей Google, заявил, что со временем Google инвестирует более $100 млрд в разработку технологий ИИ.
Хассабис опроверг слухи о суперкомпьютере "Звездные врата" от Microsoft и OpenAI, утверждая, что Google обладает большей вычислительной мощностью, чем конкуренты.
DeepMind присоединилась к Google в 2014 году для доступа к огромным вычислительным ресурсам, необходимым для достижения искусственного общего интеллекта (ИОИ).
ИИ лихорадка в Кремниевой долине в полном разгаре.
#DeepMind #Google
-------
@tsingular
Adobe зарелизила ИИ для Acrobat PDF
Adobe выпустила в прод Acrobat AI Assistant - ИИ-инструмент для работы с PDF на базе генеративного ИИ, анонсированный ранее в феврале.
Ассистент поможет создавать, редактировать и анализировать PDF-документы с помощью простых текстовых запросов.
Например, можно попросить ИИ обобщить содержание документа, добавить иллюстрации или отредактировать текст.
Acrobat AI также умеет отвечать на вопросы по содержанию PDF, генерировать новые документы и даже конвертировать PDF в другие форматы :).
Новый инструмент призван облегчить работу с PDF и сделать её более эффективной и креативной.
Расходы на лицензию вычтут из вашей зарплаты :).
#Adobe #Acrobat #PDF
-------
@tsingular
Adobe выпустила в прод Acrobat AI Assistant - ИИ-инструмент для работы с PDF на базе генеративного ИИ, анонсированный ранее в феврале.
Ассистент поможет создавать, редактировать и анализировать PDF-документы с помощью простых текстовых запросов.
Например, можно попросить ИИ обобщить содержание документа, добавить иллюстрации или отредактировать текст.
Acrobat AI также умеет отвечать на вопросы по содержанию PDF, генерировать новые документы и даже конвертировать PDF в другие форматы :).
Новый инструмент призван облегчить работу с PDF и сделать её более эффективной и креативной.
Расходы на лицензию вычтут из вашей зарплаты :).
#Adobe #Acrobat #PDF
-------
@tsingular
Forwarded from GigaChat
Kandinsky вошёл в ТОП-5 лучших нейросетей мира🔥
Одно из ведущих европейских изданий TechBulllion оценило десять передовых нейросетей для генерации изображений из США, России, Индии и Китая, в том числе Midjourney, SDXL Turbo, Dall-E 3.
Рейтинг составлялся по таким параметрам, как:
✔️ смысловая нагрузка — насколько точно сгенерированное изображение отражает изначальный запрос
✔️ композиция — было ли сгенерированное изображение эстетически приятным
✔️ художественный подтекст — вызвало ли изображение какие-то глубокие эмоции, выходящие за рамки изначального промпта
✔️ точность передачи техники — насколько эффективно модель передала конкретный художественный стиль
✔️ качество изображения
Генеративная модель Kandinsky заняла пятое место. По словам исследователей, модель генерирует изображения с глубинным смыслом, которые требуют хорошего понимания концепций абстрактного искусства. На днях модель Kandinsky также стала самой упоминаемой в соцмедиа российской нейросетью.
Попробовать Kandinsky можно в ботах ВКонтакте и Telegram, в веб-версии, а также в боте и веб-версии GigaChat.
Одно из ведущих европейских изданий TechBulllion оценило десять передовых нейросетей для генерации изображений из США, России, Индии и Китая, в том числе Midjourney, SDXL Turbo, Dall-E 3.
Рейтинг составлялся по таким параметрам, как:
Генеративная модель Kandinsky заняла пятое место. По словам исследователей, модель генерирует изображения с глубинным смыслом, которые требуют хорошего понимания концепций абстрактного искусства. На днях модель Kandinsky также стала самой упоминаемой в соцмедиа российской нейросетью.
Попробовать Kandinsky можно в ботах ВКонтакте и Telegram, в веб-версии, а также в боте и веб-версии GigaChat.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from эйай ньюз
Вышел AI Index Report 2024 - ежегодный отчет от Стенфорда про тренды в AI (не только в ресерче).
1. AI местами уже обходит людей в задачах связанных с классификацией изображений и пониманием (английского) языка. Но еще не везде (пока).
2. Бигтех продолжает жестко доминировать в АИ ресерче выпустив, помимо прочего, 51 достойную модель, пока академия лишь 15.
3. По оценкам AI Index, затраты на обучение современных моделей ИИ достигли беспрецедентного уровня, например, на обучение GPT-4 от OpenAI было потрачено около 78 млн $, а на Gemini Ultra от Google - 191 млн $ .
4. США – лидер в AI гонке, а Китай в робототехнике. Китай клепает много статей, но реально крутых моделей у них меньше чем у Американцев.
5. Остро стоит вопрос алайнмента. Сейчас нет каких-то бенчмарков или утвержденных эталонов для оценки ответственности LLM, что затрудняет систематическое сравнение рисков и регуляцию моделей между сосбой.
6. Инвестиции в AI резко возросли, почти в восемь раз по сравнению с 2022 годом и достигли 25,2 миллиарда долларов, несмотря на общее снижение частных инвестиций в нишу в прошлом году.
7. AI повышает производительность труда, а также сужает разрыв между начинающими и опытными сотрудниками. Так что учимся пользоваться!
8. Научный прогресс ускоряется еще больше благодаря AI. В 2023 году были запущены AI-интсрументы во всех сферах научной деятельности, начиная с AlphaDev, повышающего эффективность алгоритмической сортировки, до GNoME, облегчающего процесс открытия новых материалов.
9. Мы видим все больше регуляций AI со стороны государств. Количество нормативных актов, связанных с AI, в США резко возросло за последний год и последние пять лет, в 2023 году их было 25, а в 2016 – всего один.
10. До людей постепенно доходит что AI это вам не NFT, согласно опросу Ipsos, доля тех, кто считает, что искусственный интеллект кардинально повлияет на их жизнь в ближайшие три-пять лет, увеличилась с 60% до 66%, а 52% выражают обеспокоенность в отношении AI. Люди боятся того, чего не понимают.
Репорт в PDF
@ai_newz
1. AI местами уже обходит людей в задачах связанных с классификацией изображений и пониманием (английского) языка. Но еще не везде (пока).
2. Бигтех продолжает жестко доминировать в АИ ресерче выпустив, помимо прочего, 51 достойную модель, пока академия лишь 15.
3. По оценкам AI Index, затраты на обучение современных моделей ИИ достигли беспрецедентного уровня, например, на обучение GPT-4 от OpenAI было потрачено около 78 млн $, а на Gemini Ultra от Google - 191 млн $ .
4. США – лидер в AI гонке, а Китай в робототехнике. Китай клепает много статей, но реально крутых моделей у них меньше чем у Американцев.
5. Остро стоит вопрос алайнмента. Сейчас нет каких-то бенчмарков или утвержденных эталонов для оценки ответственности LLM, что затрудняет систематическое сравнение рисков и регуляцию моделей между сосбой.
6. Инвестиции в AI резко возросли, почти в восемь раз по сравнению с 2022 годом и достигли 25,2 миллиарда долларов, несмотря на общее снижение частных инвестиций в нишу в прошлом году.
7. AI повышает производительность труда, а также сужает разрыв между начинающими и опытными сотрудниками. Так что учимся пользоваться!
8. Научный прогресс ускоряется еще больше благодаря AI. В 2023 году были запущены AI-интсрументы во всех сферах научной деятельности, начиная с AlphaDev, повышающего эффективность алгоритмической сортировки, до GNoME, облегчающего процесс открытия новых материалов.
9. Мы видим все больше регуляций AI со стороны государств. Количество нормативных актов, связанных с AI, в США резко возросло за последний год и последние пять лет, в 2023 году их было 25, а в 2016 – всего один.
10. До людей постепенно доходит что AI это вам не NFT, согласно опросу Ipsos, доля тех, кто считает, что искусственный интеллект кардинально повлияет на их жизнь в ближайшие три-пять лет, увеличилась с 60% до 66%, а 52% выражают обеспокоенность в отношении AI. Люди боятся того, чего не понимают.
Репорт в PDF
@ai_newz
Logitech представляет кнопку для вызова ChatGPT на клавиатурах и мышках
Компания Logitech анонсировала Logi AI Prompt Builder - функцию для быстрого вызова ChatGPT на своих новых устройствах. 🖱️⌨
Она предлагает готовые "рецепты" для более удобного взаимодействия с ChatGPT, такие как перефразирование, создание списков, изменение длины текста.
Требуется новое устройство Logitech, старые модели могут быть несовместимы. Будет продаваться специальная мышь Logitech M750 AI Edition с отдельной кнопкой для вызова Logi AI Prompt Builder.
Пока функция работает только с ChatGPT и только на английском языке, но Logitech планирует добавить поддержку других чат-ботов и языков.
Каждую ночь ты сидишь у окна
Перемещая звезды
#Logitech #ChatGPT #Peripherals
-------
@tsingular
Компания Logitech анонсировала Logi AI Prompt Builder - функцию для быстрого вызова ChatGPT на своих новых устройствах. 🖱️⌨
Она предлагает готовые "рецепты" для более удобного взаимодействия с ChatGPT, такие как перефразирование, создание списков, изменение длины текста.
Требуется новое устройство Logitech, старые модели могут быть несовместимы. Будет продаваться специальная мышь Logitech M750 AI Edition с отдельной кнопкой для вызова Logi AI Prompt Builder.
Пока функция работает только с ChatGPT и только на английском языке, но Logitech планирует добавить поддержку других чат-ботов и языков.
Каждую ночь ты сидишь у окна
Перемещая звезды
#Logitech #ChatGPT #Peripherals
-------
@tsingular
GPT-4 способен автономно эксплуатировать уязвимости
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular
Правительство Великобритании выпустило руководство по генеративному ИИ
Документ предоставляет рекомендации по безопасному и ответственному использованию генеративного ИИ в правительстве Великобритании.
Основные аспекты: оценка рисков, защита данных, принципы обработки данных, человеческий контроль, безопасность и создание надзорных органов по ИИ и этических комитетов.
Важно идентифицировать источники персональных данных, контролировать их обработку и соблюдать дополнительные условия для конфиденциальных данных.
Существуют риски безопасности при использовании генеративного ИИ, такие как инъекции запросов, извлечение данных и воспроизведение вредоносного контента.
Необходимо применять соответствующие меры безопасности: фильтрация контента, метапромпты и выбор надежных моделей.
Интересный для изучения документ правительства UK по обучению, работе, закупке и внедрению ИИ систем
#UK #AISecurity #AIRegulation
-------
@tsingular
Документ предоставляет рекомендации по безопасному и ответственному использованию генеративного ИИ в правительстве Великобритании.
Основные аспекты: оценка рисков, защита данных, принципы обработки данных, человеческий контроль, безопасность и создание надзорных органов по ИИ и этических комитетов.
Важно идентифицировать источники персональных данных, контролировать их обработку и соблюдать дополнительные условия для конфиденциальных данных.
Существуют риски безопасности при использовании генеративного ИИ, такие как инъекции запросов, извлечение данных и воспроизведение вредоносного контента.
Необходимо применять соответствующие меры безопасности: фильтрация контента, метапромпты и выбор надежных моделей.
Интересный для изучения документ правительства UK по обучению, работе, закупке и внедрению ИИ систем
#UK #AISecurity #AIRegulation
-------
@tsingular
AMD расширяет портфель коммерческих ПК с ИИ
AMD представила новые мобильные процессоры Ryzen PRO 8040 и настольные Ryzen PRO 8000 для бизнес-пользователей.
Процессоры оснащены выделенным ядром нейронных вычислений (NPU) для ускорения задач ИИ.
Обновленная архитектура "Zen 4" и 4-нм техпроцесс обеспечивают улучшенную производительность и энергоэффективность.
Процессоры поддерживают Wi-Fi 7 и интегрированы с Microsoft Pluton для защиты от чипа до облака.
AMD ожидает более 150 приложений с поддержкой ИИ к концу 2024 года.
ИИ со-процессоры уже норма.
#AMD #RyzenPRO #WiFi7
-------
@tsingular
AMD представила новые мобильные процессоры Ryzen PRO 8040 и настольные Ryzen PRO 8000 для бизнес-пользователей.
Процессоры оснащены выделенным ядром нейронных вычислений (NPU) для ускорения задач ИИ.
Обновленная архитектура "Zen 4" и 4-нм техпроцесс обеспечивают улучшенную производительность и энергоэффективность.
Процессоры поддерживают Wi-Fi 7 и интегрированы с Microsoft Pluton для защиты от чипа до облака.
AMD ожидает более 150 приложений с поддержкой ИИ к концу 2024 года.
ИИ со-процессоры уже норма.
#AMD #RyzenPRO #WiFi7
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Instant NeRF от NVIDIA превращает 2D фото в 3D сцены
Компания NVIDIA представила Instant NeRF - технологию на базе ИИ, способную всего за несколько секунд преобразовывать обычные 2D фотографии в полноценные 3D сцены.
В основе лежит модель Neural Radiance Field (NeRF), интерполирующая между 2D изображениями для визуализации 3D пространства.
Благодаря оптимизациям и аппаратному ускорению на GPU, Instant NeRF работает в реальном времени на различных устройствах, от мобильных до десктопов.
Для быстрого старта доступны готовые наборы данных Neural Graphics Primitives, исходный код Instant-NGP и простой установщик для Windows.
Новое обновление позволяет погружаться в созданные 3D миры в виртуальной реальности.
Технология открывает новые возможности в таких сферах, как недвижимость, ритейл, и многих других.
Скоро каждый сможет создать собственную метавселенную из отпускных фоток. 😎👍
#NVIDIA #InstantNeRF #3D
-------
@tsingular
Компания NVIDIA представила Instant NeRF - технологию на базе ИИ, способную всего за несколько секунд преобразовывать обычные 2D фотографии в полноценные 3D сцены.
В основе лежит модель Neural Radiance Field (NeRF), интерполирующая между 2D изображениями для визуализации 3D пространства.
Благодаря оптимизациям и аппаратному ускорению на GPU, Instant NeRF работает в реальном времени на различных устройствах, от мобильных до десктопов.
Для быстрого старта доступны готовые наборы данных Neural Graphics Primitives, исходный код Instant-NGP и простой установщик для Windows.
Новое обновление позволяет погружаться в созданные 3D миры в виртуальной реальности.
Технология открывает новые возможности в таких сферах, как недвижимость, ритейл, и многих других.
Скоро каждый сможет создать собственную метавселенную из отпускных фоток. 😎👍
#NVIDIA #InstantNeRF #3D
-------
@tsingular
Stable Diffusion 3 доступен через API
Stability AI открыла доступ к Stable Diffusion 3 и Stable Diffusion 3 Turbo через API. 🎨
API реализовано на Fireworks AI.
В API есть режимы:
text2image
image2image
image2video
generate, upscale, edit
Цены - $10 за 1000 кредитов должно хватить примерно на 5тыс картинок.
В будущем веса модели станут доступны для самостоятельного размещения. 🚀
Новая архитектура Multimodal Diffusion Transformer (MMDiT) улучшает понимание текста и возможности генерации по сравнению с предыдущими версиями.
Отдельно идет закрытый тест Stable Assistant Beta.
#StabilityAI #API
-------
@tsingular
Stability AI открыла доступ к Stable Diffusion 3 и Stable Diffusion 3 Turbo через API. 🎨
API реализовано на Fireworks AI.
В API есть режимы:
text2image
image2image
image2video
generate, upscale, edit
Цены - $10 за 1000 кредитов должно хватить примерно на 5тыс картинок.
В будущем веса модели станут доступны для самостоятельного размещения. 🚀
Новая архитектура Multimodal Diffusion Transformer (MMDiT) улучшает понимание текста и возможности генерации по сравнению с предыдущими версиями.
Отдельно идет закрытый тест Stable Assistant Beta.
#StabilityAI #API
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Boston Dynamics представила новую, электрическую версию Atlas
Новый Atlas вобрал в себя десятилетия исследований и разработок в сфере роботов-гуманоидов и мобильной робототехники.
Электрический Atlas будет сильнее и обладать более широким диапазоном движений в сравнении с предыдущими поколениями.
Помимо аппаратной части, Boston Dynamics разрабатывает ПО, такое как Orbit - для управления парком роботов и интеграции ИИ.
Антропоморфная форма Atlas подходит для работы в мире, созданном для людей, но его движения будут превосходить человеческие возможности.
#BostonDynamics #Atlas #robotics
Новый Atlas вобрал в себя десятилетия исследований и разработок в сфере роботов-гуманоидов и мобильной робототехники.
Электрический Atlas будет сильнее и обладать более широким диапазоном движений в сравнении с предыдущими поколениями.
Помимо аппаратной части, Boston Dynamics разрабатывает ПО, такое как Orbit - для управления парком роботов и интеграции ИИ.
Антропоморфная форма Atlas подходит для работы в мире, созданном для людей, но его движения будут превосходить человеческие возможности.
Технологическая сингулярность: невероятный тревожный и вдохновляющий этап развития технологий и искусственного интеллекта опережающий способности человечества полноценно осознать и адаптироваться к ним, вызывая неизбежный переворот в понимании мира и представлении о границах возможного.
#BostonDynamics #Atlas #robotics
Forwarded from Ppprompt | Sexy AI Prompts & Experiments | by @ponchiknews
This media is not supported in your browser
VIEW IN TELEGRAM
Google Deepmind представили ALOHA Unleashed - новое поколение недорогих автономных роботов на базе ИИ
В серии видеороликов роботы показали, как они могут вешать рубашки, заменять детали у других роботов и даже завязывать шнурки (в этом еще надо попрактиковаться)). Видео были сняты одним кадром, без редактирования.
В будущем подобных роботов можно будет использовать в промышленности и повседневной жизни.
@ppprompt
В серии видеороликов роботы показали, как они могут вешать рубашки, заменять детали у других роботов и даже завязывать шнурки (в этом еще надо попрактиковаться)). Видео были сняты одним кадром, без редактирования.
В будущем подобных роботов можно будет использовать в промышленности и повседневной жизни.
@ppprompt
Forwarded from Точка сингулярности💥
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Китайская компания UBTech заключила партнерского соглашение с Baidu.Теперь её андроид Walker S оснащен мультимодальной платформой искусственного интеллекта ERNIE Bot.
Это позволяет боту понимать команды на китайском языке, отвечать на них и выполнять различные задачи, такие как складывание футболки или перемещение предметов.
🧩 #РоботыВокругНас
Это позволяет боту понимать команды на китайском языке, отвечать на них и выполнять различные задачи, такие как складывание футболки или перемещение предметов.
🧩 #РоботыВокругНас
Похоже что StableDiffusion3 догнал по качеству Dalle3.
Добавил его в бота
@Cloud_GPT_bot
теперь на 1 запрос выдаёт 2 картинки.
одну от Дали и вторую от SD
Интересно, что замок в горах обе модели отрисовали по образу Нойшванштайна :)
#text2Image #bot #StableDiffusion
———
@tsingular
Добавил его в бота
@Cloud_GPT_bot
теперь на 1 запрос выдаёт 2 картинки.
одну от Дали и вторую от SD
Интересно, что замок в горах обе модели отрисовали по образу Нойшванштайна :)
#text2Image #bot #StableDiffusion
———
@tsingular
🔥1
WizardLM-2: новое поколение языковых моделей от Microsoft AI
Microsoft AI анонсировала WizardLM-2 - новую серию усовершенствованных языковых моделей.
Модели демонстрируют улучшенную производительность в сложных чатах, многоязычных задачах, рассуждениях и работе агентов.
Серия включает три модели:
- WizardLM-2 8x22B - самая продвинутая, превосходит лучшие открытые модели.
- WizardLM-2 70B - лучшие возможности рассуждения в своем размере.
- WizardLM-2 7B - самая быстрая, сопоставима с моделями в 10 раз больше.
Теперь и у Microsoft есть свои открытые языковые модели. Конкуренция - рулит! 🚀
#WizardLM #Microsoft #NLP
-------
@tsingular
Microsoft AI анонсировала WizardLM-2 - новую серию усовершенствованных языковых моделей.
Модели демонстрируют улучшенную производительность в сложных чатах, многоязычных задачах, рассуждениях и работе агентов.
Серия включает три модели:
- WizardLM-2 8x22B - самая продвинутая, превосходит лучшие открытые модели.
- WizardLM-2 70B - лучшие возможности рассуждения в своем размере.
- WizardLM-2 7B - самая быстрая, сопоставима с моделями в 10 раз больше.
Теперь и у Microsoft есть свои открытые языковые модели. Конкуренция - рулит! 🚀
#WizardLM #Microsoft #NLP
-------
@tsingular
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
VASA-1: Прорыв в генерации реалистичных видео с виртуальными персонажами
Исследователи из Microsoft Research Asia представили новый фреймворк VASA-1 для генерации реалистичных говорящих лиц виртуальных персонажей на основе одного статического изображения и аудиозаписи речи.
Ключевые особенности VASA-1:
- Точная синхронизация движений губ с аудио
- Реалистичная мимика лица, отражающая широкий спектр эмоций и нюансов
- Естественные движения головы
- Генерация видео высокого качества (512x512) в режиме реального времени (до 40 кадров/с) с минимальной задержкой
Основные инновации включают целостную модель генерации динамики лица и движений головы в скрытом пространстве, а также разработку такого выразительного скрытого пространства с помощью обучения на видео.
Метод значительно превосходит предыдущие подходы по различным показателям и позволяет управлять направлением взгляда, расстоянием до головы и эмоциональной окраской.
VASA-1 демонстрирует хорошую работу на данных, выходящих за рамки обучающей выборки (художественные фото, пение, речь на других языках).
Разделение скрытого представления на внешность, 3D позу головы и динамику лица дает возможность раздельно редактировать эти атрибуты в сгенерированном видео.
#VASA1 #VirtualAvatars #VideoGeneration
Исследователи из Microsoft Research Asia представили новый фреймворк VASA-1 для генерации реалистичных говорящих лиц виртуальных персонажей на основе одного статического изображения и аудиозаписи речи.
Ключевые особенности VASA-1:
- Точная синхронизация движений губ с аудио
- Реалистичная мимика лица, отражающая широкий спектр эмоций и нюансов
- Естественные движения головы
- Генерация видео высокого качества (512x512) в режиме реального времени (до 40 кадров/с) с минимальной задержкой
Основные инновации включают целостную модель генерации динамики лица и движений головы в скрытом пространстве, а также разработку такого выразительного скрытого пространства с помощью обучения на видео.
Метод значительно превосходит предыдущие подходы по различным показателям и позволяет управлять направлением взгляда, расстоянием до головы и эмоциональной окраской.
VASA-1 демонстрирует хорошую работу на данных, выходящих за рамки обучающей выборки (художественные фото, пение, речь на других языках).
Разделение скрытого представления на внешность, 3D позу головы и динамику лица дает возможность раздельно редактировать эти атрибуты в сгенерированном видео.
#VASA1 #VirtualAvatars #VideoGeneration
🔥3❤1
Forwarded from Сиолошная
Ждём LLAMA 3 сегодня? 🚨
Уже на двух площадках засветились новые модели — сайт Replicate для развёртывания моделей и Microsoft Azure, один из крупнейших облачных провайдеров. На обоих указана версия модели на 8B параметров (против общепринятых 7), а на первом ещё есть 70B версия. Согласно утечкам, планируется сначала выпустить две модели «меньшего размера» — 70B не очень-то в это вписывается! Или, быть может, они готовят титана 150B+? Поживём - увидим.
Сейчас в Калифорнии почти 8 утра🚬 возможно, официальный анонс будет в ближайшие 4 часа.
Главных вопроса два:
— будут ли эти модели хоть как-то лучше оных от Mistral и Cohere?
— будет ли опубликована статья с техническими деталями процесса обучения?
В опросе ниже можно делать ставки!
Уже на двух площадках засветились новые модели — сайт Replicate для развёртывания моделей и Microsoft Azure, один из крупнейших облачных провайдеров. На обоих указана версия модели на 8B параметров (против общепринятых 7), а на первом ещё есть 70B версия. Согласно утечкам, планируется сначала выпустить две модели «меньшего размера» — 70B не очень-то в это вписывается! Или, быть может, они готовят титана 150B+? Поживём - увидим.
Сейчас в Калифорнии почти 8 утра
Главных вопроса два:
— будут ли эти модели хоть как-то лучше оных от Mistral и Cohere?
— будет ли опубликована статья с техническими деталями процесса обучения?
В опросе ниже можно делать ставки!
Please open Telegram to view this post
VIEW IN TELEGRAM
Llama 3: передовая открытая языковая модель
Представлена Llama 3 - новое поколение мощных открытых языковых моделей с 8 и 70 миллиардами параметров.
Цель - создать лучшие открытые модели, сравнимые с ведущими проприетарными решениями.
Улучшения: усовершенствованный токенизатор, групповое внимание запросов (GQA), обучение на длинных последовательностях.
Обучение на более 15 триллионах токенов, включая данные на 30+ языках, с масштабированием на 24576 ГПУ H100.
Применена инструкционная настройка с управляемой тонкой настройкой и оптимизацией политики.
Внедрена система ответственного развертывания с инструментами безопасности и доверия.
Llama 3 доступна на всех основных платформах, включая облачных провайдеров и API.
Планируется выпуск более крупных моделей Llama 3 с мультимодальностью, мультиязычностью и длинным контекстным окном.
https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6
https://llama3.replicate.dev/
Теперь нужно железо, которое это вытащит
#Llama3 #OpenSource #LLM
-------
@tsingular
Представлена Llama 3 - новое поколение мощных открытых языковых моделей с 8 и 70 миллиардами параметров.
Цель - создать лучшие открытые модели, сравнимые с ведущими проприетарными решениями.
Улучшения: усовершенствованный токенизатор, групповое внимание запросов (GQA), обучение на длинных последовательностях.
Обучение на более 15 триллионах токенов, включая данные на 30+ языках, с масштабированием на 24576 ГПУ H100.
Применена инструкционная настройка с управляемой тонкой настройкой и оптимизацией политики.
Внедрена система ответственного развертывания с инструментами безопасности и доверия.
Llama 3 доступна на всех основных платформах, включая облачных провайдеров и API.
Планируется выпуск более крупных моделей Llama 3 с мультимодальностью, мультиязычностью и длинным контекстным окном.
https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6
https://llama3.replicate.dev/
Теперь нужно железо, которое это вытащит
#Llama3 #OpenSource #LLM
-------
@tsingular