Apple представила MGIE - прорыв в редактировании изображений с ИИ
Компания Apple выпустила в открытый доступ модель ИИ под названием MGIE (MLLM-Guided Image Editing), которая позволяет редактировать изображения по естественным языковым инструкциям.
MGIE использует мультимодальные LLM (MLLMs) для интерпретации команд пользователя и отрисовки графики.
Модель способна обрабатывать различные аспекты редактирования, включая модификацию в стиле Photoshop, глобальную оптимизацию фотографий и редактирование определённых областей.
MGIE - результат совместной работы Apple и исследователей из Университета Калифорнии в Санта-Барбаре.
Проект доступен на GitHub с кодом, данными и предварительно обученными моделями.
Пользователи могут опробовать MGIE онлайн через веб-демо на Hugging Face Spaces.
Вспоминается сцена из Bladerunner по разбору фото с отражением.
#Apple #MGIE #ИИ
Компания Apple выпустила в открытый доступ модель ИИ под названием MGIE (MLLM-Guided Image Editing), которая позволяет редактировать изображения по естественным языковым инструкциям.
MGIE использует мультимодальные LLM (MLLMs) для интерпретации команд пользователя и отрисовки графики.
Модель способна обрабатывать различные аспекты редактирования, включая модификацию в стиле Photoshop, глобальную оптимизацию фотографий и редактирование определённых областей.
MGIE - результат совместной работы Apple и исследователей из Университета Калифорнии в Санта-Барбаре.
Проект доступен на GitHub с кодом, данными и предварительно обученными моделями.
Пользователи могут опробовать MGIE онлайн через веб-демо на Hugging Face Spaces.
Вспоминается сцена из Bladerunner по разбору фото с отражением.
#Apple #MGIE #ИИ
Робопес Spot на службе у полиции Массачусетса
Полиция Массачусетса использовала робособаку Spot от Boston Dynamics на месте стрельбы в Данверсе.
Spot входит в арсенал отряда по обезвреживанию бомб.
Робота часто применяют при заложниках или в случаях с забаррикадированными подозреваемыми.
У Spot есть способности открывать двери и подниматься по лестницам.
Также робособаку используют для осмотра подозрительных посылок и обеспечения безопасности в местах массового скопления людей.
Цель Spot - защита людей, помощь спасателям в анализе опасных ситуаций.
Boston Dynamics запрещает вооружать своих роботов и поддерживает этичное применение.
Компания является спонсором законопроекта в Массачусетсе о ответственном использовании робототехники.
При принятии он станет первым таким законом в США.
До Робокопа осталось 3.2.1...
#Spot #BostonDynamics #Robocop
Полиция Массачусетса использовала робособаку Spot от Boston Dynamics на месте стрельбы в Данверсе.
Spot входит в арсенал отряда по обезвреживанию бомб.
Робота часто применяют при заложниках или в случаях с забаррикадированными подозреваемыми.
У Spot есть способности открывать двери и подниматься по лестницам.
Также робособаку используют для осмотра подозрительных посылок и обеспечения безопасности в местах массового скопления людей.
Цель Spot - защита людей, помощь спасателям в анализе опасных ситуаций.
Boston Dynamics запрещает вооружать своих роботов и поддерживает этичное применение.
Компания является спонсором законопроекта в Массачусетсе о ответственном использовании робототехники.
При принятии он станет первым таким законом в США.
До Робокопа осталось 3.2.1...
#Spot #BostonDynamics #Robocop
Хайтек+
ИИ расшифровал считавшийся потерянным для науки древнеримский свиток Трое студентов, вооружённых нейросетями, расшифровали первый манускрипт из библиотеки в Геркулануме. За это они получили главный приз Vesuvius Challenge — $700 тысяч. Текст принадлежит перу…
вдогонку:
Илон Маск воскрешает историю
Илон Маск финансирует проект с ИИ для читения древних свитков.
Проект Vesuvius Challenge нацелен на свитки, разрушенные вулканом Везувий.
Финансирование осуществляется Musk Foundation.
В прошлом году удалось прочесть часть свитка, вложено $700 000.
План: потратить $2 млн на чтение всех свитков, до $10 млн на общий проект.
Свитки, найденные в 18 веке, известны как Геркуланские папирусы.
Цель 2024 года - прочесть 90% четырех свитков, заложить основу для чтения всех 800.
Маск создал компанию xAI для понимания реальности.
xAI стремится привлечь $6 млрд инвестиций при оценке в $20 млрд.
Интересно что же там вычитают в итоге...
#ИлонМаск #VesuviusChallenge #xAI
Илон Маск воскрешает историю
Илон Маск финансирует проект с ИИ для читения древних свитков.
Проект Vesuvius Challenge нацелен на свитки, разрушенные вулканом Везувий.
Финансирование осуществляется Musk Foundation.
В прошлом году удалось прочесть часть свитка, вложено $700 000.
План: потратить $2 млн на чтение всех свитков, до $10 млн на общий проект.
Свитки, найденные в 18 веке, известны как Геркуланские папирусы.
Цель 2024 года - прочесть 90% четырех свитков, заложить основу для чтения всех 800.
Маск создал компанию xAI для понимания реальности.
xAI стремится привлечь $6 млрд инвестиций при оценке в $20 млрд.
Интересно что же там вычитают в итоге...
#ИлонМаск #VesuviusChallenge #xAI
PYMNTS.com
Elon Musk to Back Project Using AI to Read Ancient Scrolls | PYMNTS.com
Elon Musk offered financial support to a project that aims to use artificial intelligence to read ancient Roman scrolls that were damaged by a volcano’s
Forwarded from GPT/ChatGPT/AI Central Александра Горного
This media is not supported in your browser
VIEW IN TELEGRAM
Boston Dynamics показал практическое применение своего робота Atlas
На видео Atlas достает из ящика тяжелые автомобильные детали и раскладывает их по полкам.
—
RoundBook — обзор мировых инвестиций в стартапы
На видео Atlas достает из ящика тяжелые автомобильные детали и раскладывает их по полкам.
—
RoundBook — обзор мировых инвестиций в стартапы
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Любопытное применение шлему Vision Pro: можно навигировать в темноте, как куплю свой (в ЕС еще не продают) обязательно проверю в полной темноте
Автор
Автор
🔥1
Осло закупило лицензии Chat GPT для школьников и учителей
Осло приобрело Chat GPT для 110 000 учащихся и учителей.
Внедрение требует пересмотра подходов к обучению и оценке знаний.
Ученики уже имели доступ к технологии через смартфоны, но теперь это оформлено официально.
Главная цель - подготовить молодёжь к вызовам будущего.
Строгие правила использования обеспечивают этичность применения Chat GPT.
Существуют опасения, что доступ только к GPT 3.5-Turbo создаст неравенство среди пользователей.
GPT-4 представлен как продвинутая версия, но доступна за дополнительную плату.
Умные школы для умного будущего.
#Oslo #ChatGPT #Education
Осло приобрело Chat GPT для 110 000 учащихся и учителей.
Внедрение требует пересмотра подходов к обучению и оценке знаний.
Ученики уже имели доступ к технологии через смартфоны, но теперь это оформлено официально.
Главная цель - подготовить молодёжь к вызовам будущего.
Строгие правила использования обеспечивают этичность применения Chat GPT.
Существуют опасения, что доступ только к GPT 3.5-Turbo создаст неравенство среди пользователей.
GPT-4 представлен как продвинутая версия, но доступна за дополнительную плату.
Умные школы для умного будущего.
#Oslo #ChatGPT #Education
🕊1
Google DeepMind представляет самоосознание ИИ
Исследователи из Google DeepMind и Университета Южной Калифорнии предложили механизм самоосознания (self-discover) для усиления способностей к рассуждениям у LLM.
Подход улучшает производительность существующих моделей, включая GPT-4 от OpenAI и PaLM 2 от Google, на сложных задачах требующих рассуждений.
LLM самостоятельно определяют структуру рассуждений, необходимую для решения задачи, что требует в 10-40 раз меньше вычислительной мощности.
Применение метода 'самоосознания' показало улучшение результата в 21 из 25 задач по сравнению с другими техниками, с приростом результативности в 32%.
Этот подход способен значительно продвинуть LLM в сторону общего интеллекта и улучшить решение задач.
семимильными шагами к AGI летим.
#GoogleDeepMind #ИИ #Самоосознание
Исследователи из Google DeepMind и Университета Южной Калифорнии предложили механизм самоосознания (self-discover) для усиления способностей к рассуждениям у LLM.
Подход улучшает производительность существующих моделей, включая GPT-4 от OpenAI и PaLM 2 от Google, на сложных задачах требующих рассуждений.
LLM самостоятельно определяют структуру рассуждений, необходимую для решения задачи, что требует в 10-40 раз меньше вычислительной мощности.
Применение метода 'самоосознания' показало улучшение результата в 21 из 25 задач по сравнению с другими техниками, с приростом результативности в 32%.
Этот подход способен значительно продвинуть LLM в сторону общего интеллекта и улучшить решение задач.
семимильными шагами к AGI летим.
#GoogleDeepMind #ИИ #Самоосознание
🤔1
Forwarded from эйай ньюз
Там Google подвез Gemini Ultra в прод. И, конечно, небесплатно, ведь моделька жирная, дорогая.
У меня просят 22 евро в месяц, но к этому ещё идёт 2TB на Google Drive и прочие ништяки типа интеграции LLM с почтой и календарем в будущем. Проапгрейдится можно тут.
Gemini Ultra бьёт GPT-4 на 7 из 8 бенчмарках по тексту и на всех бенчмарках по зрению, если сравнивать с GPT-4V.
Что ж, бенчмарки — это хорошо, и появление серьезной конкуренции для GPT-4 не может не радовать. Однако, бенчмарки имеют свойство попадать в тренировочную выборку, особенно когда речь идёт о триллионах токенов со всего интернета. Так что посмотрим, как Ultra покажет себя на практике, когда тысячи людей протестируют её.🤔
@ai_newz
У меня просят 22 евро в месяц, но к этому ещё идёт 2TB на Google Drive и прочие ништяки типа интеграции LLM с почтой и календарем в будущем. Проапгрейдится можно тут.
Gemini Ultra бьёт GPT-4 на 7 из 8 бенчмарках по тексту и на всех бенчмарках по зрению, если сравнивать с GPT-4V.
Что ж, бенчмарки — это хорошо, и появление серьезной конкуренции для GPT-4 не может не радовать. Однако, бенчмарки имеют свойство попадать в тренировочную выборку, особенно когда речь идёт о триллионах токенов со всего интернета. Так что посмотрим, как Ultra покажет себя на практике, когда тысячи людей протестируют её.
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Stable Diffusion WebUI Forge
Тут вчера вышел полностью переписанный Automatic1111. Сделал это никто иной как Лвмин Жанг, автор ControlNet и Fooocus.
Просто взял и переписал этого монстра с целью оптимизации просчета на картах с небольшим количеством памяти. Веб-морда и привычный ацкий интерфейс остались на месте. Грубо говоря, он взял наработки из Фокуса по оптимизации просчета и вструмил их вместо ядра автоматика.
И теперь бодрый легкий автоматик заводится на картах типа 1060 и считает на них модели ветки SDXL, а полторашка там просто летает.
Обещана поддержка всех экстеншенов (есть некоторое визги по этому поводу на гитхабе - кое-что отваливается, кое-что (AnimDiff) в работе).
Более того, для нормальных людей есть просто однокнопочный инсталлер (скачиваешь архив, распаковываешь в папку, запускаешь update, потом run).
Это не решает проблему адового интерфейса Автоматика (да и Фокуса), но у меня все работает как будто я обновил комп - быстро, без тормозов.
Я напишу результаты тестов, он реально быстрее старого Автоматика, но не поддерживает оптимизацию sdp для карт с конским количеством памяти типа A100.
И самое приколькое оказалось, что туда уже нативно добавлена поддержка Stable Video Diffusion и Z123 от StabilityAI. Просто отдельные закладки. И даже можно генерить видосы у себя на лаптопе на карте с 8Гб видео-памяти.
Ну и там в интерфейс "прочищен", появились просто удобные легкие элементы, типа выключателя Refiner. Также там наворотили новых кунштюков в ControlNet, но это тема для отдельного поста.
А пока вот так.
Если вы используете обычный GPU, например 8GB vram, вы можете рассчитывать на 30~45% увеличение скорости вывода (it/s)
Для малохольного GPU, например с 6 Гбайт, вы можете рассчитывать на 60-75 % увеличение скорости
Для 4090 с 24 ГБ памяти, вы можете рассчитывать на 3~6% увеличение скорости
Если вы используете ControlNet для SDXL, максимальное количество ControlNetов увеличится примерно в 2 раза, скорость с SDXL+ControlNet увеличится примерно на 30~45%.
Забирайте отсюда
Тут вчера вышел полностью переписанный Automatic1111. Сделал это никто иной как Лвмин Жанг, автор ControlNet и Fooocus.
Просто взял и переписал этого монстра с целью оптимизации просчета на картах с небольшим количеством памяти. Веб-морда и привычный ацкий интерфейс остались на месте. Грубо говоря, он взял наработки из Фокуса по оптимизации просчета и вструмил их вместо ядра автоматика.
И теперь бодрый легкий автоматик заводится на картах типа 1060 и считает на них модели ветки SDXL, а полторашка там просто летает.
Обещана поддержка всех экстеншенов (есть некоторое визги по этому поводу на гитхабе - кое-что отваливается, кое-что (AnimDiff) в работе).
Более того, для нормальных людей есть просто однокнопочный инсталлер (скачиваешь архив, распаковываешь в папку, запускаешь update, потом run).
Это не решает проблему адового интерфейса Автоматика (да и Фокуса), но у меня все работает как будто я обновил комп - быстро, без тормозов.
Я напишу результаты тестов, он реально быстрее старого Автоматика, но не поддерживает оптимизацию sdp для карт с конским количеством памяти типа A100.
И самое приколькое оказалось, что туда уже нативно добавлена поддержка Stable Video Diffusion и Z123 от StabilityAI. Просто отдельные закладки. И даже можно генерить видосы у себя на лаптопе на карте с 8Гб видео-памяти.
Ну и там в интерфейс "прочищен", появились просто удобные легкие элементы, типа выключателя Refiner. Также там наворотили новых кунштюков в ControlNet, но это тема для отдельного поста.
А пока вот так.
Если вы используете обычный GPU, например 8GB vram, вы можете рассчитывать на 30~45% увеличение скорости вывода (it/s)
Для малохольного GPU, например с 6 Гбайт, вы можете рассчитывать на 60-75 % увеличение скорости
Для 4090 с 24 ГБ памяти, вы можете рассчитывать на 3~6% увеличение скорости
Если вы используете ControlNet для SDXL, максимальное количество ControlNetов увеличится примерно в 2 раза, скорость с SDXL+ControlNet увеличится примерно на 30~45%.
Забирайте отсюда
👍1👀1
Gemini проигрывает GPT4 в Логике
Вы стоите перед закрытой комнатой. Внутри помещения есть 1 лампочка накаливания. Окна и щели, чтобы разглядеть свет внутри комнаты, отсутствуют.
Справа от двери ведущей в комнату установлено 3 переключателя, которые находятся в положении «выкл», но только один из них подключен к лампе. Нужно узнать, какой переключатель включает лампочку, но при этом зайти в комнату можно только 1 раз.
Примечание: менять положение переключателей разрешено неограниченное количество раз.
картинка с GPT4, а вот ответ Gemini:
## Решение задачи:
1. Включите первый переключатель и оставьте его включенным на 10-15 минут.
2. Выключите первый переключатель и включите второй.
3. Зайдите в комнату.
4. Если лампочка:
* Горячая: Задействован первый переключатель.
* Теплая: Задействован второй переключатель. <— ОШИБКА. Должен быть чек Горит/Не горит-
* Холодная: Задействован третий переключатель.
Объяснение:
* Первый этап: Включение первого переключателя на 10-15 минут нагреет лампочку, если она подключена к этому переключателю.
* Второй этап: Выключение первого и включение второго переключателя меняет состояние лампочки, подключенной к второму переключателю.
* Третий этап: Осмотр лампочки позволяет определить, какой из переключателей был к ней подключен:
* Горячая: Лампочка, нагретая на первом этапе, остывает не сразу.
* Теплая: Лампочка, подключенная ко второму переключателю, нагрелась за время, пока он был включен. <—ОШИБКА.
* Холодная: Третий переключатель не был подключен к лампочке.
Дополнительные сведения:
* Неважно, в каком порядке вы будете включать и выключать переключатели на первом и втором этапе.
* Если лампочка не горит ни в одном из случаев, возможно, она перегорела или в электросети есть проблемы.
## Варианты решения:
Существуют и другие методы решения этой задачи, но данный метод является одним из самых простых и надежных.
## Примечание:
* Будьте осторожны при работе с электричеством.
* Если вы не уверены в своих силах, обратитесь к электрику.
Вы стоите перед закрытой комнатой. Внутри помещения есть 1 лампочка накаливания. Окна и щели, чтобы разглядеть свет внутри комнаты, отсутствуют.
Справа от двери ведущей в комнату установлено 3 переключателя, которые находятся в положении «выкл», но только один из них подключен к лампе. Нужно узнать, какой переключатель включает лампочку, но при этом зайти в комнату можно только 1 раз.
Примечание: менять положение переключателей разрешено неограниченное количество раз.
картинка с GPT4, а вот ответ Gemini:
## Решение задачи:
1. Включите первый переключатель и оставьте его включенным на 10-15 минут.
2. Выключите первый переключатель и включите второй.
3. Зайдите в комнату.
4. Если лампочка:
* Горячая: Задействован первый переключатель.
* Теплая: Задействован второй переключатель. <— ОШИБКА. Должен быть чек Горит/Не горит-
* Холодная: Задействован третий переключатель.
Объяснение:
* Первый этап: Включение первого переключателя на 10-15 минут нагреет лампочку, если она подключена к этому переключателю.
* Второй этап: Выключение первого и включение второго переключателя меняет состояние лампочки, подключенной к второму переключателю.
* Третий этап: Осмотр лампочки позволяет определить, какой из переключателей был к ней подключен:
* Горячая: Лампочка, нагретая на первом этапе, остывает не сразу.
* Теплая: Лампочка, подключенная ко второму переключателю, нагрелась за время, пока он был включен. <—ОШИБКА.
* Холодная: Третий переключатель не был подключен к лампочке.
Дополнительные сведения:
* Неважно, в каком порядке вы будете включать и выключать переключатели на первом и втором этапе.
* Если лампочка не горит ни в одном из случаев, возможно, она перегорела или в электросети есть проблемы.
## Варианты решения:
Существуют и другие методы решения этой задачи, но данный метод является одним из самых простых и надежных.
## Примечание:
* Будьте осторожны при работе с электричеством.
* Если вы не уверены в своих силах, обратитесь к электрику.
Forwarded from Точка сингулярности💥
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Многообещающее приложение медицинской визуализации в Apple Vision Pro. 2D-снимки с КТ и МРТ превращаются в 3D-визуализацию.
Ранее Apple обсуждали с сотрудниками, что у гарнитуры есть перспективы в здравоохранении — например, в хирургии. В США первый медицинский центр уже закупил 30 #VisionPro для врачей.
🧩 #МедИцИна
Ранее Apple обсуждали с сотрудниками, что у гарнитуры есть перспективы в здравоохранении — например, в хирургии. В США первый медицинский центр уже закупил 30 #VisionPro для врачей.
🧩 #МедИцИна
Forwarded from Ppprompt | Sexy AI Prompts & Experiments | by @ponchiknews
🧑⚖️ Правительство США объединило 200 компаний в консорциум по безопасности AI
Не так давно Байден подписал приказ, суть которого сводится к тому, с безопасностью AI надо что-то срочно делать. Для начала правительство решило [надо сказать, довольно разумно] собрать всех умных ребят в одной комнате.
Правда комната нужна немаленькая — на представителей 200 компаний, банков, гос-органов и университетов, которые что-то делают в области AI.
Обратите внимание, как широко распространился AI внутри корпораций за последние ~1..5 — 2 года, когда плоды и продуктивность его стали всем очевидны.
🔗 Полный список (PDF)
@ppprompt
Не так давно Байден подписал приказ, суть которого сводится к тому, с безопасностью AI надо что-то срочно делать. Для начала правительство решило [надо сказать, довольно разумно] собрать всех умных ребят в одной комнате.
Правда комната нужна немаленькая — на представителей 200 компаний, банков, гос-органов и университетов, которые что-то делают в области AI.
Обратите внимание, как широко распространился AI внутри корпораций за последние ~1..5 — 2 года, когда плоды и продуктивность его стали всем очевидны.
@ppprompt
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Постепенно вступаем во вселенную Терминатора, осталось Скайнет и туточки
https://youtu.be/iHXuU3nTXfQ
https://youtu.be/iHXuU3nTXfQ
YouTube
All Neural Networks. All Autonomous. All 1X speed | 1X AI Update
#1X #humanoid #EmbodiedAI
All Neural Networks. All Autonomous. All 1X speed. This video contains no teleoperation, no computer graphics, no cuts, no video speedups, no scripted trajectory playback. It's all controlled via neural networks. Learn more on…
All Neural Networks. All Autonomous. All 1X speed. This video contains no teleoperation, no computer graphics, no cuts, no video speedups, no scripted trajectory playback. It's all controlled via neural networks. Learn more on…
🔥1
Автоматизация страховых претензий с Amazon Bedrock
Детальный разбор обработки страховых запросов с ИИ на Amazon Bedrock.
Описано пошаговое создание специализированных агентов по обработке жизненного цикла страховых претензий.
Интеграция с клиентскими данными через базы знаний.
Тестирование агентов помогает оценить качество ответов и соответствие инструкциям.
Streamlit используется для создания интерфейсов при внедрении в работу.
AWS вообще кладезь пошаговых инструкций по интеграции ИИ в бизнес-процессы.
#AI #AmazonBedrock #Streamlit
Детальный разбор обработки страховых запросов с ИИ на Amazon Bedrock.
Описано пошаговое создание специализированных агентов по обработке жизненного цикла страховых претензий.
Интеграция с клиентскими данными через базы знаний.
Тестирование агентов помогает оценить качество ответов и соответствие инструкциям.
Streamlit используется для создания интерфейсов при внедрении в работу.
AWS вообще кладезь пошаговых инструкций по интеграции ИИ в бизнес-процессы.
#AI #AmazonBedrock #Streamlit
👍1
США запрещают звонки роботов с голосами, созданными ИИ
FCC объявляет о запрете на использование ИИ в робозвонках для предотвращения мошенничества.
Компаниям, нарушающим правило, грозит штраф до $23 000 за звонок.
Граждане могут получить компенсацию до $1500 за каждый входящий мошеннический звонок.
Life Corp и Lingo Telecom были идентифицированы как источники мошеннических звонков в Нью-Гэмпшире и были оштрафованы.
Зачёт.
#FCC #AI #Robocalls
FCC объявляет о запрете на использование ИИ в робозвонках для предотвращения мошенничества.
Компаниям, нарушающим правило, грозит штраф до $23 000 за звонок.
Граждане могут получить компенсацию до $1500 за каждый входящий мошеннический звонок.
Life Corp и Lingo Telecom были идентифицированы как источники мошеннических звонков в Нью-Гэмпшире и были оштрафованы.
Зачёт.
#FCC #AI #Robocalls