Технозаметки Малышева

MagicAnimate обученная на TikTok и TED видео оживляет картины и персонажей

Новый инструмент MagicAnimate превращает статичные изображения в анимированные сцены.

Точное и согласованное движение персонажей отличает MagicAnimate от базовых решений.

Уникальная возможность анимирования разноплановых объектов: от фото до картин.

MagicAnimate работает даже с изображениями, созданными в DALLE3.

Поддерживается анимация групп персонажей, следующих общему движению.

Теперь любая картинка может стать частью анимированной истории.

#MagicAnimate #TikTok #Animation

65 viewsedited 21:30

Forwarded from GeekNeural: IT & Нейросети

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Нейронка от KREA апскейлнула вышедший в продажу Cybertruck.

Получилось лучше оригинала, а это даже не на максимальных параметрах. Повторить можно тут.

GeekNeural | #Interesting

❤‍🔥1

71 views06:06

Технозаметки Малышева

Салют, GigaChat! Речевые технологии и большие языковые модели

Сбербанк добился значительного прогресса в ИИ.

Гигачат, - разработан самостоятельно с 0 за год до уровня GPT 3.5!!! - Абсолютный рекспект.
Есть – модели с 7 и 29 млрд параметров.
Используется оптимизатор Adam с 1e-8 для лучшей сходимости модели.
Оптимизация этого параметра оказалась критична для эффективности обучения по сравнению с 1e-5.
Удалось сократить время обучения с 2 недель до 5 дней.
Перелопатили кучу багов в опенсурсе и оптимизировали пайплайны - получили значительный выигрыш во времени в том числе за счёт ускорения перезапуска инстансов в случае отказа GPU, которых тысячи.
Внедрен синхронный Garbage Collection для управления памятью ГПУ.

Анонсированы бесплатные открытые модели, ну и много интересных деталей как именно разрабатываются LLMки, распознавание голоса и эмоций и генерация достоверного голоса - это надо слушать.
В генерации голоса разница очень ощутима.

#GigaChat #AI #SberDevices

🔥2👍1

83 viewsedited 08:36

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

А теперь реальный нейрорендеринг.
Ох, щас наброшу интересную тему.

Айфон сам решает, что вы должны увидеть на фото или почему фотография уже давно не отражает этот мир, а представляет собой метаверс, преломленный в мозгах нейрочипов.

Подруга невесты сфоткала последнюю на айфон. И получила три разных невесты. На одном снимке.

Стоя перед двумя большими зеркалами, отражение невесты не отражает ту позу, которую она принимает, и мало того, оба отражения отличаются друг от друга и от той позы, которую невеста принимала на самом деле.

В то время как невеста держала одну руку вверх, а другую вниз, отражение слева видит, что она держит обе руки вниз, а отражение справа - что она держит обе руки на талии.

"Это реальная фотография, не отфотошопленная, не панорамный снимок, не Live Photo", - пишет невеста в своей инсте.

Невеста в ярости идет в Apple Store, где ей рассказывают, что айфончик на деле делает серию снимков, а потом не просто выбирает лучший, а сшивает их в одну фотку.

Ну то есть айфончик решил, что в одном зеркале невесте к лицу одна поза, в другом - другая поза, а как там она выглядит или держит руки ему насрать. Ибо бьютификация - всё, а реальный уродливый мир - отстой и ничто.

Понятно, что вычислительная фотография давно уже не отражает реальный мир (вот почитайте огромную работу Димы Ватолина, где на фотках появляются неожиданные персонажи в результате апскейла).

Но этот кейс потрясающе выпукло демонстрирует нам факт, что мы давно уже полагаемся на ИИ в гораздо более широком круге вопросов, чем думаем.

Если у вас есть другие объяснения происходящего или годные теории заговора, пишите в коменты.

🤣1

68 views13:04

Технозаметки Малышева

Forwarded from Точка сингулярности💥

🧬 YandexGPT API теперь станет платным!

Доступ к YandexGPT через API перейдет в стадию Public Preview и станет платным 6 декабря. Тарифы будут опубликованы в ближайшее время. Письма об этом получили пользователи API.

Также API получит новый функционал. Сегодня уже доступно:

— Эмбеддинги: способ представления текста в виде числовых векторов.

— Возможность дообучения в Yandex DataSphere на пользовательских данных. Это может быть полезно, например, при работе со специфическими понятиями и терминами.

— YandexGPT 2. Бизнесу доступна новая нейросеть, которая намного лучше справляется со стилизацией, пересказом и анализом, созданием текстов и ответами на вопросы.

— Режим чата: теперь в ходе текстового диалога с пользователем YandexGPT API помнит контекст.

🧩 #AINews

67 views14:21

Технозаметки Малышева

Ехал Грека через реку,
видит Грека в реке рак.
Сунул Грека руку в реку,
Вместе смотрят на закат

Скоро в боте появится рисовалка сюжетов по 1 запросу.
Сможет например рисовать сны, сам разбивая их на сюжетные блоки.

74 views18:55

Технозаметки Малышева

SeamlessM4T революционизирует многоязычный перевод

Представлена новая мультифункциональная модель SeamlessM4T для перевода речи и текста.
Модель позволяет общаться на почти 100 языках, объединяя в себе их мгновенный перевод и транскрибацию.
Высокая производительность для малоресурсных языков и качественный перевод для языков с широким ресурсом, включая английский и немецкий.
Не требует отдельной модели для идентификации исходного языка - автоматически адаптируется.
Основана на передовых проектах No Language Left Behind, Universal Speech Translator и Massively Multilingual Speech.
Использует продвинутый самообучающийся энкодер w2v-BERT 2.0 и текстовую модель NLLB.
Точность переводов оценивается через улучшенный инструмент BLASER 2.0.
Включает меры безопасности для предотвращения токсичности и предвзятости в переводах.

Обновление открытой модели.

#SeamlessM4T #Translation #Multilingual

🔥1

74 viewsedited 05:43

Технозаметки Малышева

Cisco укрепляет оборону в области кибербезопасности с помощью ИИ

Cisco интегрирует ИИ в свой арсенал кибербезопасности, позволяя компаниям справляться с угрозами нового поколения.
Ассистент на базе ИИ анализирует более 550 миллиардов событий ежедневно, обеспечивая оперативное обнаружение угроз.
Обучение ассистента основано на одном из самых крупных наборов данных по безопасности, что дает ему возможность точно определить и автоматизировать решения по обеспечению безопасности.
Интеграция ИИ с Cisco Firewall Management Center усиливает защиту сетей на основе анализа и триажа безопасностных событий.
Усовершенствованная работа ИИ в системе Cisco обещает изменить баланс сил в сторону защитников.

ИИ от Cisco теперь борется с хакерами. Спокойней спим.

#Cisco #ИИ #Кибербезопасность

⚡2👍1

108 views05:48

Технозаметки Малышева

IBM открывает новую главу в квантовых вычислениях

IBM анонсировала Quantum Heron, процессор последующего поколения.
Новинка обещает повысить эффективность и снизить ошибочность расчетов.
Также представлен Quantum System Two — модульный квантовый компьютер.
Планы расширения инфраструктуры до 2033 года для улучшения операций.
Объявлено о разработке нового ПО: Qiskit 1.0 и Qiskit Patterns.
Применение генеративного ИИ для программирования квантового кода упростит задачи разработчиков.
Эти шаги ускорят применение квантовых технологий в научных исследованиях.

ИИ ускоряет науку и технологии помогая IBM с квантовым прорывом.
Сумма технологий по Лему.

#IBM #QuantumComputing #Qiskit

67 viewsedited 05:50

Технозаметки Малышева

ByteDance включается в гонку генеративного ИИ, запуская создание чат-ботов

ByteDance, владелец TikTok, анонсировала платформу для разработки чат-ботов.
Основа - генеративный искусственный интеллект.
Публичный бета-тест ожидается до конца текущего месяца.
Стратегия ByteDance - интеграция новых ИИ-продуктов с существующими сервисами.
В разработке - генератор текста на изображения, по типу Midjourney.
Официальных комментариев от компании пока не последовало.
Рынок генеративных ИИ-моделей: расширение за счет крупных игроков, включая OpenAI и поддерживаемый Microsoft ChatGPT.

ByteDance включается в гонку ИИ-чат-ботов.

#ByteDance #TikTok #GenerativeAI

65 viewsedited 07:04

Технозаметки Малышева

Ультраскоростной фотонный чип из Австралии

Австралийские исследователи из Университета Сиднея создали фотонный чип.
Повышение скорости передачи данных в оптоволоконных сетях в 64 раза, достигая 640 Гбит/с.
Измерения чипа составляют 5х2 см, толщина в несколько миллиметров.
Работает быстрее электронных устройств благодаря оптическим технологиям.
Производство на основе стандартных материалов обещает снижение затрат.
Сотрудничество с международными учебными заведениями поддерживает инновации.
Перспективы увеличения скоростей передачи данных, стимулирование развития оптоволоконных связей.

Быстрее и доступнее - интернет следующего поколения в пути.

#Photonics #UniversityOfSydney #OpticalFiber

⚡2

63 views11:28

Технозаметки Малышева

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

GAIA: революция в создании говорящих аватаров

Модель GAIA преобразует речь и изображение в натуральные видео с аватарами.
Эффективное разделение движения и внешности улучшает качество генерации.
Обученная на обширных данных, модель превосходит предшественников в естественности и синхронизации движения губ.
Масштабируемость GAIA открывает путь к ещё более высокому качеству результата.
Модель включает в себя Вариационный автокодировщик и диффузионную модель.
Позволяет контролировать позы и редактировать черты лица для создания уникальных аватаров.
Текстовые инструкции могут использоваться для задания параметров аватара.
Соблюдение Принципов ответственного использования ИИ от Microsoft – обязательно.
Модель GAIA оценена на многоязычных данных.

Реалистичные аватары во всех приложениях через пол-года.

#GAIA #Microsoft #AI

56 views11:31

Технозаметки Малышева

Forwarded from Нейронавт | Нейросети в творчестве

1:39

This media is not supported in your browser

VIEW IN TELEGRAM

DemoFusion: Democratising High-Resolution Image Generation With No $$$

Генерация изображений высокого разрешения
SDXL может синтезировать изображения с разрешением до 1024 × 1024, в то время как DemoFusion позволяет SDXL генерировать изображения с разрешением 4 ×, 16 × и даже выше без какой-либо настройки и значительных требований к памяти. Все сгенерированные изображения создаются с использованием одного RTX 3090

Код
Демо

#upscale #text2image

55 views11:37

Технозаметки Малышева

PPLX анонсирует обновленные онлайн LLMы с доступом к интернет-знаниям

PPLX выпускает новые модели pplx-7b-online и pplx-70b-online, усовершенствованные LLM с доступом к актуальным данным в интернете.
Они позволяют получать свежую информацию, корректные данные по временно-чувствительным запросам.
Использование открытых моделей mistral-7b и llama2-70b в качестве основы для разработки.
Встроенная поисковая технология обеспечивает обновление сведений, улучшая точность и актуальность ответов.
Тесты подтверждают: новые модели превосходят gpt-3.5 и llama2-70b согласно ключевым показателям.
API PPLX позволяет интегрировать новейшие онлайн модели в различные приложения и сервисы.
Компания открывает найм для усиления команды разработчиков поисковика нового поколения.

Новый конкурент Google Search

#PPLX #LLM #SearchEngine

❤‍🔥1

62 viewsedited 11:56

Технозаметки Малышева

Yandex ускоряет разработку с Yandex GPT API и Cloud Boost AI

Yandex вкладывает ресурсы в расширение возможностей GPT API.
Этот API облегчает создание и обучение собственных моделей ИИ.
Yandex Cloud Boost AI ускоряет процессы машинного обучения.
Интеграция моделей ИИ в продукты возможна благодаря GPT API.
Улучшение функционала и качества продуктов с помощью Yandex GPT API.
Повышена точность и производительность моделей машинного обучения.
Оптимизация процесса обучения для быстрого достижения результатов.
Создание масштабируемых и эффективных решений в AI с новыми инструментами.

Экосистемы эволюционируют.

#Yandex #GPT_API #CloudBoostAI

68 viewsedited 12:02

Технозаметки Малышева

Google запускает Gemini, мультимодального конкурента GPT4

Google представил Gemini, свою самую продвинутую модель ИИ.
Gemini обрабатывает тексты, код, аудио, изображения и видео.

Всего 3 версии:
Gemini Ultra - должна быть лучше GPT4
Gemini Pro - будет доступна через Gemini API в AI Studio и VertexAI
Gemini Nano - для мобильных устройств

Для Android разработчиков доступна упрощенная модель Gemini Nano для устройств Pixel 8 Pro.

Google намерен расширять функционал Gemini, включая улучшение памяти и обработку данных.

Конкурент GPT4? Проверим.

#Google #Gemini #AI

⚡1

189 viewsedited 15:36

Технозаметки Малышева

AlphaCode 2 от DeepMind: еще один шаг вперед в AI для программирования

Google представила улучшенную версию генератора кода - AlphaCode 2.
Новинка основана на генеративной модели AI под названием Gemini, обученной на данных из соревнований по программированию.
На платформе Codeforces AlphaCode 2 показал себя сильнее примерно 85% участников, удвоив показатели предыдущей версии.
AlphaCode 2 способен решать задачи с сложной математикой и теоретической информатикой, используя метод динамического программирования.
Модель генерирует решения, фильтрует некорректный код, кластеризует и выбирает лучший вариант из каждого кластера.
Ограничения AlphaCode 2: код все еще нужно перепроверять, - иногда выбирает плохие варианты и высокая стоимость.
При этом использование AlphaCode 2 как помощника программиста показывает высокий результат.

Цель - создание AI-инструментов для всего процесса разработки программного обеспечения.

Будущее программирования становится всё интереснее.

#Google #DeepMind #AlphaCode

59 views01:21

Технозаметки Малышева

Liquid AI обещает революцию в мире ИИ с новым типом нейросетей

Стартап Liquid AI, выросший из Массачусетского технологического института (MIT), намерен переопределить понятие искусственного интеллекта.
Компания привлекла внушительные $37,5 млн на развитие жидкой нейронной сети.
Такие сети требуют меньше вычислительных ресурсов и могут адаптироваться к изменениям среды.
Применение находят от автономных автомобилей до мониторинга природы.
Ambition: превзойти текущие рыночные модели ИИ и предложить платформу для создания пользовательских моделей.
Liquid AI растёт: текущий штат — 12 человек, скоро расширение до 20.

В будущем системы ИИ смогут эффективнее адаптироваться к непредвиденным условиям.

#LiquidAI #NeuralNetworks #Innovation

56 views03:06

Технозаметки Малышева

TERRA AI: Революция в мире робототехники

TERRA AI научит роботов работать безопаснее и точнее.
Обеспечивает 4D восприятие с использованием моно и стерео зрения.
Выполняет оценку глубины, локализацию и семантическое понимание.
Обладает функцией обнаружения препятствий и сбора данных со множества камер.
Разработан для работы на встроенных компьютерах с низким энергопотреблением.
Использует модуль NVIDIA® Jetson™ и камеры ZED для визуализации.
Создаёт трехмерные карты для улучшенной ориентации в пространстве.

Доступно для предприятий во II квартале 2024 года и для всех пользователей через ZED SDK.

#TERRA_AI #NVIDIA #Jetson

Stereolabs

Introducing TERRA AI, new Artificial General Intelligence for robots | Stereolabs

New technology is capable of changing the face of agriculture, construction and logistics by improving autonomous capabilities.

63 views03:09

Технозаметки Малышева

AMD анонсирует AI ускорители Instinct MI300

AMD представляет ускорители Instinct MI300 на архитектуре CDNA 3, скачок в вычислительной мощности и энергоэффективности.
Объединение ЦП и ГП ускоряет высокопроизводительные вычисления и задачи ИИ.
Ускоритель MI300A идеален для моделирования и обработки данных в науке и здравоохранении.
MI300X ориентирован на искусственный интеллект, улучшает обучение и вывод на больших данных.
AMD ROCm 6 - программная платформа с открытым кодом, совместима с ускорителями MI300, поддерживает разработчиков.
Эффективные решения AMD для самых сложных задач в ИИ и вычислениях.

Наконец-то подъехали ускорители от AMD

#AMD #InstinctMI300 #CDNA3

59 viewsedited 10:11

Технозаметки Малышева

Apple представляет новый фреймворк MLX для машинного обучения

Apple раскрывает MLX - специализированный фреймворк для Apple Silicon.
Улучшенное машинное обучение: высокая производительность и легкость в использовании.
MLX поддерживает популярные языки программирования, облегчая интеграцию.
Эффективность: единая модель памяти минимизирует затраты на обработку данных.
Примеры возможностей: генерация изображений, языковые модели, распознавание речи.
Стратегия Apple: сделать машинное обучение доступней для исследователей.
Apple Silicon способствует высокой эффективности работы моделей ML, одновременно защищая данные пользователей.

Apple незаметно присоединяется :)

#Apple #MLX #MachineLearning

64 viewsedited 10:57

About

Blog

Apps

Platform