Технозаметки Малышева
8.69K subscribers
3.86K photos
1.45K videos
40 files
4.03K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
дайджест ноября.xlsx
27.7 KB
Традиционно. Все новости за ноябрь.
вдруг кому полезно будет для подготовки внутренних обзоров.

#дайджест
Так.. ну красивая цифра в количестве подписчиков на канал достигнута, давайте акцию что-ли какую сделаем. :)

например каждому, кто сегодня пришлёт боту @cloud_gpt_bot сообщение "tsingular" в течение следующих 3х часов - скажем до 15:00 мск, после 15:00 накину 500р на счёт бота и включу GPT4 с поиском на пробу :).
1 сообщение на аккаунт.

просто присылаете сообщение

tsingular

не обращайте внимания на ответ.
После 15:00 начислю всем вручную по выгрузке из базы.

Лайк, шер, репост, подписка на @tsingular - приветствуются
👍1🔥1
Кто такие LLM-агенты и что они умеют?

LLM-агенты объединяют язык, визуализацию и звук для взаимодействия со сложной средой.
В архитектуре присутствуют компоненты: Vision Transformer для зрения и Q-former для памяти.
Action Module выполняет задачи вне системы, включая извлечение данных и выполнение кода.
Модуль памяти сочетает краткосрочные и долгосрочные стратегии хранения информации.
Рефлексивная память агентов позволяет самостоятельно синтезировать абстрактные знания.
Возможно SQL-взаимодействие с внешними базами данных для доступа к долгосрочной памяти.
Модули планирования решений используют сложные стратегии, такие как Chain-of-Thought.

Детальный разбор,- что умеют LLM агенты.

#LLM #AI #MemoryManagement
🔥1
:) не надо так.
👍1
Приехал послушать Сбер про Гигачат.

Эфир и дальше запись по этой ссылке:

https://www.youtube.com/live/0R8MSRi3Vyo?si=tXBe4e8PdbDmMYew

Плейлист:
https://youtube.com/playlist?list=PLJU_M19giWaHcqm7mVWuankpQwSgvR-CQ&si=krs0e2iIMcZCu3f1
Выборочное Внимание Языковых Моделей

Языковые модели лучше всего работают, если важные данные расположены в начале или в конце контекста.
Ухудшение результатов при анализе информации, расположенной в середине контекста.
Переранжирование документов или обрезка списка может повысить эффективность использования контекста.

Знание слабых мест помогает сделать AI умнее.

#ЯзыковыеМодели #ИнформационныйКонтекст #ИИ
Дипфейки набирают обороты: угроза и вызов для кибербезопасности

Технология deepfake создаёт фальсифицированные медиа.
66% экспертов в сфере кибербезопасности столкнулись с deepfake-атаками в 2022 году.
Рост объёма deepfake-контента в сети - более 900% за период 2019-2020 гг.
К 2026 году до 90% интернет-контента может быть сгенерировано искусственно.
Затраты на кибербезопасность могут достичь $215 млрд в 2024 году.
Ожидается рост расходов на защиту данных и клауд-безопасность более чем на 24%.
Deepfake-техника используется в атаках социальной инженерии для подделки голоса руководства.
Rememory использует deepfake для создания виртуальных воспоминаний об ушедших.
Слово 2023 года по Cambridge - 'hallucinate', Merriam-Webster выбирает 'authentic'.

Мы стоим на пороге эры, где различить подлинное и искусственное будет всё сложнее.

#deepfake #cybersecurity #Rememory
MagicAnimate обученная на TikTok и TED видео оживляет картины и персонажей

Новый инструмент MagicAnimate превращает статичные изображения в анимированные сцены.

Точное и согласованное движение персонажей отличает MagicAnimate от базовых решений.

Уникальная возможность анимирования разноплановых объектов: от фото до картин.

MagicAnimate работает даже с изображениями, созданными в DALLE3.

Поддерживается анимация групп персонажей, следующих общему движению.

Теперь любая картинка может стать частью анимированной истории.

#MagicAnimate #TikTok #Animation
This media is not supported in your browser
VIEW IN TELEGRAM
Нейронка от KREA апскейлнула вышедший в продажу Cybertruck.

Получилось лучше оригинала, а это даже не на максимальных параметрах. Повторить можно тут.

GeekNeural | #Interesting
❤‍🔥1
Салют, GigaChat! Речевые технологии и большие языковые модели

Сбербанк добился значительного прогресса в ИИ.

Гигачат, - разработан самостоятельно с 0 за год до уровня GPT 3.5!!! - Абсолютный рекспект.
Есть – модели с 7 и 29 млрд параметров​.
Используется оптимизатор Adam с 1e-8 для лучшей сходимости модели.
Оптимизация этого параметра оказалась критична для эффективности обучения​ по сравнению с 1e-5.
Удалось сократить время обучения с 2 недель до 5 дней.
Перелопатили кучу багов в опенсурсе и оптимизировали пайплайны - получили значительный выигрыш во времени в том числе за счёт ускорения перезапуска инстансов в случае отказа GPU, которых тысячи.
Внедрен синхронный Garbage Collection для управления памятью ГПУ.

Анонсированы бесплатные открытые модели, ну и много интересных деталей как именно разрабатываются LLMки, распознавание голоса и эмоций и генерация достоверного голоса - это надо слушать.
В генерации голоса разница очень ощутима.

#GigaChat #AI #SberDevices
🔥2👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
А теперь реальный нейрорендеринг.
Ох, щас наброшу интересную тему.

Айфон сам решает, что вы должны увидеть на фото или почему фотография уже давно не отражает этот мир, а представляет собой метаверс, преломленный в мозгах нейрочипов.

Подруга невесты сфоткала последнюю на айфон. И получила три разных невесты. На одном снимке.

Стоя перед двумя большими зеркалами, отражение невесты не отражает ту позу, которую она принимает, и мало того, оба отражения отличаются друг от друга и от той позы, которую невеста принимала на самом деле.

В то время как невеста держала одну руку вверх, а другую вниз, отражение слева видит, что она держит обе руки вниз, а отражение справа - что она держит обе руки на талии.

"Это реальная фотография, не отфотошопленная, не панорамный снимок, не Live Photo", - пишет невеста в своей инсте.

Невеста в ярости идет в Apple Store, где ей рассказывают, что айфончик на деле делает серию снимков, а потом не просто выбирает лучший, а сшивает их в одну фотку.

Ну то есть айфончик решил, что в одном зеркале невесте к лицу одна поза, в другом - другая поза, а как там она выглядит или держит руки ему насрать. Ибо бьютификация - всё, а реальный уродливый мир - отстой и ничто.

Понятно, что вычислительная фотография давно уже не отражает реальный мир (вот почитайте огромную работу Димы Ватолина, где на фотках появляются неожиданные персонажи в результате апскейла).

Но этот кейс потрясающе выпукло демонстрирует нам факт, что мы давно уже полагаемся на ИИ в гораздо более широком круге вопросов, чем думаем.

Если у вас есть другие объяснения происходящего или годные теории заговора, пишите в коменты.
🤣1
🧬 YandexGPT API теперь станет платным!

Доступ к YandexGPT через API перейдет в стадию Public Preview и станет платным 6 декабря. Тарифы будут опубликованы в ближайшее время. Письма об этом получили пользователи API.

Также API получит новый функционал. Сегодня уже доступно:

— Эмбеддинги: способ представления текста в виде числовых векторов.

— Возможность дообучения в Yandex DataSphere на пользовательских данных. Это может быть полезно, например, при работе со специфическими понятиями и терминами.

— YandexGPT 2. Бизнесу доступна новая нейросеть, которая намного лучше справляется со стилизацией, пересказом и анализом, созданием текстов и ответами на вопросы.

— Режим чата: теперь в ходе текстового диалога с пользователем YandexGPT API помнит контекст.

🧩 #AINews
Ехал Грека через реку,
видит Грека в реке рак.
Сунул Грека руку в реку,
Вместе смотрят на закат

Скоро в боте появится рисовалка сюжетов по 1 запросу.
Сможет например рисовать сны, сам разбивая их на сюжетные блоки.
SeamlessM4T революционизирует многоязычный перевод

Представлена новая мультифункциональная модель SeamlessM4T для перевода речи и текста.
Модель позволяет общаться на почти 100 языках, объединяя в себе их мгновенный перевод и транскрибацию.
Высокая производительность для малоресурсных языков и качественный перевод для языков с широким ресурсом, включая английский и немецкий.
Не требует отдельной модели для идентификации исходного языка - автоматически адаптируется.
Основана на передовых проектах No Language Left Behind, Universal Speech Translator и Massively Multilingual Speech.
Использует продвинутый самообучающийся энкодер w2v-BERT 2.0 и текстовую модель NLLB.
Точность переводов оценивается через улучшенный инструмент BLASER 2.0.
Включает меры безопасности для предотвращения токсичности и предвзятости в переводах.

Обновление открытой модели.

#SeamlessM4T #Translation #Multilingual
🔥1
Cisco укрепляет оборону в области кибербезопасности с помощью ИИ

Cisco интегрирует ИИ в свой арсенал кибербезопасности, позволяя компаниям справляться с угрозами нового поколения.
Ассистент на базе ИИ анализирует более 550 миллиардов событий ежедневно, обеспечивая оперативное обнаружение угроз.
Обучение ассистента основано на одном из самых крупных наборов данных по безопасности, что дает ему возможность точно определить и автоматизировать решения по обеспечению безопасности.
Интеграция ИИ с Cisco Firewall Management Center усиливает защиту сетей на основе анализа и триажа безопасностных событий.
Усовершенствованная работа ИИ в системе Cisco обещает изменить баланс сил в сторону защитников.

ИИ от Cisco теперь борется с хакерами. Спокойней спим.

#Cisco #ИИ #Кибербезопасность
2👍1
IBM открывает новую главу в квантовых вычислениях

IBM анонсировала Quantum Heron, процессор последующего поколения.
Новинка обещает повысить эффективность и снизить ошибочность расчетов.
Также представлен Quantum System Two — модульный квантовый компьютер.
Планы расширения инфраструктуры до 2033 года для улучшения операций.
Объявлено о разработке нового ПО: Qiskit 1.0 и Qiskit Patterns.
Применение генеративного ИИ для программирования квантового кода упростит задачи разработчиков.
Эти шаги ускорят применение квантовых технологий в научных исследованиях.

ИИ ускоряет науку и технологии помогая IBM с квантовым прорывом.
Сумма технологий по Лему.

#IBM #QuantumComputing #Qiskit
ByteDance включается в гонку генеративного ИИ, запуская создание чат-ботов

ByteDance, владелец TikTok, анонсировала платформу для разработки чат-ботов.
Основа - генеративный искусственный интеллект.
Публичный бета-тест ожидается до конца текущего месяца.
Стратегия ByteDance - интеграция новых ИИ-продуктов с существующими сервисами.
В разработке - генератор текста на изображения, по типу Midjourney.
Официальных комментариев от компании пока не последовало.
Рынок генеративных ИИ-моделей: расширение за счет крупных игроков, включая OpenAI и поддерживаемый Microsoft ChatGPT.

ByteDance включается в гонку ИИ-чат-ботов.

#ByteDance #TikTok #GenerativeAI
Ультраскоростной фотонный чип из Австралии

Австралийские исследователи из Университета Сиднея создали фотонный чип.
Повышение скорости передачи данных в оптоволоконных сетях в 64 раза, достигая 640 Гбит/с.
Измерения чипа составляют 5х2 см, толщина в несколько миллиметров.
Работает быстрее электронных устройств благодаря оптическим технологиям.
Производство на основе стандартных материалов обещает снижение затрат.
Сотрудничество с международными учебными заведениями поддерживает инновации.
Перспективы увеличения скоростей передачи данных, стимулирование развития оптоволоконных связей.

Быстрее и доступнее - интернет следующего поколения в пути.

#Photonics #UniversityOfSydney #OpticalFiber
2
This media is not supported in your browser
VIEW IN TELEGRAM
GAIA: революция в создании говорящих аватаров

Модель GAIA преобразует речь и изображение в натуральные видео с аватарами.
Эффективное разделение движения и внешности улучшает качество генерации.
Обученная на обширных данных, модель превосходит предшественников в естественности и синхронизации движения губ.
Масштабируемость GAIA открывает путь к ещё более высокому качеству результата.
Модель включает в себя Вариационный автокодировщик и диффузионную модель.
Позволяет контролировать позы и редактировать черты лица для создания уникальных аватаров.
Текстовые инструкции могут использоваться для задания параметров аватара.
Соблюдение Принципов ответственного использования ИИ от Microsoft – обязательно.
Модель GAIA оценена на многоязычных данных.

Реалистичные аватары во всех приложениях через пол-года.

#GAIA #Microsoft #AI
This media is not supported in your browser
VIEW IN TELEGRAM
DemoFusion: Democratising High-Resolution Image Generation With No $$$

Генерация изображений высокого разрешения
SDXL может синтезировать изображения с разрешением до 1024 × 1024, в то время как DemoFusion позволяет SDXL генерировать изображения с разрешением 4 ×, 16 × и даже выше без какой-либо настройки и значительных требований к памяти. Все сгенерированные изображения создаются с использованием одного RTX 3090

Код
Демо

#upscale #text2image