This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA представили универсальную платформу автоматизации видеоанализа
NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.
Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.
Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.
Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.
Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.
#NVIDIA #Blueprint #видеоаналитика
———
@tsingular
NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.
Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.
Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.
Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.
Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.
#NVIDIA #Blueprint #видеоаналитика
———
@tsingular
👍5🆒1
MIT разработал революционные 3D-нанотранзисторы
Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.
Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬
#MIT #nanotechnology #quantum
-------
@tsingular
Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.
Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬
#MIT #nanotechnology #quantum
-------
@tsingular
🎉4👏2❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kling "Custom Models" - это вообще-то прорыв.
Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.
Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.
Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.
Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.
Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.
В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.
@cgevent
Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.
Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.
Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.
Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.
Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.
В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.
@cgevent
🔥8👍1
Audio
Standard Intelligence представляет Hertz-dev: голосовой ИИ с рекордной скоростью генерации
Hertz-dev - публичная аудио-модель с 8.5B параметров для двустороннего общения.
Трансформер обеспечивает задержку всего 65мс в теории и 120мс на практике через RTX 4090.
Разработка вдвое быстрее существующих аналогов при обработке аудиопотока.
Система поддерживает одно- и двухканальное аудио, и требует всего 9 секунд записи для анализа и тренировки.
Запускается на Ubuntu или MacOS, необходимы Python 3.10 и CUDA 12.1.
Жаль, что эта версия, похоже, только на английском, но думаю уже очень скоро можно будет локально поднять полноценного голосового ассистента, неотличимого от живого оператора.
60мс на генерацию ответа, - это очень сильно. 🎙🤖
Github
#StandardIntelligence #HertzDev #RealTimeAudio
———
@tsinuglar
Hertz-dev - публичная аудио-модель с 8.5B параметров для двустороннего общения.
Трансформер обеспечивает задержку всего 65мс в теории и 120мс на практике через RTX 4090.
Разработка вдвое быстрее существующих аналогов при обработке аудиопотока.
Система поддерживает одно- и двухканальное аудио, и требует всего 9 секунд записи для анализа и тренировки.
Запускается на Ubuntu или MacOS, необходимы Python 3.10 и CUDA 12.1.
Жаль, что эта версия, похоже, только на английском, но думаю уже очень скоро можно будет локально поднять полноценного голосового ассистента, неотличимого от живого оператора.
60мс на генерацию ответа, - это очень сильно. 🎙🤖
Github
#StandardIntelligence #HertzDev #RealTimeAudio
———
@tsinuglar
👍3🔥2
Daily Dose of Datascience выложили полную подборку материалов в 1 PDF.
Рекомендую, - очень просто, понятно и интересно пишут про DS методы.
530+ страниц с 150+ ключевыми уроками .
файл в комментарии.
#dailydoseofdatascience #обучение
———
@tsingular
Рекомендую, - очень просто, понятно и интересно пишут про DS методы.
530+ страниц с 150+ ключевыми уроками .
файл в комментарии.
#dailydoseofdatascience #обучение
———
@tsingular
👍5🔥3
Claude 3.5 Haiku: самая быстрая модель Anthropic обошла Opus 3.0 и стала в 3 раза дороже
Anthropic выпустила анонсированную ранее обновленную версию Claude 3.5 Haiku.
Основные изменения: улучшенное написание кода, работа с функциями, логические рассуждения, классификация и обработка данных.
Функционал будет полезен при создании агентов для разработки ПО, чат-ботов и модерации контента.
Планируется добавление поддержки изображений и расширенной обработки больших массивов информации.
Все вот сравнивают с 4o-mini и Gemini Flash, так как модель реально в этой нише играет, но ведь по-сути это Opus в 15 раз дешевле!
#Anthropic #Claude35 #Haiku
-------
@tsingular
Anthropic выпустила анонсированную ранее обновленную версию Claude 3.5 Haiku.
Основные изменения: улучшенное написание кода, работа с функциями, логические рассуждения, классификация и обработка данных.
Функционал будет полезен при создании агентов для разработки ПО, чат-ботов и модерации контента.
Планируется добавление поддержки изображений и расширенной обработки больших массивов информации.
Все вот сравнивают с 4o-mini и Gemini Flash, так как модель реально в этой нише играет, но ведь по-сути это Opus в 15 раз дешевле!
#Anthropic #Claude35 #Haiku
-------
@tsingular
Meta* разрешила военное применение Llama моделей в США
Корпорация Meta* радикально изменила политику использования своих ИИ-моделей, открыв доступ оборонному сектору США.
К проекту присоединились AWS, Microsoft, IBM, Lockheed Martin, Oracle, Palantir и другие федеральные подрядчики.
Технологии планируется задействовать для диагностики военной техники, планирования операций, кибербезопасности и борьбы с терроризмом.
Стратегическая цель - укрепление технологического превосходства США в сфере ИИ-разработок.
Документация приводится к соответствию с реалиями. Вполне предсказуемо.
Meta* - запрещенная на территории Российской Федерации организация.
#Meta #Llama #Military
-------
@tsingular
Корпорация Meta* радикально изменила политику использования своих ИИ-моделей, открыв доступ оборонному сектору США.
К проекту присоединились AWS, Microsoft, IBM, Lockheed Martin, Oracle, Palantir и другие федеральные подрядчики.
Технологии планируется задействовать для диагностики военной техники, планирования операций, кибербезопасности и борьбы с терроризмом.
Стратегическая цель - укрепление технологического превосходства США в сфере ИИ-разработок.
Документация приводится к соответствию с реалиями. Вполне предсказуемо.
Meta* - запрещенная на территории Российской Федерации организация.
#Meta #Llama #Military
-------
@tsingular
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
В HeyGen новая фича - Photo Avatar
И да, она тоже связана с тренировкой своих аватаров на пачке входных изображений.
Почитайте полный пайплайн тут:
Если вкратце: Flux, Magnific, Heygen, Elevent Labs, chatGPT, Topaz
Ну, за дикторов и блоггеров..
@cgevent
И да, она тоже связана с тренировкой своих аватаров на пачке входных изображений.
Почитайте полный пайплайн тут:
Если вкратце: Flux, Magnific, Heygen, Elevent Labs, chatGPT, Topaz
Ну, за дикторов и блоггеров..
@cgevent
🔥6
Forwarded from Анализ данных (Data analysis)
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Anthropic призывает к срочному регулированию ИИ в ближайшие 18 месяцев
Необходимо оперативное внедрение превентивного контроля над развитием искусственного интеллекта.
Особую тревогу вызывает стремительный рост возможностей нейросетей в программировании и кибербезопасности.
Предложена Политика ответственного масштабирования с пороговыми значениями и регулярной оценкой моделей.
Регулирование должно быть гибким и адаптивным, направленным на предотвращение катастрофических рисков.
Подчеркивается важность международной координации и стандартизации требований безопасности.
Антропик дурного не посоветует. 18 месяцев это прям очень скоро.
#Anthropic #Regulation #Safety
-------
@tsingular
Необходимо оперативное внедрение превентивного контроля над развитием искусственного интеллекта.
Особую тревогу вызывает стремительный рост возможностей нейросетей в программировании и кибербезопасности.
Предложена Политика ответственного масштабирования с пороговыми значениями и регулярной оценкой моделей.
Регулирование должно быть гибким и адаптивным, направленным на предотвращение катастрофических рисков.
Подчеркивается важность международной координации и стандартизации требований безопасности.
Антропик дурного не посоветует. 18 месяцев это прям очень скоро.
#Anthropic #Regulation #Safety
-------
@tsingular
🔥6👍1
Tencent выпускает самую мощную открытую MoE модель в мире
Hunyuan-Large устанавливает новый стандарт производительности языковых моделей с 389 млрд параметров.
Архитектура Mixture of Experts, контекстное окно в 256K токенов.
Система превосходит LLama3.1-405B на 2.6% в MMLU и на 3.6% в математических тестах.
Модель демонстрирует выдающиеся результаты в задачах на китайском языке, программировании и научных вычислениях.
HuggingFace
GitHub
Китайские модели умеют в оптимизацию, получается. При меньшем объеме показывают лучший результат. 😎
#Tencent #Hunyuan #MoE #Китай
-------
@tsingular
Hunyuan-Large устанавливает новый стандарт производительности языковых моделей с 389 млрд параметров.
Архитектура Mixture of Experts, контекстное окно в 256K токенов.
Система превосходит LLama3.1-405B на 2.6% в MMLU и на 3.6% в математических тестах.
Модель демонстрирует выдающиеся результаты в задачах на китайском языке, программировании и научных вычислениях.
HuggingFace
GitHub
Китайские модели умеют в оптимизацию, получается. При меньшем объеме показывают лучший результат. 😎
#Tencent #Hunyuan #MoE #Китай
-------
@tsingular
🔥4
https://www.perplexity.ai/elections/2024-11-05/us/president
Ух-ты. на Perplexity в реальном времени можно посмотреть за гонкой в Штатах.
#выборы #perplexity
———
@tsingular
Ух-ты. на Perplexity в реальном времени можно посмотреть за гонкой в Штатах.
#выборы #perplexity
———
@tsingular
✍2
Perplexity предложил помощь New York Times в разгар забастовки
Технические сотрудники NYT устроили забастовку, требуя повышения зарплаты и гибридный формат работы.
CEO Perplexity Аравинд Шринивас предложил поддержку изданию через Twitter, что спровоцировало общественный резонанс.
Между организациями существует напряженность из-за предыдущих претензий NYT по использованию контента для обучения нейросетей.
Руководитель позже уточнил, что речь шла только об инфраструктурной поддержке, а не о замене персонала.
Отличный заход по продаже ИИ решений в компании, где персонал против :)
#Perplexity #NYTimes #WorkersRights
-------
@tsingular
Технические сотрудники NYT устроили забастовку, требуя повышения зарплаты и гибридный формат работы.
CEO Perplexity Аравинд Шринивас предложил поддержку изданию через Twitter, что спровоцировало общественный резонанс.
Между организациями существует напряженность из-за предыдущих претензий NYT по использованию контента для обучения нейросетей.
Руководитель позже уточнил, что речь шла только об инфраструктурной поддержке, а не о замене персонала.
Отличный заход по продаже ИИ решений в компании, где персонал против :)
#Perplexity #NYTimes #WorkersRights
-------
@tsingular
Project Zero: LLM теперь ищет уязвимости в коде вместо людей
Google DeepMind и Project Zero создали систему Big Sleep для автоматического обнаружения уязвимостей в программном коде.
В ходе тестирования удалось найти реальную уязвимость переполнения буфера стека в SQLite, которую не смог обнаружить классический фаззинг за 150 часов работы.
Система использует GPT-4 Turbo и Gemini 1.5 Pro для анализа кода, коммитов и создания тестовых сценариев.
Эффективность поиска уязвимостей выросла в 20 раз по сравнению с традиционными методами в тестах CyberSecEval2.
Это первый публичный случай, когда ИИ самостоятельно нашел критическую уязвимость в популярном ПО.
Можно перед деплоем прогонять весь код через ИИ! 🤖🔍
#ProjectZero #DeepMind #SQLite #ИБ
———
@tsingular
Google DeepMind и Project Zero создали систему Big Sleep для автоматического обнаружения уязвимостей в программном коде.
В ходе тестирования удалось найти реальную уязвимость переполнения буфера стека в SQLite, которую не смог обнаружить классический фаззинг за 150 часов работы.
Система использует GPT-4 Turbo и Gemini 1.5 Pro для анализа кода, коммитов и создания тестовых сценариев.
Эффективность поиска уязвимостей выросла в 20 раз по сравнению с традиционными методами в тестах CyberSecEval2.
Это первый публичный случай, когда ИИ самостоятельно нашел критическую уязвимость в популярном ПО.
Можно перед деплоем прогонять весь код через ИИ! 🤖🔍
#ProjectZero #DeepMind #SQLite #ИБ
———
@tsingular
❤🔥2
Технозаметки Малышева
IBM представляет Granite 3.0: открытые ИИ-модели для бизнеса Компания IBM выпустила семейство ИИ-моделей Granite 3.0 под открытой лицензией Apache 2.0. Модели обучены на 12+ триллионах токенов данных, включая 12 языков и 116 языков программирования. Granite…
Вдогонку.
IBM выложила полный датасет Гранита:
https://github.com/ibm-granite/granite-3.0-language-models
#IBM #Granite #dataset
———
@tsingualr
IBM выложила полный датасет Гранита:
https://github.com/ibm-granite/granite-3.0-language-models
#IBM #Granite #dataset
———
@tsingualr
GitHub
GitHub - ibm-granite/granite-3.0-language-models
Contribute to ibm-granite/granite-3.0-language-models development by creating an account on GitHub.