Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Клод теперь читает пдфы как человек, с картинками.
До сегодняшнего дня, когда вы запихивалт PDF в Клод, он использовал службу извлечения текста для захвата текста и отправки его себе в текстовом промпте.
Теперь Клод может визуально увидеть PDF-файл вместе с текстом ЦЕЛИКОМ.
С картинками, диаграммами, и что там ещё запихивают в пдф.
Взгляд на страницу целиком.
Это позволяет Клоду более точно понимать сложные документы, например те, которые изобилуют диаграммами или графиками, не поддающимися текстовому представлению.
Например, теперь можно задавать Клоду вопросы о PDF-файле, полном анатомических диаграмм. См. видео
А ещё теперь можно пихать пдф в Клода через API.
Теперь он не читает документы, он их "рассматривает". Все как у людей.
https://docs.anthropic.com/en/docs/build-with-claude/pdf-support
@cgevent
До сегодняшнего дня, когда вы запихивалт PDF в Клод, он использовал службу извлечения текста для захвата текста и отправки его себе в текстовом промпте.
Теперь Клод может визуально увидеть PDF-файл вместе с текстом ЦЕЛИКОМ.
С картинками, диаграммами, и что там ещё запихивают в пдф.
Взгляд на страницу целиком.
Это позволяет Клоду более точно понимать сложные документы, например те, которые изобилуют диаграммами или графиками, не поддающимися текстовому представлению.
Например, теперь можно задавать Клоду вопросы о PDF-файле, полном анатомических диаграмм. См. видео
А ещё теперь можно пихать пдф в Клода через API.
Теперь он не читает документы, он их "рассматривает". Все как у людей.
https://docs.anthropic.com/en/docs/build-with-claude/pdf-support
@cgevent
👍5❤3✍2🔥1
О, Сбер теперь и в API обновил модельку!
Полезно.
Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).
https://xn--r1a.website/mashkka_ds/1824
#Сбербанк
———
@tsingular
Полезно.
Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).
- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama-405B.
- GigaChat-Max достигает 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU.
- По результатам SBS, где учитывается красота ответов, мы выигрываем в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
- В Arena-Hard мы достигаем 51% скора против GPT-4-0314
- В Vkhr Arena-General-RU мы достигаем 90%, в то время как YaGPT-4 Pro достигает 59%.
https://xn--r1a.website/mashkka_ds/1824
#Сбербанк
———
@tsingular
Telegram
Mashkka про Data Science
Релиз GigaChat MAX! (ссылка на Хабр)
Салют! Мы открываем доступ к модели GigaChat MAX. Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).
- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama…
Салют! Мы открываем доступ к модели GigaChat MAX. Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).
- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama…
Новые фунции Телеграма - Огонь.
Теперь можно делать суперприложения, а не только ботов.
Раньше тоже можно было, но теперь +10 новых функций:
📺 Полноэкранный режим
📱 Ярлыки на главном экране
✍️ Планы подписки
📍 Доступ к геолокации (с разрешениями)
📱 Данные об ориентации устройства
💤 Доступ к статусу эмодзи
🎨 Обмен медиа
🎁 Отправка подарков
💭 Расширенные лимиты сообщений
💰 Монетизация рекламы
https://xn--r1a.website/durov/371
#телеграм #dev
------
@tsingular
Теперь можно делать суперприложения, а не только ботов.
Раньше тоже можно было, но теперь +10 новых функций:
📺 Полноэкранный режим
📱 Ярлыки на главном экране
✍️ Планы подписки
📍 Доступ к геолокации (с разрешениями)
📱 Данные об ориентации устройства
💤 Доступ к статусу эмодзи
🎨 Обмен медиа
🎁 Отправка подарков
💭 Расширенные лимиты сообщений
💰 Монетизация рекламы
https://xn--r1a.website/durov/371
#телеграм #dev
------
@tsingular
Telegram
Du Rove's Channel
🔜 Telegram is about to introduce 10 new features for Mini Apps, enabling developers to create dozens of new kinds of apps and games on Telegram.
📺 Full-Screen Mode
📱 Home Screen Shortcuts
✍️ Subscription Plans
📍 Geolocation Access (with permissions)
📱 Device…
📺 Full-Screen Mode
📱 Home Screen Shortcuts
✍️ Subscription Plans
📍 Geolocation Access (with permissions)
📱 Device…
🔥5❤1
Nvidia сместила Intel в индексе Dow Jones, хотя могла стать её частью
Nvidia заменит своего бывшего потенциального покупателя в индексе Dow Jones Industrial Average.
При этом в 1990-х Intel могла приобрести Nvidia за 2 млрд долларов, но не сделала этого.
Спустя 30 лет капитализация производителя графических процессоров превысила 2 триллиона.
Кто бы мог подумать еще даже 20 лет назад, что производитель "ускорителей для игрушек" обгонит Интел, вытолкнет его из Dow и еще и, возможно, даже купит в итоге.
Совет-то они уже собрали.
#Nvidia #Intel #DowJones
———
@tsingular
Nvidia заменит своего бывшего потенциального покупателя в индексе Dow Jones Industrial Average.
При этом в 1990-х Intel могла приобрести Nvidia за 2 млрд долларов, но не сделала этого.
Спустя 30 лет капитализация производителя графических процессоров превысила 2 триллиона.
Кто бы мог подумать еще даже 20 лет назад, что производитель "ускорителей для игрушек" обгонит Интел, вытолкнет его из Dow и еще и, возможно, даже купит в итоге.
Совет-то они уже собрали.
#Nvidia #Intel #DowJones
———
@tsingular
Причина и следствие: метод SURD от CalTech
Учёные Caltech представили революционный метод SURD для анализа причинно-следственных связей в сложных системах.
Новый подход делит факторы на уникальные, избыточные и синергетические компоненты.
В сфере ИИ метод позволит оптимизировать нейросети, улучшить интерпретируемость моделей и повысить эффективность обучения с подкреплением.
Особенно ценна способность SURD минимизировать ложные идентификации и анализировать данные при ограниченной выборке.
Источник в Nature
Хотелось бы, конечно, готовые библиотеки уже, а то вечная проблема с false-positive у всех.
Интересно если скормить целиком метод Клоду, - напишет же?
UPD: закинул статью в 4о, Claude код в разных вариантах на Nodejs и Python в комментарии.
ИМХО лучший - Claude. Кто на чём пишет, - выбирайте.
Мы живём в реальности, где за 5 минут научную статью можно превратить в код.
Поздравляю!
#Caltech #SURD #MachineLearning
-------
@tsingular
Учёные Caltech представили революционный метод SURD для анализа причинно-следственных связей в сложных системах.
Новый подход делит факторы на уникальные, избыточные и синергетические компоненты.
В сфере ИИ метод позволит оптимизировать нейросети, улучшить интерпретируемость моделей и повысить эффективность обучения с подкреплением.
Особенно ценна способность SURD минимизировать ложные идентификации и анализировать данные при ограниченной выборке.
Источник в Nature
Хотелось бы, конечно, готовые библиотеки уже, а то вечная проблема с false-positive у всех.
Интересно если скормить целиком метод Клоду, - напишет же?
UPD: закинул статью в 4о, Claude код в разных вариантах на Nodejs и Python в комментарии.
ИМХО лучший - Claude. Кто на чём пишет, - выбирайте.
Мы живём в реальности, где за 5 минут научную статью можно превратить в код.
Поздравляю!
#Caltech #SURD #MachineLearning
-------
@tsingular
🔥7👍2
Visa внедряет 500+ AI-приложений и сокращает 1400 сотрудников
Компания инвестировала $3.3 млрд в развитие инфраструктуры искусственного интеллекта за последние 10 лет.
Основные направления:
- чат-боты для бизнес-подразделений,
- обнаружение уязвимостей кода,
- интеллектуальный биллинг.
Системы защиты от мошенничества предотвращают потери примерно на $1.1 млрд ежегодно.
Планируется, что каждый специалист будет курировать 8-10 цифровых сотрудников.
По данным Gartner уровень внедрения AI в организациях достиг 37% против 9% год назад.
Роботы наступают - офисные работники в панике! 🤖💳
Ведь 8-10 цифровых сотрудников, - это скорее всего несколько уволенных реальных. Или недонанятых, как посмотреть, конечно.
Т.е. пока руководители отделов останутся на пару лет.
#Visa #automation
———
@tsingular
Компания инвестировала $3.3 млрд в развитие инфраструктуры искусственного интеллекта за последние 10 лет.
Основные направления:
- чат-боты для бизнес-подразделений,
- обнаружение уязвимостей кода,
- интеллектуальный биллинг.
Системы защиты от мошенничества предотвращают потери примерно на $1.1 млрд ежегодно.
Планируется, что каждый специалист будет курировать 8-10 цифровых сотрудников.
По данным Gartner уровень внедрения AI в организациях достиг 37% против 9% год назад.
Роботы наступают - офисные работники в панике! 🤖💳
Ведь 8-10 цифровых сотрудников, - это скорее всего несколько уволенных реальных. Или недонанятых, как посмотреть, конечно.
Т.е. пока руководители отделов останутся на пару лет.
#Visa #automation
———
@tsingular
Забавно. В моем детстве, если ты смотришь в 11 лет с родителями "классический фильм снятый 20+ лет назад", то он скорее всего был черно-белый. :)
Теперь это, например, Матрица.
#матрица #фильмы
------
@tsingular
Теперь это, например, Матрица.
#матрица #фильмы
------
@tsingular
❤15👍1😁1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree Go2 научили лучше держать баланс
Но меня больше всего впечатляет их маркетинг отдел – в каждом видео они просто пинают робота, палкой, ногой и подзатыльником
Лет через 70 наши металлические друзья оценят как мы с ними обращались💡
Робот стоит $2800 и выше
Но меня больше всего впечатляет их маркетинг отдел – в каждом видео они просто пинают робота, палкой, ногой и подзатыльником
Лет через 70 наши металлические друзья оценят как мы с ними обращались
Робот стоит $2800 и выше
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10😁7
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA представили универсальную платформу автоматизации видеоанализа
NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.
Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.
Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.
Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.
Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.
#NVIDIA #Blueprint #видеоаналитика
———
@tsingular
NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.
Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.
Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.
Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.
Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.
#NVIDIA #Blueprint #видеоаналитика
———
@tsingular
👍5🆒1
MIT разработал революционные 3D-нанотранзисторы
Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.
Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬
#MIT #nanotechnology #quantum
-------
@tsingular
Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.
Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬
#MIT #nanotechnology #quantum
-------
@tsingular
🎉4👏2❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kling "Custom Models" - это вообще-то прорыв.
Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.
Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.
Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.
Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.
Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.
В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.
@cgevent
Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.
Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.
Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.
Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.
Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.
В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.
@cgevent
🔥8👍1
Audio
Standard Intelligence представляет Hertz-dev: голосовой ИИ с рекордной скоростью генерации
Hertz-dev - публичная аудио-модель с 8.5B параметров для двустороннего общения.
Трансформер обеспечивает задержку всего 65мс в теории и 120мс на практике через RTX 4090.
Разработка вдвое быстрее существующих аналогов при обработке аудиопотока.
Система поддерживает одно- и двухканальное аудио, и требует всего 9 секунд записи для анализа и тренировки.
Запускается на Ubuntu или MacOS, необходимы Python 3.10 и CUDA 12.1.
Жаль, что эта версия, похоже, только на английском, но думаю уже очень скоро можно будет локально поднять полноценного голосового ассистента, неотличимого от живого оператора.
60мс на генерацию ответа, - это очень сильно. 🎙🤖
Github
#StandardIntelligence #HertzDev #RealTimeAudio
———
@tsinuglar
Hertz-dev - публичная аудио-модель с 8.5B параметров для двустороннего общения.
Трансформер обеспечивает задержку всего 65мс в теории и 120мс на практике через RTX 4090.
Разработка вдвое быстрее существующих аналогов при обработке аудиопотока.
Система поддерживает одно- и двухканальное аудио, и требует всего 9 секунд записи для анализа и тренировки.
Запускается на Ubuntu или MacOS, необходимы Python 3.10 и CUDA 12.1.
Жаль, что эта версия, похоже, только на английском, но думаю уже очень скоро можно будет локально поднять полноценного голосового ассистента, неотличимого от живого оператора.
60мс на генерацию ответа, - это очень сильно. 🎙🤖
Github
#StandardIntelligence #HertzDev #RealTimeAudio
———
@tsinuglar
👍3🔥2