Технозаметки Малышева
8.32K subscribers
3.74K photos
1.4K videos
40 files
3.92K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Media is too big
VIEW IN TELEGRAM
OpenAI запускает поиск в ChatGPT

ChatGPT получил возможность поиска актуальной информации в интернете через Bing.
Функционал доступен всем пользователям Plus и Enterprise подписок.
Чатбот теперь может анализировать свежие данные и предоставлять ответы с цитированием источников.

Интеграция позволяет получать актуальные сведения о событиях, происходящих после сентября 2023 года.

С одной стороны поиск это, конечно, хорошо.
Тут и Perplexity может начать волноваться и, собственно, Google.
С другой стороны, - это же Bing.
За 15 лет он так и не смог стать лучшим поисковиком. Почему теперь ИИ с не лучшим поисковиком вдруг должен стать популярным?
Скорее уже Gemini2, который выйдет до конца этого года, всех обойдёт.

#OpenAI #Bing #Search
———
@tsingular
Chrome OS 130: ИИ и продуктивность для Chromebook Plus

Google выпустила масштабное обновление Chrome OS 130 с фокусом на эффективность работы.
Quick Insert обеспечивает молниеносный доступ к эмодзи, GIF и ссылкам через сочетание клавиш.
Модели с Neural Processing Unit получили эксклюзивные возможности: запись с ИИ, улучшенный звук и эффекты камеры.
Focus Mode блокирует уведомления в заданные периоды, а Welcome Recap восстанавливает прошлую сессию.
Samsung Galaxy Chromebook Plus первым обзавелся специальной кнопкой для быстрых действий, остальные модели получат её в 2024.

В будущем все ноутбуки будут с ИИ-ускорителями. Даже школьный хромбук теперь умнее калькулятора! 🎓

#ChromeOS #Samsung #NPU
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini API интегрируется с Google Search для улучшения точности ответов

Google добавил функцию Grounding with Search в AI Studio и Gemini API.
Нововведение позволяет моделям получать актуальные данные из поисковой системы и предоставлять ссылки на источники.
Функционал доступен для всех версий Gemini 1.5 через раздел Tools или параметр 'google_search_retrieval' в API.
Система динамически определяет необходимость поиска, используя пороговое значение 0.3.
Разработчики получили возможность тонкой настройки процесса поиска и извлечения данных.

А вот и то, о чем так долго говорили большевики, свершилось.
Буквально пара строк кода и ответы подкрепляются поиском без необходимости вызова отдельно поиска через апи.
import google.generativeai as genai
import os

genai.configure(api_key=os.environ["API_KEY"])
model = genai.GenerativeModel('models/gemini-1.5-flash-002')

response = model.generate_content(contents="Who won Wimbledon this year?",
tools='google_search_retrieval')
print(response)


#Gemini #GoogleSearch #APITools
-------
@tsingular
SmolLM2: сверхмалая англоязычная модель с эффективностью GPT 3.5

SmolLM2 - семейство компактных языковых моделей с размерами от 135M до 1.7B параметров.

Флагманская версия обучена на 11 триллионах токенов используя FineWeb-Edu, DCLM и The Stack датасеты.

Ключевые улучшения включают расширенную математическую логику, function calling и улучшенное следование инструкциям.

Основные ограничения: работа преимущественно на английском языке и возможная генерация неточной информации.

Вполне подойдет для дронов. 🤖🔢

#SmolLM2 #HuggingFace #LLM
-------
@tsingular
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Клод теперь читает пдфы как человек, с картинками.

До сегодняшнего дня, когда вы запихивалт PDF в Клод, он использовал службу извлечения текста для захвата текста и отправки его себе в текстовом промпте.

Теперь Клод может визуально увидеть PDF-файл вместе с текстом ЦЕЛИКОМ.

С картинками, диаграммами, и что там ещё запихивают в пдф.

Взгляд на страницу целиком.

Это позволяет Клоду более точно понимать сложные документы, например те, которые изобилуют диаграммами или графиками, не поддающимися текстовому представлению.

Например, теперь можно задавать Клоду вопросы о PDF-файле, полном анатомических диаграмм. См. видео

А ещё теперь можно пихать пдф в Клода через API.

Теперь он не читает документы, он их "рассматривает". Все как у людей.
https://docs.anthropic.com/en/docs/build-with-claude/pdf-support

@cgevent
👍532🔥1
О, Сбер теперь и в API обновил модельку!
Полезно.

Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).

- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama-405B.
- GigaChat-Max достигает 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU.
- По результатам SBS, где учитывается красота ответов, мы выигрываем в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
- В Arena-Hard мы достигаем 51% скора против GPT-4-0314
- В Vkhr Arena-General-RU мы достигаем 90%, в то время как YaGPT-4 Pro достигает 59%.


https://xn--r1a.website/mashkka_ds/1824

#Сбербанк
———
@tsingular
Новые фунции Телеграма - Огонь.

Теперь можно делать суперприложения, а не только ботов.
Раньше тоже можно было, но теперь +10 новых функций:

📺 Полноэкранный режим
📱 Ярлыки на главном экране
✍️ Планы подписки
📍 Доступ к геолокации (с разрешениями)
📱 Данные об ориентации устройства
💤 Доступ к статусу эмодзи
🎨 Обмен медиа
🎁 Отправка подарков
💭 Расширенные лимиты сообщений
💰 Монетизация рекламы

https://xn--r1a.website/durov/371

#телеграм #dev
------
@tsingular
🔥51
Nvidia сместила Intel в индексе Dow Jones, хотя могла стать её частью

Nvidia заменит своего бывшего потенциального покупателя в индексе Dow Jones Industrial Average.

При этом в 1990-х Intel могла приобрести Nvidia за 2 млрд долларов, но не сделала этого.
Спустя 30 лет капитализация производителя графических процессоров превысила 2 триллиона.

Кто бы мог подумать еще даже 20 лет назад, что производитель "ускорителей для игрушек" обгонит Интел, вытолкнет его из Dow и еще и, возможно, даже купит в итоге.
Совет-то они уже собрали.

#Nvidia #Intel #DowJones
———
@tsingular
Причина и следствие: метод SURD от CalTech

Учёные Caltech представили революционный метод SURD для анализа причинно-следственных связей в сложных системах.

Новый подход делит факторы на уникальные, избыточные и синергетические компоненты.

В сфере ИИ метод позволит оптимизировать нейросети, улучшить интерпретируемость моделей и повысить эффективность обучения с подкреплением.

Особенно ценна способность SURD минимизировать ложные идентификации и анализировать данные при ограниченной выборке.

Источник в Nature

Хотелось бы, конечно, готовые библиотеки уже, а то вечная проблема с false-positive у всех.
Интересно если скормить целиком метод Клоду, - напишет же?

UPD: закинул статью в 4о, Claude код в разных вариантах на Nodejs и Python в комментарии.
ИМХО лучший - Claude. Кто на чём пишет, - выбирайте.

Мы живём в реальности, где за 5 минут научную статью можно превратить в код.
Поздравляю!

#Caltech #SURD #MachineLearning
-------
@tsingular
🔥7👍2
Visa внедряет 500+ AI-приложений и сокращает 1400 сотрудников

Компания инвестировала $3.3 млрд в развитие инфраструктуры искусственного интеллекта за последние 10 лет.

Основные направления:
- чат-боты для бизнес-подразделений,
- обнаружение уязвимостей кода,
- интеллектуальный биллинг.

Системы защиты от мошенничества предотвращают потери примерно на $1.1 млрд ежегодно.

Планируется, что каждый специалист будет курировать 8-10 цифровых сотрудников.

По данным Gartner уровень внедрения AI в организациях достиг 37% против 9% год назад.

Роботы наступают - офисные работники в панике! 🤖💳
Ведь 8-10 цифровых сотрудников, - это скорее всего несколько уволенных реальных. Или недонанятых, как посмотреть, конечно.
Т.е. пока руководители отделов останутся на пару лет.

#Visa #automation
———
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Сфера в Лас-Вегасе,- это ж Планетарий по сути. :)

#lasvegas #sphere
------
@tsingular
8🔥3👏1
Забавно. В моем детстве, если ты смотришь в 11 лет с родителями "классический фильм снятый 20+ лет назад", то он скорее всего был черно-белый. :)
Теперь это, например, Матрица.

#матрица #фильмы
------
@tsingular
15👍1😁1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree Go2 научили лучше держать баланс

Но меня больше всего впечатляет их маркетинг отдел – в каждом видео они просто пинают робота, палкой, ногой и подзатыльником

Лет через 70 наши металлические друзья оценят как мы с ними обращались 💡

Робот стоит $2800 и выше
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10😁7
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA представили универсальную платформу автоматизации видеоанализа

NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.

Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.

Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.

Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.

Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.

#NVIDIA #Blueprint #видеоаналитика
———
@tsingular
👍5🆒1
MIT разработал революционные 3D-нанотранзисторы

Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.

Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬

#MIT #nanotechnology #quantum
-------
@tsingular
🎉4👏21
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Kling "Custom Models" - это вообще-то прорыв.

Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.

Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.

Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.

Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.

Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.

В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.

@cgevent
🔥8👍1