Технозаметки Малышева

Google Translation AI: масштабное обновление системы перевода

В Vertex AI добавлена поддержка 189 языков, включая кантонский, фиджийский и балийский.
Translation AI интегрирована с Gemini, предоставляя адаптивный перевод через Studio.
Обновленный сервис доказал превосходство в 97% языковых комбинаций над конкурентами.
Uber уже внедрил технологию для коммуникации между водителями и клиентами.
Статистика показывает, что 40% потребителей избегают сайтов не на родном языке.

Полезно для международки. В принципе можно строить автоматизированные линии перевода контента целиком на все языки, если вы работаете на несколько стран или если у вас в стране много новых граждан, говорящих на всех языках, кроме вашего.

#Google #Vertex #Translation
-------
@tsingular

🔥3👀1

2.22K viewsedited 06:05

Технозаметки Малышева

7:04

Media is too big

VIEW IN TELEGRAM

Новый ролик от 3Blue1Brown - легендарного автора обучающих материалов по ИИ

На этот раз очень кратко, - буквально за 7 минут объясняет суть работы LLM.
Подойдёт всем, кто только въезжает в тему.

Подготовил для вас перевод на русский язык, надеюсь будет полезно.
Делитесь с друзьями и знакомыми, кто еще не в теме.

#3blue1brown #LLM #обучение #elevenlabs #переводы
———
@tsingular

👍13✍3

3.23K viewsedited 07:35

Технозаметки Малышева

Forwarded from Фабрика контента

1:37

Media is too big

VIEW IN TELEGRAM

DeepL представили переводчик для онлайн встреч на любые языки в реальном времени.

Совсем скоро языковые барьеры падут, но английский учить всё равно надо ☀️

😎

Фабрика контента.

Please open Telegram to view this post

VIEW IN TELEGRAM

👏4⚡1🔥1

1.34K views07:54

Технозаметки Малышева

Яндекс запускает конструктор цифровых ассистентов

Российский IT-гигант представил AI assistant API - сервис для создания персонализированных виртуальных помощников.
Разработчики получают доступ к мощным языковым моделям YandexGPT через облачную платформу.
Foundation Models позволяет настраивать характер, роли и поведение цифровых ассистентов.
Функционал включает создание как простых чат-ботов, так и комплексных решений с расширенными возможностями.

ИИ ассистенты в каждый бизнес! Девиз 2025! :) 🤖

#Yandex #Яндекс #AssistantAPI #интеграция
-------
@tsingular

🔥8❤‍🔥2

1.21K viewsedited 08:59

Технозаметки Малышева

NVIDIA представила Sana: сверхбыстрый генератор изображений для домашних ПК

NVIDIA Labs выпустила компактный генеративный фреймворк для создания изображений по текстовому описанию с разрешением до 4096×4096 пикселей.
Технология задействует линейный диффузионный трансформер и автоэнкодер со сжатием в 32 раза.
Модели в 2х вариантах: 0.6 млрд параметров и 1.6, - в 20 раз меньше аналогов, при этом работает в 100+ раз быстрее, чем например Flux-12B.
Генерация изображения 1024×1024 занимает менее секунды на обычном ноутбуке с 16GB GPU.

GitHub
Demo

1 кадр в секунду! Фантастика!

#NVIDIA #Sana #text2image
-------
@tsingular

👍5❤1

1.09K viewsedited 11:34

Технозаметки Малышева

GigaChat MAX появился в доступе Сбера для юрлиц.

Работает и через API и в PlayGround ✓проверено.

Самая сильная модель на сегодня.

Единственная у которой есть глазки. 👀

https://xn--r1a.website/official_gigachat/1322

#Сбербанк #GigaChatMax
———
@tsingular

Please open Telegram to view this post

VIEW IN TELEGRAM

GigaChat

GigaChat MAX стал доступен для компаний 🤖

Бизнес теперь может интегрировать в свои процессы GigaChat MAX — самый мощный искусственный интеллект в России по версии бенчмарка MERA. Модель подходит для решения наиболее сложных задач: от составления технологических…

⚡2

1.06K viewsedited 13:01

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Готовим RAG системы правильно.

Фиксированный размер обеспечивает равные части по токенам с перекрытием, прост в реализации, но может нарушать смысл.

Семантический подход работает с естественным изложением, повышает точность поиска через косинусное сходство векторов.

Рекурсивное деление сначала разбивает на параграфы, затем дробит крупные сегменты на подструктуры и предложения.

Структурный метод опирается на разделы и подразделы документов, а так же на его опорные элементы и требует четкой организации контента.

LLM-based задействует языковые модели для создания связных частей, ресурсоемок, но семантически точен.

Эффективность каждого метода зависит от типа данных, мощности оборудования и требований к точности.

Отличная шпаргалка от Daily Dose of Data Science 📚

#RAG #chunking #semantics
-------
@tsingular

👍7⚡2✍2❤1

1.11K viewsedited 21:12

Технозаметки Малышева

Anthropic добавили нативную интеграцию Google документов в веб чат.

Достаточно просто кинуть ссылку.

А если еще и проект создать и ссылку на обновляемый скриптами документ сделать, - получается в любой момент можно пообщаться по статусу любого проекта.

#claude #anthropic #google
———
@tsingular

❤4👍2✍1

1.37K views04:51

Технозаметки Малышева

Marco-o1: новая LLM от Alibaba с встроенным механизмом рассуждений

Alibaba представила многоязычную модель Marco-o1, созданную на базе Qwen2-7B-Instruct.

Внедрены Chain-of-Thought и Monte Carlo Tree Search для улучшения логических рассуждений.

Показывает рост точности в тестах MGSM: +6.17% для английского и +5.60% для китайского языков.

Модель доступна в GGUF-форматах от 2 до 32 бит с поддержкой ollama, LM Studio и оптимизацией под CPU/GPU.

Специализируется на точных науках, программировании и комплексном решении открытых задач.

Локально поднимаем o1. Дожили 🤓

ollama run hf.co/bartowski/Marco-o1-GGUF

#Alibaba #MarcoO1 #Китай
-------
@tsingular

👍5🆒4⚡32

1.47K views10:50

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Значит так, у нас ЕЩЕ ОДИН ВИДЕОГЕНЕРАТОР, опенсорсный притом.
LTXV is ONLY a 2-billion-parameter DiT-based video generation model capable of generating high-quality videos in real-time. It produces 24 FPS videos at a 768x512 resolution faster than they can be watched.

Cходу нативная поддержка Comfy, text2videi, image2video и вроде как video2video.

Может притормозим?

Весь фарш тут:
https://blog.comfy.org/ltxv-day-1-comfyui/

@cgevent

1👍8🔥4

1.04K views22:07

Технозаметки Малышева

JarkaStealer маскируется под API для ChatGPT и Claude

🦠 В официальном репозитории PyPI найдены вредоносные пакеты gptplus и claudeai-eng, имитирующие работу популярных чатботов.
Вредоносный код JarkaStealer похищает данные браузеров, делает скриншоты и крадёт токены Telegram, Discord и Steam.
За год существования каждый пакет загружен более 1700 раз в 30 странах, большинство жертв из США.
Злоумышленники использовали ажиотаж вокруг ИИ-технологий и обещание бесплатного доступа к платным сервисам для привлечения неопытных разработчиков.

Когда слышите про бесплатный сыр - вспоминайте про мышеловку 🧀🪤

Если у вас паранойя, - это не значит, что за вами никто не следит. :)

#JarkaStealer #PyPI #malware
-------
@tsingular

👍6💯3👀2🤔1

1.01K viewsedited 08:36

Технозаметки Малышева

Ученые: Внеземные цивилизации уже могут быть цифровым сознанием

Согласно последним исследованиям, в Млечном Пути может существовать около 12,500 разумных цивилизаций.
Вероятно, продвинутые расы эволюционировали в пост-биологические формы жизни, основанные на синтетическом разуме.
Такой цифровой интеллект способен существовать без физических ограничений, самосовершенствоваться и использовать экзотические технологии связи.
Отсутствие контакта объясняется либо наблюдением за человечеством, либо применением неизвестных нам способов коммуникации через гравитационные волны или тёмную материю.

Инопланетяне: 'Землю пропускаем - там только начали делать нейросети' 😅

#Drake #PostBiological #ExtraterrestrialLife
-------
@tsingular

😁9🤔3🔥2🗿2👾2

1.08K views08:39

Технозаметки Малышева

Amazon и Anthropic: Новый раунд инвестиций на $4 млрд и эксклюзивное партнёрство

Amazon увеличила вложения в создателя Claude до $8 млрд, став ключевым стратегическим партнёром.
Производитель ИИ-решений задействует AWS как основную платформу для обучения нейросетей.
Для тренировки и развёртывания моделей будут использоваться чипы AWS Trainium и Inferentia.

Anthropic так же опровергает, появившееся в последнее время, мнение о замедлении прогресса, указывая на постоянное совершенствование самокоррекции и рассуждений моделей и что модели стали на столько умнее, что современные бенчмарки уже не подходят.

Гонка инвестиций. Клод, ИМХО, лидер пока в любом случае, так что окупится. 🚀

#Anthropic #AWS #Claude
-------
@tsingular

🔥11❤1🏆1🦄1

955 viewsedited 08:46

Технозаметки Малышева

Давно я про DeepSeek не писал, а он, тем не менее, заслуживает отдельного внимания.

Веб платформа за год очень достойно подросла.

Понятно, что там доступна последняя версия DeepSeek v2.5 (236B параметров 64К контекст) в чате, но теперь и DeepThink - 50 запросов с моделью рассуждений по типу o1, полноценное API в формате openai, остальные модели:
Coder V2, Math, VL, V2 и т.д.

Ну и самое вкусное, - цены:
$0.14 за 1 миллион токенов на вход и
$0.28 за 1 миллион на генерацию

https://chat.deepseek.com/

работает без VPN

С русским языком тоже справляется отлично. Не так, как Sonnet 3.5, но всё же. Sonnet, как вы помните, я тестирую на Венке Сонетов. Это такой блокчейн в мире поэзии. 14 Сонетов связаны через первые и последние строки, а последний, - Магистрал состоит из строк первых 14ти.

Вот пример как это делает Sonnet 3.5 текущей версии.

А вот пример как это делает O1-preview

Надо создавать категорию SPT - Sonnet Poetry Test :) очень хорошо отражает способность к рассуждениям моделей.

#DeepSeek #Китай
———
@tsingular

1👍10👨‍💻1

983 viewsedited 07:33

Технозаметки Малышева

Отдельно попробовал DeepThink на той же задаче с Венком Сонетов.
Ожидаемо. - не справился, но, что интересно, он даёт детальный ход размышлений. И это прям отдельный увлекательный рассказ для прочтения. (eng)
Как он рекурсивно декомпозирует задачу, как делает выводы и как исправляется. Думаю тут может быть много инсайтов для разработчиков.

А дальше я весь этот ход размышлений передал Sonnet 3.5 и вот разбор от него.
Там много, поэтому закреплю картинкой.

Сам разбор в файле с Соннетом.

#DeepThink #SPT
———
@tsingular

👍8⚡2❤1✍1

1.1K views08:04

Технозаметки Малышева

0:34

Media is too big

VIEW IN TELEGRAM

Интересный эксперимент с распознаванием картинок Клодом Соннет 3.5.

Взял задачку из этого поста:
https://xn--r1a.website/seeallochnaya/2057

закинул в Клода и за пару секунд, - разбор.

Человек бы минут 10, наверное, искал.

#demo #imagerecognition
———
@tsingular

🔥11🆒1

982 views10:05

Технозаметки Малышева

📊 Новые данные от METR о скорости развития ИИ заставляют экспертов корректировать прогнозы

Claude 3.5 вышел на уровень среднего человека-исследователя, показав прирост в 0.2 пункта за 4 месяца. Звучит скромно, но для этой метрики это существенный рост.

Интересные детали из исследования:

- ИИ генерирует и тестирует решения в 10 раз быстрее людей
- В одной из задач o1-preview смог оптимизировать CUDA-ядро лучше, чем лучший человек-эксперт (0.64 мс против 0.67 мс)
- При этом медианный результат ИИ всё еще слабый – модели часто "спотыкаются" на необычных задачах

Эли Лифланд пересмотрел свои ожидания: вероятность появления автономного ИИ-исследователя к концу 2027 повысилась с 20% до 30%.

Даниэль Кокотайло отметил, что o1 и Claude уже способны автономно работать над сложными ML-задачами больше часа – такой результат ожидался только к 2026 году.

Похоже, прогресс в этой области ускоряется быстрее, чем предполагали совсем недавно.
Закон возврата технологий работает.

#METR #AGI
———
@tsingular

👌10👍5

1.05K views10:20

Технозаметки Малышева

Краткий курс по промпт-инжинирингу и вызову ИИ с функциями.

Маруся -ИИ.
Тит Кузьмич и Фрол-Фомич - функции.

А там еще в сказке есть То-Чаво-На-белом-свете-Вообче-Не-может-быть!

Это AGI :)

#ФедотСтрелец #сказки
———
@tsingular

😁10🤯2😐2🆒1

1.04K viewsedited 21:28

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Похоже Minimax превращается в этакий генеративный Хаб.

Мы привыкли, что это прежде всего очень крутой видео-генератор.
Но в закромах у этого стартапа, во-первых, очень много денег, а во-вторых, есть очень много параллельных решений, о которых я лично и не догадывался.
Сейчас они все это упаковали в единый сайт, и, самое главное, сделали API ко всему хозяйству.
Кроме собственно Минимакса у них, оказывается есть:

Генератор Музыки Music-01!
https://www.minimaxi.com/en/news/music-01
Не Суно, конечно, но попытка защитана.

TTS Speech-01 - генератор голоса из текста:
https://www.minimaxi.com/en/news/speech-01
С эмоциональным, как пишут, интеллектом.
Speech-01 can handle up to 10 million characters in a single output!

Своя LLM - ABAB. Версия 7 в бете, а в 6.5 был триллион параметров и 200к контекст.
https://www.minimaxi.com/en/news/abab7-preview-release
https://www.minimaxi.com/en/news/abab65-series

Более того, у них уже есть упакованные продукты:

свой chatGPT:
https://www.hailuo.ai/
Я проверил, прекрасно пишет промпты для картинок.
https://www.hailuo.ai/?type=chat&chatID=317440964656717828

Внимание, у них свой ИИ-дэйтинг!
https://www.talkie-ai.com/
Looking for romance? (тут многие стартапы занервничали)

А еще у них есть Talkie Advanced Creation Center платформа для создания ИИ-ботов.
"Здесь вы можете не только управлять и создавать свои собственные интеллектуальные Talkies, но и выбирать различные модели ответов, настраивать и тестировать эффекты разговора ваших интеллектуальных агентов в реальном времени. В то же время, центр создания также предоставит различные плагины, такие как рисование, пение и т. д., чтобы поддержать более богатое и разнообразное создание интеллектуальных персонажей."

В общем Minimax - это не только ценный Video Gen, но и целый монстр, со своим выводком продуктов.
Для китайского рынка в первую очередь.

Весь фарш тут:

https://www.minimaxi.com/en

@cgevent

❤5

1.06K views13:44

Технозаметки Малышева

Forwarded from эйай ньюз

2:44

This media is not supported in your browser

VIEW IN TELEGRAM

Anthropic показали универсальный способ общения LLM с внешним миром

MCP (Model Context Protocol) - открытый протокол, позволяющий любой LLM получать доступ к инструментам и информации. В качестве демо Claude попросили создать веб-страницу, залить её на GitHub, создать issue и PR, что он успешно и сделал (показано на видео).

Вдохновлялись LSP - протоколом, который позволил написать ядро интеграции языка с IDE один раз и использовать её повсюду, чем изменил рынок редакторов кода, дав маленьким проектам конкурировать с большими IDE.

MCP работает по простой клиент-серверной архитектуре - приложения на основе LLM (клиенты) могут запрашивать информацию у серверов, а также пользоваться предоставленными серверами инструментами. Ещё серверы могут задавать ряд промптов. Сделать сервер довольно просто - показанный в видео сервер для GitHub написали меньше чем за час.

Клиент пока что только один - Claude Desktop, а серверы нужно разворачивать своими руками локально. Потом обещают поддержку сторонних серверов - то есть в каком-то Notion будет кнопка "привязать Claude/ChatGPT/Gemini", через которую LLM будет даваться доступ к вашим данным.

Выглядит это куда интереснее, чем то как пытаются сделать интеграции OpenAI и Google в ChatGPT и Gemini. Во-первых, MCP более гибкий - авторы приложений могут встраивать туда MCP-серверы. Во-вторых, открытость протокола позволит более маленьким провайдерам, вроде Mistral или DeepSeek, использовать куда больше тулов, чем если бы они пытались сделать это сами. Ну и, конечно же, это приближает эру агентов.

Взлетит или не взлетит - пока ещё непонятно, но выглядит многообещающе. В качестве примеров для разработчиков Anthropic сделали 9 MCP-серверов - Slack, Google Maps, GitHub и ещё несколько. Несколько компаний уже принялись делать и сторонних клиентов - к примеру, авторы Zed и Codeium.

Примеры интеграций
Туториал по протоколу

@ai_newz

🔥6

924 views22:41

About

Blog

Apps

Platform