Машинное обучение RU
18.1K subscribers
1.69K photos
241 videos
11 files
2.12K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://xn--r1a.website/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://xn--r1a.website/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://xn--r1a.website/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://xn--r1a.website/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://xn--r1a.website/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://xn--r1a.website/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://xn--r1a.website/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://xn--r1a.website/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥31👎1
⚡️ Новый проект: DeepSeek OCR — React + FastAPI

Открыли репозиторий с современным веб-приложением OCR: фронтэнд на React, бэкенд на FastAPI.

Что умеет:
- Plain OCR — извлечение текста из изображения
- Describe — генерация описания изображения
- Find — поиск заданного термина с отображением рамки
- Freeform — задаёшь кастомный prompt и получаешь результат

Почему круто:
- Drag-and-drop загрузка изображений до 100 МБ, визуализация bounding boxes
- Конфигурация через .env (порт, размер файла, модель)
- Стек: React 18 + Vite + TailwindCSS + FramerMotion + FastAPI + PyTorch + Transformers
- Всё контейнеризовано через Docker + Docker Compose → можно быстро запустить

Как начать:
1. Клонируй репозиторий
2. Cкопируй .env.example в .env и настрой параметры
3. Запусти: docker compose up --build
4. Открой: фронтэнд (по умолчанию http://localhost:3000) & API (http://localhost:8000)

https://github.com/rdumasia303/deepseek_ocr_app/
🔥8👍31
📚 Читаем EPUB с LLM 🚀
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.

🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки

📌 GitHub: https://github.com/karpathy/reader3

#python
3👍2🤔2
🧠 ChatTutor: Интерактивный ИИ-учитель

Это ИИ-репетитор, использующий электронную доску для обучения. Он предоставляет пользователям возможность взаимодействовать с различными учебными инструментами, что делает процесс обучения более наглядным и эффективным, особенно в STEM-дисциплинах.

🚀Основные моменты:
- Интерактивные математические и логические канвасы
- Поддержка создания ментальных карт
- Многоагентная архитектура для улучшенного взаимодействия
- Возможность решения задач с помощью ИИ

📌 GitHub: https://github.com/sheepbox8646/ChatTutor

#javascript
👍3
🚀 **LongCat-Flash-Omni - новая открытыая560B omni-modal модель от Meituan

Новая SOTA-модель LongCat-Flash-Omni (560B параметров) - универсальная омнимодальная система, которая работает с видео, аудио, текстом и действиями в реальном времени.

Что в ней важно:

- Mixture-of-Experts архитектура - даёт высокую скорость и низкие задержки, несмотря на масштаб 560B.
- Полноценное мультимодальное понимание: видео + аудио + текст, обработка движений и сцен в потоке.
- Modality-decoupled parallelism — модель тренировали так, чтобы эффективно комбинировать разные типы данных, не тормозя обучение.
- Заявлен SOTA-уровень качества среди открытых омнимодальных моделей.

Технический отчёт: https://huggingface.co/papers/2511.00279
Модель: https://huggingface.co/meituan-longcat/LongCat-Flash-Omni
Проект: https://longcat.ai
5
💡 Он пересказал материал WSJ о том, как Уолл-стрит фактически перекачивает огромные заёмные деньги в строительство AI-дата-центров - и как финансовые риски постепенно уходят в фонды, пенсионные планы и долговые продукты, которые покупают обычные люди.

Сегодня частные кредитные структуры вроде Blue Owl работают по схеме: несколько миллиардов собственного капитала + более $20 млрд долга, а всё это закрепляется 10–15-летними арендами от Meta, Oracle или Microsoft.
Деньги идут на гигантские площадки мощностью близкой к 1 ГВт и сотни тысяч GPU, но весь риск висит не на Big Tech, а на проектных компаниях, перегруженных кредитами.

Аналитики ожидают, что лидеры ИИ потратят около $3 трлн до 2028 года, но смогут профинансировать из операционного потока лишь половину.
Значит, 1.2–1.5 трлн долларов придётся занимать — через облигации, кредиты и частный капитал.

Эти долги нарезаются на инструменты с доходностью 6–7% и оказываются в ETF, взаимных фондах, страховых компаниях и пенсионных программах.
По сути, рядовые вкладчики незаметно становятся спонсорами AI-инфраструктуры.

Некоторые инвесторы уже заработали: например, Pimco в сделке Meta Hyperion получили $1–2 млрд бумажной прибыли, потому что облигации быстро подросли — в том числе благодаря сильным защитным условиям, гарантирующим выплаты даже если арендатор уйдёт.

Но самые уязвимые — высоко закредитованные структуры.
Если спрос на ИИ замедлится или маржа сузится, Big Tech всё равно успеет воспользоваться дешёвыми мощностями, а вот убытки лягут на широкий круг инвесторов, которые рассчитывали на «надёжный доход».

Источник: wsj.com/finance/investing/wall-street-ai-spending-bubble-810d270e
4👍3
🧠 На AI Journey представили новое поколение открытых моделей распознавания речи — GigaAM-v3, ставшее самым крупным обновлением стека ASR от Сбера.

Главное изменение — масштаб предобучения. Вместо стандартных 50k часов корпус расширили до 700k часов, а все данные прошли нормализацию и восстановление пунктуации через GigaChat Max Audio. Это позволило значительно улучшить понимание сложной, живой, эмоциональной речи.

Линейка включает CTC- и RNNT-модели, а также e2e-версии, которые добавляют пунктуацию прямо на выходе, что делает текст читаемым без постобработки.

По ключевым датасетам (OpenSTT, Golos, CV) новый стек сохраняет паритет, но на сложных доменах улучшения достигают 30–40%. Модель уже доступна разработчикам — исходники опубликованы в полном объёме.
🔥41😁1
🎤 Быстрый текст-в-речь с Supertonic

Supertonic — это высокопроизводительная система текст-в-речь, работающая на вашем устройстве. Она обеспечивает молниеносное создание речи с минимальными затратами ресурсов и полным соблюдением конфиденциальности. Никаких облачных решений — всё происходит локально.

🚀Основные моменты:
- Генерация речи до 167× быстрее реального времени
- 🪶 Легковесная архитектура с 66M параметрами
- 📱 Полная обработка на устройстве без задержек
- 🎨 Обработка сложных текстов без предварительной подготовки
- ⚙️ Гибкая настройка параметров и развертывания

📌 GitHub: https://github.com/supertone-inc/supertonic

#python
4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 На международной конференции AI Journey Сбер представил первого российского человекоподобного робота Грина

Что важно знать:

- разработкой полностью занимался Сбер, от конструкции и электроники до наполнения. То есть это полностью российский проект
- в основе искусственного интеллекта нейросеть GigaChat
- разработка заняла 1 год: от сбора команды инженеров и первого прототипа до презентации
- робот умеет перемещаться пространстве и манипулировать реальными объектами
👍8😁4👎2🔥1
⚡️ Google DeepMind делает серьёзный шаг к созданию «Android для роботов»

Google DeepMind наняла Аарона Сандерса, бывшего CTO Boston Dynamics, на позицию вице-президента по аппаратной инженерии.

Сандерс ушёл из Boston Dynamics всего три месяца назад, после 22 лет работы в компании и участия в создании таких роботов, как Atlas и Spot.

DeepMind теперь стремится создать универсальную платформу для робототехники.
Демис Хассабис объяснил цель так:

«Это похоже на стратегию Android. Мы хотим построить ИИ-систему на базе Gemini, которая сможет работать почти *из коробки* на любом типе робота».

Сандерс говорит, что его задача — “усилить это направление”, работая вместе с партнёрами и решая фундаментальные задачи аппаратного уровня, чтобы ИИ мог эффективно работать в физическом мире.

Иронично, что Google уже владела Boston Dynamics с 2013 по 2017 год, но продала компанию SoftBank, не найдя коммерческой модели. В то время Сандерс тоже был VP по аппаратной инженерии.

Сегодня Google возвращается в робототехнику снова — но уже с чётким пониманием:
универсальная база Gemini может стать для роботов тем, чем Android стал для смартфонов.
🛠️ Улучшаем коммиты с AI

Git Rewrite Commits — это инструмент для автоматического улучшения сообщений коммитов с помощью AI. Он помогает привести в порядок историю коммитов, создавая более осмысленные и структурированные сообщения, что особенно полезно перед публикацией проектов или для повышения удобства работы с репозиториями.

🚀Основные моменты:
- AI-генерация сообщений для коммитов
- Поддержка локальных моделей и оффлайн-работы
- Установка git hooks одним командой
- Оценка качества коммитов и автоматическое исправление
- Возможность настройки формата и языка сообщений

📌 GitHub: https://github.com/f/git-rewrite-commits

#javascript
👍3🔥1
⚡️ Google подписал крупный контракт с НАТО на суверенный облачный ИИ

Акции GOOGL растут после того как НАТО заключило многомиллионное соглашение на использование Google Distributed Cloud в полностью изолированном air-gapped режиме.

Решение будет работать на кастомных TPU Google и предназначено для JATEC, центра анализа и обучения.

Что это даёт НАТО

Полностью суверенное облако
Вся вычислительная инфраструктура и хранилище остаются внутри территории НАТО. Это закрывает вопросы юрисдикций, резидентства данных и аудита.

Полная изоляция от интернета
Air-gapped означает что системы физически не подключены к сети.
Обновления, модели и данные проходят только через контролируемые каналы.
Это снижает поверхность атаки и исключает утечки.

Современный ИИ в закрытой среде
Можно запускать аналитику, ИИ-модели и обработку секретных данных не выходя в публичное облако.

Kubernetes, хранилища и ускорители прямо на объектах НАТО
Команды смогут разворачивать контейнерные ИИ-сервисы, симуляции и анализ телеметрии в реальном времени непосредственно в защищённых дата-центрах.

Почему это важно для JATEC

Становится возможным проводить обучение, моделирование и разбор операций на более высоких уровнях секретности, с быстрой корреляцией логов, изображений и данных наблюдения.

NCIA получает единые политики, централизованные патчи и аппаратный root-of-trust чтобы поддерживать одинаковый уровень безопасности на всех площадках.

googlecloudpresscorner.com/2025-11-24-NATO-and-Google-Cloud-Sign-Multi-Million-Dollar-Deal-for-AI-Enabled-Sovereign-Cloud
👎64🔥2👍1
🤖 Яндекс открыл Alice AI для бизнеса

Что важно знать:


• Alice AI — новое поколение моделей от Яндекса, LLM-модель уже доступна на платформе Yandex AI Studio. Скоро добавится и Alice AI ART;
• В 60% задач показывает результаты лучше, чем DeepSeek V3.1 и Qwen3-235b;
• По сравнению с ними модель лучше в RAG-сценариях, она лучше пишет и редактирует тексты и отвечает на общие вопросы;
• Среди апдейтов – более “человечные” и развернутые ответы: модель может простым языком объяснить сложные вещи, например – рассказать сэйлзам специфику сложного продукта;
• Компании Just AI и presentsimple.ai уже тестируют модель в своих продуктах
• Благодаря оптимизации токенайзера под русский язык при идентичной тарификации использование модели выходит в 1,5-2 раза дешевле опенсорса.

Из интересного: пишут, что Alice AI LLM прошла все этапы обучения модели на данных Яндекса – от претрейна до SFT. До всех этих этапов модель прошла инициализацию опенсорсными весами – они использовались в качестве изначальных параметров модели. Но после обучения все параметры были изменены.

Подробнее тут.
4👍4🤔3👎1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Подробный туториал, который показывает, как с нуля собрать собственную систему распознавания аудио прямо на устройстве.

Используется модель LFM2-Audio-1.5B от LiquidAI, а все данные остаются приватными.

Полностью локальный пайплайн, который можно адаптировать под свои задачи и интегрировать где угодно.

Готовый разбор и код - по ссылке:

https://github.com/Liquid4All/cookbook/tree/main/examples/audio-transcription-cli
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🤔1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ США запускают национальный проект для искусственного интеллекта.

Президент США подписал указ о создании единой государственной ИИ-платформы. Проект, реализация которого поручена Министерству энергетики, должен радикально ускорить научные исследования и сократить циклы открытий в биотехнологиях и энергетике с нескольких лет до дней.

Инициатива мобилизует инфраструктуру 17 федеральных исследовательских центров. Их суперкомпьютеры и накопленные за десятилетия массивы научных данных будут использованы для обучения специализированных моделей. Новая платформа позволит ИИ-агентам автономно планировать эксперименты, проверять гипотезы и генерировать прогнозы в области химии, биологии и инженерии.
whitehouse.gov

✔️ OpenAI объединила голосовой и текстовый режимы в ChatGPT.

ChatGPT получил обновление, которое устраняет барьер между способами ввода: голосовой чат теперь интегрирован непосредственно в основное окно переписки. Это позволяет пользователям бесшовно переключаться между речью и набором текста, не переходя в отдельный режим.

Теперь во время голосовой сессии можно свободно просматривать историю сообщений, сгенерированные изображения или карты, а ответы ассистента автоматически дублируются в текстовом виде.

Функция уже доступна в мобильных приложениях и веб-версии. Для тех, кто хочет пользоваться голосовым интерфейсом отдельно, OpenAI оставила возможность вернуть его через настройки в разделе Voice Mode.
OpenAi в сети Х

✔️ Microsoft выпустила модель для управления компьютером.

Fara-7B — компактная агентная модель от Microsoft Research на базе Qwen2.5-VL для автономной работы с интерфейсами. Модель умеет анализировать скриншоты, генерировать команды для мыши и клавиатуры, предсказывая точные пиксельные координаты.

В бенчмарках Fara-7B обошла существующие решения и выполняет задачи в разы дешевле крупных моделей - средняя стоимость сессии составляет меньше 3-х центов. Веса модели опубликованы на Hugging Face под лицензией MIT.
microsoft.com

✔️ В Гарварде разработали модель для диагностики редких генетических заболеваний.

Гарвардская медшкола представила popEVE - нейросеть, способную с высокой точностью выявлять патогенные мутации в геноме для решения проблем диагностики редких наследственных болезней, причины которых врачи зачастую не могут найти годами.

PopEVE объединяет генеративный ИИ с языковой моделью для белков и статистикой человеческих популяций. Система умеет корректно сравнивать опасность мутаций, расположенных в абсолютно разных генах, и выдавать унифицированный клинический рейтинг риска. Предыдущие модели не справлялись с такой кросс-генной калибровкой.

Эффективность системы подтвердили на выборке из 30 000 пациентов. Модель успешно определила причину болезни в трети случаев и попутно обнаружила 123 гена, ранее не связывавшихся с развитием патологий.
harvard.edu

✔️ Grok 5 сразится с чемпионами League of Legends в 2026 году.

Илон Маск анонсировал амбициозный эксперимент: в 2026 году следующая версия модели xAI бросит вызов сильнейшим киберспортивным командам мира. Матч планируется не просто как шоу, а как критический тест на пути к AGI.

Для чистоты эксперимента инженеры введут жесткие технические ограничения, уравнивающие шансы. Модель не будет подключаться к API игры — она должна «смотреть» на монитор через камеру с имитацией обычного человеческого зрения. Скорость реакции и частоту кликов также лимитируют до физических возможностей человека. Предполагается, что Grok 5 освоит сложные механики MOBA-стратегии с нуля, опираясь только на чтение документации и самостоятельные эксперименты в ходе игры.
Elon Musk в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🏆 FuzzForge

AI-платформа для автоматизации рабочих процессов и управления агентами в AppSec, фаззинге и offensive security.

🔍 Ключевые возможности
🤖 AI-агенты — для анализа кода, реверс-инжиниринга и фаззинга.
🛠 Workflows as Code — описывайте и запускайте AppSec-процессы декларативно.
📈 Масштабируемое исследование уязвимостей - находите как 1-day, так и 0-day.
🔗 Интеграции с фаззерами — Atheris (Python), cargo-fuzz (Rust), OSS-Fuzz (в разработке).
🏢 Enterprise-ready — облачные тарифы для команд и корпоративного использования.

https://github.com/FuzzingLabs/fuzzforge_ai
3🔥1
📢 Сбер открывает доступ к флагманским моделям ИИ

Флагман линейки — GigaChat Ultra-Preview — крупная модель собственной разработки Сбера. Она уверенно превосходит DeepSeek по ключевым показателям, обучена на русском и поддерживает длинный контекст до 128 тысяч токенов. Ultra-Preview справляется с задачами аналитики, генерации текста и дообучения на собственных данных, обеспечивая точность и стабильность на высоком уровне.

💡Больше о моделях:
- 🚀GigaChat Ultra-Preview — 702B-MoE модель, полностью обученный с нуля. Топовая модель для бизнеса, аналитики и сложных проектов
- ⚡️GigaChat Lightning — компактная MoE-модель для быстрых локальных запусков и тестов, по качеству превосходит Qwen3-4B, а скорость с Multi-Token Prediction сравнима с Qwen3-1.7B
GitHub | HuggingFace | GitVerse
- 🎤 GigaAM-v3 — новое поколение моделей для распознавания речи с нормализацией и пунктуацией, минимизирует ошибки и обеспечивает удобное взаимодействие на русском языке
GitHub | HuggingFace | GitVerse
Модели GigaChat делают работу проще, помогают быстрее решать задачи и дают доступ к мощным инструментам ИИ для любых проектов.

Подробнее — в статье на Хабр.
8🔥5🥰3😁3
🖼️ Удаление водяных знаков с Sora2

Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.

🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.

📌 GitHub: https://github.com/dachensky/sora2-watermark-remover

#python
😢1