Big Data AI
17.1K subscribers
938 photos
121 videos
19 files
943 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
10 декабря — код, архитектура, AI в деле

Сбер открывает двери в мир AI: 10 декабря — в Москве и онлайн.

Что вас ждет?
⬩На сцене — доклады о развитии нейросетевых моделей GigaChat и Kandinsky, о ключевых этапах их разработки, практических достижениях и дальнейших перспективах развития;
⬩Гига Город — демо-стенды, постеры, инженерные споры, вопросы и тестирование архитектур;
⬩Воркшопы — повторяем решения инженеров, разбираем пайплайны и инструменты;
⬩Карьерный блок — разговоры с командами и открытые роли в AI-направлениях Сбера.

Зачем идти?
Чтобы увидеть, как строят AI-системы, задать вопросы инженерам и понять, куда движется AI в Сбере — и найти свое место в этом движении.

Регистрируйтесь и проверьте AI-технологии в деле.

Реклама. ПАО Сбербанк. ИНН 7707083893
👍31👎1😁1
🌍 Twitter Location Flags Extension

Расширение для Chrome, которое добавляет флаги стран к именам пользователей на Twitter/X, основываясь на их местоположении. Оно автоматически определяет пользователей и запрашивает информацию о местоположении через GraphQL API Twitter.

🚀Основные моменты:
- Отображает флаги стран рядом с именами пользователей
- Работает с динамически загружаемым контентом
- Кэширует данные о местоположении для снижения нагрузки на API
- Не требует передачи данных третьим лицам

📌 GitHub: https://github.com/RhysSullivan/twitter-account-location-in-username

#javascript
👍4
Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT 🔥

На протяжении двух дней будем общаться с разработчиками, инженерами, тестировщиками, продактами, дизайнерами и другими специалистами из ЮMoney. Они расскажут про свой опыт работы в большом финансовом продукте, поделятся лайфхаками и секретами.

Будут доклады по 16 направлениям:

🟣 Будущее финтеха
🟣 Бэкенд
🟣 Фронтенд
🟣 Тестирование
🟣 Python
🟣 Менеджмент проектов
🟣 Менеджмент продуктов
🟣 Системный анализ
🟣 SQL
🟣 UX
🟣 ИИ
🟣 Архитектура IT-решений
🟣 Внутренние системы
🟣 Мобильная разработка
🟣 Инфраструктура
🟣 О компании

Встречаемся онлайн 5 и 6 декабря в 11:00 мск. Чтобы участвовать, зарегистрируйтесь на сайте конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥21
🧳 MCPorter: TypeScript Toolkit for Model Context Protocol

MCPorter — это инструмент для работы с Model Context Protocol, позволяющий легко взаимодействовать с MCP-серверами. Он автоматически находит настроенные серверы, генерирует CLI и создает типизированные клиенты, упрощая автоматизацию и интеграцию.

🚀 Основные моменты:
- Автообнаружение MCP-серверов без конфигурации.
- Генерация CLI с помощью одной команды.
- Создание типизированных клиентов для взаимодействия с серверами.
- Удобный API для работы с методами и валидацией аргументов.
- Поддержка OAuth и различных транспортов.

📌 GitHub: https://github.com/steipete/mcporter

#typescript
👍1
На AI Journey презентовали крупнейший open-source проект в Европе: Сбер открыл доступ к своим флагманским моделям - GigaChat Ultra-Preview и Lightning, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи, все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite.

GigaChat Ultra-Preview, новая MoE-модель, 702 миллиарда параметров, собранная под русский язык и натренированная полностью с нуля. Читайте подробный пост от команды.

Впервые в России обучена MoE-модель такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение с нуля, да и ещё на таком масштабе, — это вызов, который приняли немногие команды в мире.

Флагманская модель Kandinsky Video Pro сравнялась с Veo 3 по визуальному качеству и обогнала Wan 2.2-A14B. Читайте подробный пост от команды.

Код и веса всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
👍5👎2😁2🥴1
✔️ Новый “Iceberg Index” от MIT показывает: современный ИИ уже технически способен выполнять работу, эквивалентную 11.7% всей зарплатной массы США - это около $1.2 трлн.

И это далеко больше, чем та малая «верхушка айсберга», которую мы видим сейчас в сфере IT.

Исследователи смоделировали 151 млн работников и 32 000 навыков, чтобы понять, где именно ИИ может заменить или усилить человека. Такой подход даёт раннее предупреждение — и политикам, и компаниям — о том, где начнётся реальное перераспределение труда и рост производительности.

Что важно:

- ИИ сегодня уже способен закрывать задачи на сумму 11.7% U.S. wage bill - примерно $1.2 трлн в год.
- Видимая экспозиция ИИ в технологиях и вычислениях - лишь 2.2% зарплатной стоимости, около $211 млрд.
То есть мы наблюдаем только пятую часть того, на что ИИ реально способен.

Мы обсуждаем ИИ в контексте увольнений, но забываем, что настоящие сдвиги — гораздо глубже.



https://www.cnbc.com/2025/11/26/mit-study-finds-ai-can-already-replace-11point7percent-of-us-workforce.html
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
Forwarded from Machinelearning
⚡️ В Ai Toolkit появилась поддержка обучения LoRA для Z-Image Turbo.

Ostris, разработчик популярного пакета для обучения диффузионных моделей добавил поддержку обучения для Z-Image Turbo с помощью De-Distill адаптера.

AI Toolkit — это универсальный набор инструментов для обучения диффузионных моделей на потребительском оборудовании. Он может запускаться как в GUI, так и в командной строке. Набор разработан так, чтобы быть простым в использовании, но при этом обладать всеми возможными функциями.


По первым тестам, обучение возможно на 12+ VRAM, а обучение персонажа на 17 изображениях длительностью 3000 шагов на RTX 5090 занимает примерно полтора часа.

Подробный гайд по процессу автор тулкита обещает выпустить в ближайшие дни.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Forwarded from Machinelearning
📌NVIDIA на NeurIPS 2025.

NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до 7 декабря в Сан-Диего.

🟡Автономный транспорт.

NVIDIA DRIVE Alpamayo-R1, или сокращенно AR1.
Это первая в мире открытая ризонинг-VLA модель специально для исследований в области автопилотов. Модель построена на базе NVIDIA Cosmos Reason и отлично поддается дообучению с помощью RL.

Alpamayo-R1 будет доступна на GitHub и Hugging Face, а фреймворк AlpaSim для тестов уже опубликован.

🟡Инструменты для создания физических роботов и симуляций.

Cosmos Cookbook - руководство с рецептами для физического ИИ и генерации синтетических данных и оценки моделей.

LidarGen - "модель мира", которая генерирует данные лидаров для симуляций.

Omniverse NuRec Fixer - инструмент мгновенного исправления артефактов в нейронных реконструкциях а робототехнике и БПЛА.

ProtoMotions3 - открытый фреймворк на базе Isaac Lab, позволяющий тренировать цифровых людей с невероятно реалистичной физикой.

🟡Но не только железом и роботами живет NVIDIA.

MultiTalker Parakeet - модель для ASR нескольких спикеров даже в быстром темпе и с перекрытиями.

В паре с ней идет Sortformer - инструмент для диаризации, т. е. разделения спикеров в аудиопотоке в реальном времени.

Ну и, конечно, NeMo Gym - библиотека для создания сред обучения с RL в комплекте с NeMo Data Designer, комплексом для создания и проверки синтетических наборов данных.

🟡И, наконец, о чистой науке.

К конференции NVIDIA подготовила более 70 научных работ. Вот лишь несколько жемчужин из этого списка:

Audio Flamingo 3. Это большая аудио-языковая модель, которая может "понимать" и анализировать аудиозаписи длительностью до 10 минут.

Minitron-SSM. Техника прунинга, которая позволила уменьшить модель Nemotron-H 8B с 8 до 4 млрд. параметров, при этом удвоив скорость инференса.

ProRL, или Prolonged Reinforcement Learning. Концепция, которая доказала, что продление процесса RL выводит модели на совершенно новый уровень в ризонинге.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
⚡️ OpenAI вводит «code red»: новый reasoning-модель уже на следующей неделе

OpenAI объявила внутренний «code red» - компания временно перераспределяет людей и мощности, чтобы сфокусироваться на усилении ChatGPT на фоне растущей конкуренции со стороны Google и других игроков.

Главное:

• Новый reasoning-модель выходит уже на следующей неделе — по внутренним тестам она обгоняет Google Gemini 3 и станет основой для Thinking Mode и Deep Research.
• Приоритет — качество продукта, а не монетизация: рекламные пилоты (включая шопинг-рекламу) продолжаются, но масштабный запуск отложен, пока команда улучшает персонализацию и UX для аудитории в 800+ млн пользователей в неделю.
• В рамках «code red» OpenAI усиливает персонализацию, ускоряет ответы, снижает число ненужных отказов и улучшает поведение моделей, чтобы повысить позиции ChatGPT в лидербордах вроде LMArena.
• Отдельный фокус — генерация изображений: после сильного релиза Google Nano Banana Pro OpenAI хочет удержать конкурентоспособность Imagegen в творческих и коммерческих сценариях.
• Стратегические ставки огромны: ChatGPT обслуживает ~70% глобальной «assistant-активности» и около 10% поиска. OpenAI рассчитывает удвоить выручку ($10B → $20B → ~$35B к 2027 году) и привлечь около $100B инвестиций на фоне давления со стороны Google и Anthropic.

Неделя обещает быть жаркой - впереди один из самых важных релизов OpenAI за год.

https://www.theinformation.com/articles/openai-ceo-declares-code-red-combat-threats-chatgpt-delays-ads-effort
1
This media is not supported in your browser
VIEW IN TELEGRAM
📊 Terminal Excel Viewer for Fast Data Management 🚀

Vex TUI - это мощный терминальный интерфейс для просмотра Excel и CSV файлов. Он предлагает шесть стильных тем, удобную навигацию с поддержкой Vim и множество функций для работы с данными, включая визуализацию и экспорт. Идеально подходит для тех, кто предпочитает работать в терминале.

🚀Основные моменты:
- Поддержка Excel и CSV файлов
- Шесть красивых тем оформления
- Визуализация данных с графиками
- Удобные клавиатурные сокращения
- Оптимизация для работы с большими файлами

📌 GitHub: https://github.com/CodeOne45/vex-tui
2