Big Data AI
16.9K subscribers
922 photos
118 videos
19 files
924 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
AI дает ответ, но не по теме?

LLM отвечают на любой вопрос — даже когда не знают ответ, часто галлюцинируют и опираются на недостоверные источники.


С сервисом Evolution Managed RAG от Cloud.ru вы можете легко и быстро создать AI-помощника для семантического поиска по документам, сайту или базе знаний.

С помощью такого помощника можно:
😶‍🌫️сократить время на поиск

😶‍🌫️автоматизировать рутину

😶‍🌫️повысить точность ответов модели


В Evolution Managed RAG от Cloud.ru все уже готово к использованию, без подбора векторных баз данных и сложной настройки. Просто загрузите ваши документы в хранилище — сервис автоматически обработает их, создав базу знаний для AI-помощника.

Попробуйте
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
🚀 Мощный движок для мультимодальных моделей

LMMs-Engine — это легкий и гибкий фреймворк для обучения мультимодальных моделей. Он поддерживает множество архитектур и оптимизирован для работы на больших масштабах, обеспечивая высокую эффективность и простоту использования.

🚀 Основные моменты:
- Поддержка 19+ архитектур, включая модели для обработки текста, изображений и видео.
- Оптимизации для распределенного обучения и снижения потребления памяти.
- Удобные примеры запуска для различных моделей.

📌 GitHub: https://github.com/EvolvingLMMs-Lab/lmms-engine🚀 Мощный движок для многомодальных моделей
2
Какие планы на 19 ноября?

ML-инженеры, дата-аналитики и все, кто работает с машинным обучением, бронируйте вечерний слот в календарях, потому что команда Купер.тех зовет вас на митап в Москве и онлайн.

В программе:

🟢 Первый шаг к векторному поиску

Игорь Самарин, Machine Learning Engineer в Купер.тех

🟢 Применение LLM в поиске для разметок

Александр Баранов, Data Analyst в Купер.тех

🟢 Как картинки находят себе пары

Николай Чугунников, Senior Machine Learning Engineer в Купер.тех

🟢 От интуиции к алгоритмам: data-driven подход к массовому найму

Вадим Грошев, Machine Learning Engineer в Купер.тех

Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию.

Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFGdhm9a
1🔥1
📝🚀 Kimi Writing Agent: Автономный писатель для создания книг и рассказов

Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.

🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени

📌 GitHub: https://github.com/Doriandarko/kimi-writer

#python
4🔥1
Смотришь вакансии AI/LLM Engineer. Часто видишь:
Опыт с LangChain
RAG-системы и векторный поиск
Агенты и tool-calling
Промпт-инжиниринг и работа с LLM API

В резюме этого нет? Дальше не смотрят.

Курс «LangChain: с нуля до продакшн» покрывает эти навыки:
LangChain на практике (цепочки, агенты, инструменты)
RAG с метриками качества (precision/recall, faithfulness)
Tool-calling и агенты (веб-поиск, Pandas-аналитика)
Продакшн-контур: FastAPI, observability, PromptOps
Проект в GitHub + сертификат = можешь писать в резюме "опыт с LangChain, RAG, агентами".

Скидка 25% — 72 часа.

Начать со скидкой
2
🚀 **VibeThinker-1.5B** - модель, которая ломает миф «больше параметров = умнее».

Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)

💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.

🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.

🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
👍1
# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал

Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.

Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.

💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.

🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.

🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.

> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
4🔥4
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31🤡1
🎮 Погружение в мир AI-социума

Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.

🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами

📌 GitHub: https://github.com/KsanaDock/Microverse

#gdscript
🤖 Claude Code Infrastructure Showcase

Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.

🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена

📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase

#typescript
1
🔥 Как аналитика данных трансформирует промышленное планирование — опыт лидеров отрасли

⚡️ Приглашаем 18 ноября (10:00–13:00, Москва) на отраслевое событие FanRuan о практическом применении аналитики в производстве. Разберем реальные кейсы, технологии прогнозирования и инструменты для принятия решений, чтобы планирование стало точнее, а загрузка мощностей — сбалансированной.
Что посмотрим и обсудим:

НЛМК (Роман Кулеш) — аналитика производственных планов, контроль выполнения Plan/Fact и архитектура BI для планирования;
ММК (Сергей Кулагин) — как визуализация ускоряет поиск узких мест и помогает принимать решения;
FanRuan (Zayne Zhao) — практический подход к прогнозированию спроса: от классификации спроса до связи плана с исполнением, и демонстрация возможностей продуктов FanRuan.

❗️ Для кого будет полезно: руководители и специалисты производств, аналитики и планировщики, ИТ и бизнес-подразделения, отвечающие за аналитику и цифровизацию.

❗️ Почему стоит прийти: реальные кейсы от лидеров металлургии и практические подходы к внедрению прогнозов на основе ИИ — без теории, только рабочие инструменты и примеры внедрения.

Регистрация обязательна — количество мест ограничено!

Реклама. ИП Чичерин-Лукьяненко Андрей Игоревич. ИНН 772830905927. erid: 2VtzqvLYND7
Please open Telegram to view this post
VIEW IN TELEGRAM
XLTable - OLAP Cервер для нового стека данных
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.

Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.

📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке

🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов

⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования

Хочешь получить бесплатную пробную версию на 30 дней?

👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой

Контакт: https://xn--r1a.website/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/
7🔥7👍4
🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей

Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.

📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков

🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.

🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)

💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.

Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.

https://www.alphaxiv.org/abs/2511.02864v1
👍5🔥1