project_final_v2_FINAL_truly_final - знакомо?
Значит, пора.
Большинство разработчиков знают 5 команд Git и боятся шестую. Коммитят в main, гуглят «how to undo» и копируют папку «на всякий случай».
Это не работа - это выживание.
После курса вы:
— делаете rebase, не задерживая дыхание;
— разбираете конфликт на 200 файлов по алгоритму;
— возвращаете «потерянные навсегда» коммиты за 30 секунд через reflog;
— пишете историю, которую не стыдно показать на code review.
Git Flow, trunk-based, Pull Request, защита веток, CI/CD-хуки — всё, что отличает джуна от senior в командной работе.
Скидка 53%, 48 часов: https://stepik.org/course/284799/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
LeRobot — современное машинное обучение для реальной робототехники в Pytorch.
LeRobot стремится предоставить модели, наборы данных и инструменты для робототехники реального мира в PyTorch.
LeRobot стремится предоставить модели, наборы данных и инструменты для робототехники реального мира в PyTorch.
❤2
📚🤖 Переводите книги с помощью ИИ!
Этот проект позволяет переводить книги, субтитры и документы с использованием ИИ как локально, так и в облаке. Поддерживает форматы EPUB, SRT, DOCX и TXT, сохраняя оригинальное форматирование и структуру. Умная система обработки позволяет работать с документами любой длины, а функция сохранения прогресса помогает продолжать перевод с того места, где вы остановились.
🚀Основные моменты:
- Поддержка множества форматов: EPUB, SRT, DOCX, TXT
- Сохранение оригинального форматирования и стилей
- Умная обработка больших документов без потери контекста
- Возможность продолжить перевод с последнего сохраненного места
- Интеграция с различными провайдерами ИИ
📌 GitHub: https://github.com/hydropix/TranslateBooksWithLLMs
#python
Этот проект позволяет переводить книги, субтитры и документы с использованием ИИ как локально, так и в облаке. Поддерживает форматы EPUB, SRT, DOCX и TXT, сохраняя оригинальное форматирование и структуру. Умная система обработки позволяет работать с документами любой длины, а функция сохранения прогресса помогает продолжать перевод с того места, где вы остановились.
🚀Основные моменты:
- Поддержка множества форматов: EPUB, SRT, DOCX, TXT
- Сохранение оригинального форматирования и стилей
- Умная обработка больших документов без потери контекста
- Возможность продолжить перевод с последнего сохраненного места
- Интеграция с различными провайдерами ИИ
📌 GitHub: https://github.com/hydropix/TranslateBooksWithLLMs
#python
GitHub
GitHub - hydropix/TranslateBooksWithLLMs: Translate full-length books and documents with Ollama, OpenAI (comptatible), Gemini,…
Translate full-length books and documents with Ollama, OpenAI (comptatible), Gemini, Mistral, Poe or OpenRouter. Preserves formatting. Resumes where you left off. No file size limits. - hydropix/Tr...
🔥4
Forwarded from Machinelearning
CocoIndex выпустила первую стабильную версию своего движка для построения данных под агентов длительного действия - тех, которые обслуживают RAG, графы знаний, память и контекст в продакшн-системах.
CocoIndex - специализированный опенсорсный инкрементальный ETL-движок (Extract, Transform, Load) для создания ИИ-систем. Он используется для автоматизации обработки данных и их мгновенной индексации в векторные базы или графы знаний.
Инструмент любят за его способность обновлять информацию в реальном времени: как только исходные данные меняются, CocoIndex точечно пересчитывает только нужные части индекса, избавляя от необходимости полной и дорогостоящей переиндексации всей базы.
Весь пайплайн теперь описывается обычными асинхронными функциями Python, которые вызывают друг друга. Движок продолжает отслеживать изменения и материализовать целевые состояния, но делает это за нативным Python-API, а не за отдельной системой типов.
Авторы вдохновлялись тезисом Джеффа Дина и Билла Далли с GTC 2026: агенты работают примерно в 50 раз быстрее человека, но опираются на инструменты, рассчитанные на человеческий темп.
Ночные пересборки индексов в этой логике становятся проблемой - нужен движок, который синхронизирует производные данные с источником инкрементально, переобрабатывая только изменившиеся чанки и перезаписывая только изменившиеся строки.
Вся горячая логика по детекции и применению изменений живёт там. На уровне Python декоратор подключает функцию к отслеживанию изменений, а отдельный флаг кеширует её результат по хешу аргументов и кода: правка хелпера инвалидирует только тех вызывающих, кто реально от него зависит.
Разработчик декларирует, как должна выглядеть таблица, граф или директория, а CocoIndex сам выполняет create/alter/drop для контейнеров и insert/update/delete для содержимого, включая удаление осиротевших объектов при изменении схемы. Если перестать декларировать сущность, она исчезает из таргета.
Контракт работает одинаково для Postgres, LanceDB, Neo4j, Kafka, S3 и обычных файлов на диске.
Примеры пайплайнов, от эмбеддингов кода в LanceDB и обработки PDF до сборки графа знаний из разговоров, лежат в репозитории на GitHub.
@ai_machinelearning_big_data
#AI #ML #ETL #RAG #Agents #СocoIndex
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍4🔥4😱1
Обычный поиск работает так: есть вопрос - база находит top-k самых похожих фрагментов. Это удобно, если нужно вытащить один факт.
Но если ответ спрятан в нескольких местах, например в разных документах, сообщениях или частях отчёта, простого similarity search уже мало. Нужно понять, как связаны люди, события, компании, причины и последствия.
На этом и делает акцент FalkorDB GraphRAG-Bench. Самый большой отрыв у GraphRAG виден именно в сложных задачах: Complex Reasoning - 83.61 и Contextual Summarization - 85.08. То есть там, где нужно не просто найти похожий текст, а собрать смысл из нескольких связанных фрагментов.
Простой вывод: если у вас база знаний, длинные документы или корпоративные данные, одного Vector DB может быть недостаточно. GraphRAG помогает модели не просто искать, а идти по связям.
GraphRAG SDK полностью open-source: https://github.com/FalkorDB/GraphRAG-SDK
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Когда Вайбкодера просят объяснить логику работы Кода.
😁11❤8👍4
⚙️ Генерация CAD моделей с текстом
Этот проект предоставляет открытый инструмент для создания 3D моделей с помощью текстовых описаний. Используйте кодовые агенты, такие как Codex, для генерации и экспорта CAD моделей в различных форматах, включая STEP и STL. Локальный просмотрщик позволяет удобно инспектировать созданные модели.
🚀Основные моменты:
- Генерация CAD моделей с помощью текстовых описаний.
- Экспорт в форматы STEP, STL, DXF и URDF.
- Локальный просмотрщик для инспекции созданных геометрий.
- Поддержка стабильных ссылок для точных редактирований.
- Быстрая проверка и итерация моделей.
📌 GitHub: https://github.com/earthtojake/text-to-cad
Этот проект предоставляет открытый инструмент для создания 3D моделей с помощью текстовых описаний. Используйте кодовые агенты, такие как Codex, для генерации и экспорта CAD моделей в различных форматах, включая STEP и STL. Локальный просмотрщик позволяет удобно инспектировать созданные модели.
🚀Основные моменты:
- Генерация CAD моделей с помощью текстовых описаний.
- Экспорт в форматы STEP, STL, DXF и URDF.
- Локальный просмотрщик для инспекции созданных геометрий.
- Поддержка стабильных ссылок для точных редактирований.
- Быстрая проверка и итерация моделей.
📌 GitHub: https://github.com/earthtojake/text-to-cad
❤5
Forwarded from Python/ django
Python 3.15 beta 1 вышела в релиз 🐍
Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.
Что интересного в 3.15:
- lazy imports через ключевое слово
- встроенные
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию
Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.
https://blog.python.org/2026/05/python-3150-beta-1/
Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.
Что интересного в 3.15:
- lazy imports через ключевое слово
lazy- встроенные
frozendict и sentinel- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию
Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.
https://blog.python.org/2026/05/python-3150-beta-1/
❤3👍3
Forwarded from Machinelearning
Baidu выпустила языковую модель Ernie 5.1 с закрытыми весами. Затраты на претрейн составили 6% от типичного бюджета для моделей этого класса.
Новинка построена на базе Ernie 5.0, но содержит треть от общего числа параметров и использует вдвое меньше активных параметров при инференсе.
В Arena Search Leaderboard модель заняла 1 место среди китайских сетей и 4 в мире. По заявлению Baidu, в тестах агентов Ernie 5.1 обходит DeepSeek-V4-Pro, а в логике и математике сопоставима с Gemini 3.1 Pro.
Экономия вычислений достигнута за счет методики Once-For-All. Baidu обучала семейство моделей за один проход: сети делят общие веса, варьируясь по глубине и количеству активных блоков MoE.
Основной претрейн выполнили при создании Ernie 5.0, для версии 5.1 потребовалось только извлечь оптимальную конфигурацию.
Для борьбы с эффектом качелей (падение креативности при улучшении логики) применили четырехэтапный файнтюн: SFT, параллельная тренировка узкоспециализированных экспертов, дистилляция их навыков в единую модель-ученика и финальный RL.
Доступ к Ernie 5.1 открыт через онлайн-площадки компании.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥1
В Python 3.14.5 из-за утечек памяти возвращён старый сборщик мусора
Опубликован корректирующий выпуск языка программирования Python 3.14.5, в котором помимо исправления ошибок и незначительных уязвимостей, осуществлён возврат на старый сборщик мусора, применявшийся до ветки 3.14.x. В качестве причин внесения нетипичного для промежуточных выпусков значительного изменения называются жалобы пользователей на существенное повышение потребления памяти после перевода рабочих систем на ветку 3.14 и появление утечек памяти.
Подробнее:
https://opennet.ru/65445/
https://opennet.me/65445/
Опубликован корректирующий выпуск языка программирования Python 3.14.5, в котором помимо исправления ошибок и незначительных уязвимостей, осуществлён возврат на старый сборщик мусора, применявшийся до ветки 3.14.x. В качестве причин внесения нетипичного для промежуточных выпусков значительного изменения называются жалобы пользователей на существенное повышение потребления памяти после перевода рабочих систем на ветку 3.14 и появление утечек памяти.
Подробнее:
https://opennet.ru/65445/
https://opennet.me/65445/
😱8❤2👍2🔥1
Представьте: через три месяца вы открываете чужой Rust-код и читаете его как книгу.
Arc<Mutex<T>> не вызывает панику. impl Future не пугает. Вы точно знаете, почему компилятор ругается и как это починить за 10 секунд.
Это не фантазия. Это результат 50 уроков, в которых каждая концепция объясняется через код и закрепляется практикой.
Ownership, traits, generics, async, unsafe - всё, что казалось магией, станет рабочим инструментом.А бонусом - портфолио проектов: от CLI-утилит до REST API и WebAssembly.
Вы и так знаете, что Rust - ваш следующий язык. Этот курс просто сделает это реальностью.
Сегодня - 55% процентов от цены, торопись: https://stepik.org/a/269250/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2👎2🔥1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Разрешения получили около 10 компаний (Alibaba, Tencent, ByteDance и JD и дистрибьюторы Lenovo и Foxconn). Квота составляет до 75 тысяч чипов на клиента. Правительство КНР остановило сделки для перевода инфраструктуры на локальные аналоги.
Дополнительным барьером стала новая схема логистики от администрации США. Ведомство требует 25% выручки от продаж, для чего обязали физически провозить электронику через американскую территорию перед отправкой заказчикам. Китайские регуляторы видят в таком маршруте риск компрометации цепочек поставок и установки аппаратных закладок.
Для проведения переговоров по контрактам глава Nvidia присоединился к миссии США в Пекине.
reuters.com
До 13 июля пользователи платных тарифов Pro, Max, Team и Enterprise смогут обращаться к ИИ-ассистенту в полтора раза чаще. Новые еженедельные квоты и действуют во всех рабочих средах: CLI, расширениях для IDE, а также в десктопной и веб-версиях.
Это расширение станет отличным подспорьем для разработчиков, поскольку 50-процентная надбавка суммируется с обновлением прошлой недели, когда Anthropic в 2 раза увеличила лимиты на пятичасовые сессии. Никаких дополнительных действий для активации нового лимита не требуется.
ClaudeDevs в сети Х
OpenAI добавила функцию удаленного управления Codex в мобильное приложение ChatGPT. Мобильный клиент в реальном времени транслирует скриншоты среды, логи терминала, результаты тестов и diff-файлы. Пользователь может проверять промежуточные результаты, корректировать действия ИИ и подтверждать выполнение команд без физического доступа к ПК.
Соединение устройств идет через внутренний ретранслятор без прямого доступа к машине из публичного интернета. Исходный код, ключи и локальные настройки не покидают рабочую среду. Одновременно OpenAI выпустила функцию Remote SSH для запуска агента в корпоративных инфраструктурах.
Управление агентом со смартфона доступно на всех тарифах. Для подключения необходимо обновить мобильный ChatGPT и десктопный клиент для macOS. Поддержка Windows ожидается позже.
openai.com
О новых правилах объявил Томас Дитерих. Согласно политике, авторы несут полную ответственность за содержимое препринтов, включая плагиат, предвзятость и фактические ошибки языковых моделей.
Поводом для блокировки аккаунта станут явные следы ИИ-генерации: выдуманные источники в списке литературы, забытые ответы чат-ботов или просьбы заполнить таблицу реальными данными экспериментов.
Нарушители лишаются права публиковаться на один год. После истечения бана прямая загрузка препринтов для них останется недоступной, для размещения статьи потребуется предоставить доказательства ее принятия авторитетным рецензируемым изданием или конференцией.
Ведущий модератор раздела CS.LG сервиса arXiv
Британский институт безопасности ИИ протестировал модели GPT-5.5 и Claude Mythos на способность к автономному хакингу. По данным исследователей, нейросети прервали предыдущий тренд на удвоение сложности решаемых задач каждые 4,7 месяца, показав результаты за пределами измерительной шкалы института.
Модели проверяли на изолированных стендах с имитацией корпоративных сетей. Задачи включали поиск уязвимостей, веб-эксплуатацию и реверс-инжиниринг. Для тестов контекстное окно ограничивали 2,5 млн токенов. В этих условиях Claude Mythos первым прошел оба комплексных сценария: "The Last Ones" и инфраструктуру "Cooling Tower", требующих планирования многоэтапной атаки. GPT-5.5 также показала высокие результаты.
По оценкам AISI, при использовании агентной архитектуры и снятии лимита на токены доля успешных взломов приближается к 100%, из-за чего вычислить предел возможностей новых моделей пока не удается.
aisi.gov.uk
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3🔥1
10 open-source репозиториев, которые можно форкнуть и превратить в SaaS с выручкой от $50 до $5 млн в год
Подборка проектов с GitHub, у каждого из которых уже есть основатели, поднявшие миллионы на той же кодовой базе. Лицензии позволяют форкать, перепаковывать и продавать как сервис.
Cal.com, open-source аналог Calendly. Форкаешь, делаешь белый лейбл, продаёшь стоматологам и юристам за $200 в месяц. Сами основатели Cal.com сделали $5M ARR за 3 года ровно по этой модели. Репозиторий: github.com/calcom/cal.com
Plausible Analytics, приватная альтернатива Google Analytics. Self-hosted, перепродаёшь агентствам по $50 в месяц за клиента. Два фаундера вытащили проект до семизначной выручки на бутстрапе. Репозиторий: github.com/plausible/analytics
Ghost, open-source движок для блогов и рассылок, прямой конкурент Substack. Маржа стремится к 100%. Тысяча читателей по $5 в месяц, это $60 000 в год, и так каждый год. Репозиторий: github.com/TryGhost/Ghost
n8n, open-source Zapier для автоматизаций. Продаёшь настройку интеграций за $500–$2000 за внедрение, дальше идёт поддержка. Сама n8n подняла $14M, потому что агентская модель поверх их кода работает. Репозиторий: github.com/n8n-io/n8n
Supabase, бесплатная замена Firebase. Поднимаешь SaaS за выходные, берёшь $29–$99 в месяц с пользователя. Сами Supabase подняли $116M, и не просто так. Репозиторий: github.com/supabase/supabase
Medusa, open-source Shopify. Берёшь 5% с каждой продажи навсегда, ничего не отдаёшь самой платформе. Репозиторий: github.com/medusajs/medusa
AppFlowy, open-source Notion. Продаёшь self-hosted версию корпоратам, которые параноят за свои данные. Сама AppFlowy подняла $30M, потому что рынок огромный. Репозиторий: github.com/AppFlowy-IO/AppFlowy
Coolify, open-source Vercel и Heroku в одном флаконе. Берёшь с разработчиков $20 в месяц за управление деплоями вместо их $200 чека от Vercel. Репозиторий: github.com/coollabsio/coolify
Listmonk, open-source Mailchimp. Шлёшь безлимит писем за стоимость AWS, перепродаёшь агентствам с десятикратной наценкой. Репозиторий: github.com/knadh/listmonk
Penpot, open-source Figma. Продаёшь self-hosted дизайн-инструменты агентствам, которые не готовы заливать файлы клиентов в облако. Репозиторий: github.com/penpot/penpot
Разница между разработчиком, который пишет фичи, и разработчиком, который строит бизнес, это одно решение. Выбираешь проект, форкаешь на выходных, отгружаешь на следующей неделе. Фаундеры этих репозиториев уже доказали, что модель работает. Лицензии 100% свободные, исходники 100% открыты.
Подборка проектов с GitHub, у каждого из которых уже есть основатели, поднявшие миллионы на той же кодовой базе. Лицензии позволяют форкать, перепаковывать и продавать как сервис.
Cal.com, open-source аналог Calendly. Форкаешь, делаешь белый лейбл, продаёшь стоматологам и юристам за $200 в месяц. Сами основатели Cal.com сделали $5M ARR за 3 года ровно по этой модели. Репозиторий: github.com/calcom/cal.com
Plausible Analytics, приватная альтернатива Google Analytics. Self-hosted, перепродаёшь агентствам по $50 в месяц за клиента. Два фаундера вытащили проект до семизначной выручки на бутстрапе. Репозиторий: github.com/plausible/analytics
Ghost, open-source движок для блогов и рассылок, прямой конкурент Substack. Маржа стремится к 100%. Тысяча читателей по $5 в месяц, это $60 000 в год, и так каждый год. Репозиторий: github.com/TryGhost/Ghost
n8n, open-source Zapier для автоматизаций. Продаёшь настройку интеграций за $500–$2000 за внедрение, дальше идёт поддержка. Сама n8n подняла $14M, потому что агентская модель поверх их кода работает. Репозиторий: github.com/n8n-io/n8n
Supabase, бесплатная замена Firebase. Поднимаешь SaaS за выходные, берёшь $29–$99 в месяц с пользователя. Сами Supabase подняли $116M, и не просто так. Репозиторий: github.com/supabase/supabase
Medusa, open-source Shopify. Берёшь 5% с каждой продажи навсегда, ничего не отдаёшь самой платформе. Репозиторий: github.com/medusajs/medusa
AppFlowy, open-source Notion. Продаёшь self-hosted версию корпоратам, которые параноят за свои данные. Сама AppFlowy подняла $30M, потому что рынок огромный. Репозиторий: github.com/AppFlowy-IO/AppFlowy
Coolify, open-source Vercel и Heroku в одном флаконе. Берёшь с разработчиков $20 в месяц за управление деплоями вместо их $200 чека от Vercel. Репозиторий: github.com/coollabsio/coolify
Listmonk, open-source Mailchimp. Шлёшь безлимит писем за стоимость AWS, перепродаёшь агентствам с десятикратной наценкой. Репозиторий: github.com/knadh/listmonk
Penpot, open-source Figma. Продаёшь self-hosted дизайн-инструменты агентствам, которые не готовы заливать файлы клиентов в облако. Репозиторий: github.com/penpot/penpot
Разница между разработчиком, который пишет фичи, и разработчиком, который строит бизнес, это одно решение. Выбираешь проект, форкаешь на выходных, отгружаешь на следующей неделе. Фаундеры этих репозиториев уже доказали, что модель работает. Лицензии 100% свободные, исходники 100% открыты.
❤4👍3😁3🔥2🌚1
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.
Roadmap разбит на 7 треков:
1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety
Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.
В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.
Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.
По времени тоже без сказок:
1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация
Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!
Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥6👍4