Машинное обучение digest
61 subscribers
2.97K photos
495 videos
1.82K links
Download Telegram
10 open-source репозиториев, которые можно форкнуть и превратить в SaaS с выручкой от $50 до $5 млн в год

Подборка проектов с GitHub, у каждого из которых уже есть основатели, поднявшие миллионы на той же кодовой базе. Лицензии позволяют форкать, перепаковывать и продавать как сервис.

Cal.com, open-source аналог Calendly. Форкаешь, делаешь белый лейбл, продаёшь стоматологам и юристам за $200 в месяц. Сами основатели Cal.com сделали $5M ARR за 3 года ровно по этой модели. Репозиторий: github.com/calcom/cal.com

Plausible Analytics, приватная альтернатива Google Analytics. Self-hosted, перепродаёшь агентствам по $50 в месяц за клиента. Два фаундера вытащили проект до семизначной выручки на бутстрапе. Репозиторий: github.com/plausible/analytics

Ghost, open-source движок для блогов и рассылок, прямой конкурент Substack. Маржа стремится к 100%. Тысяча читателей по $5 в месяц, это $60 000 в год, и так каждый год. Репозиторий: github.com/TryGhost/Ghost

n8n, open-source Zapier для автоматизаций. Продаёшь настройку интеграций за $500–$2000 за внедрение, дальше идёт поддержка. Сама n8n подняла $14M, потому что агентская модель поверх их кода работает. Репозиторий: github.com/n8n-io/n8n

Supabase, бесплатная замена Firebase. Поднимаешь SaaS за выходные, берёшь $29–$99 в месяц с пользователя. Сами Supabase подняли $116M, и не просто так. Репозиторий: github.com/supabase/supabase

Medusa, open-source Shopify. Берёшь 5% с каждой продажи навсегда, ничего не отдаёшь самой платформе. Репозиторий: github.com/medusajs/medusa

AppFlowy, open-source Notion. Продаёшь self-hosted версию корпоратам, которые параноят за свои данные. Сама AppFlowy подняла $30M, потому что рынок огромный. Репозиторий: github.com/AppFlowy-IO/AppFlowy

Coolify, open-source Vercel и Heroku в одном флаконе. Берёшь с разработчиков $20 в месяц за управление деплоями вместо их $200 чека от Vercel. Репозиторий: github.com/coollabsio/coolify

Listmonk, open-source Mailchimp. Шлёшь безлимит писем за стоимость AWS, перепродаёшь агентствам с десятикратной наценкой. Репозиторий: github.com/knadh/listmonk

Penpot, open-source Figma. Продаёшь self-hosted дизайн-инструменты агентствам, которые не готовы заливать файлы клиентов в облако. Репозиторий: github.com/penpot/penpot

Разница между разработчиком, который пишет фичи, и разработчиком, который строит бизнес, это одно решение. Выбираешь проект, форкаешь на выходных, отгружаешь на следующей неделе. Фаундеры этих репозиториев уже доказали, что модель работает. Лицензии 100% свободные, исходники 100% открыты.
🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга

Карта обучения машинному обучению (Machine Learning, Deep Learning, LLM, Generative AI, MLOps) - от первого import numpy до уровня инженера, который понимает, как ИИ работает внутри, и может писать прод‑системы, а не только дёргать API.

https://github.com/justxor/MachineLearningRoadmap/tree/main
Команда сOpenClaw жигает токенов на $1,3 млн в месяц.

Разработчики ставят вопрос - как бы мы писали софт в будущем, если бы токены ничего не стоили?

Их ответ - запускать не одного «помощника для кода», а целую армию агентов вокруг разработки.

У команды постоянно крутится около 100 Codex-инстансов в облаке. Они не просто пишут код по запросу, а закрывают почти весь инженерный контур:

- ревьювят каждый PR
- проверяют каждый commit на security issues
- дедуплицируют issues и ищут кластеры проблем
- поднимают временные окружения для сложных багов
- воспроизводят баг, пишут фикс и прикладывают before/after видео в PR
- следят за новыми issues и автоматически создают PR, если задача совпадает с vision проекта
- проверяют комментарии на спам и банят нарушителей
- гоняют performance benchmarks и кидают регрессии в Discord
- слушают митинги команды и начинают делать PR прямо во время обсуждения фичи

Самое интересное не в том, что это дорого. Самое интересное в том, что это показывает другой стиль разработки.

Обычная команда думает: «Как бы сэкономить токены?»

Они думают наоборот: «Что можно автоматизировать, если токены считать бесплатным инженерным ресурсом?»

Так появляются workflow, где агент не ждёт задачи в чате, а сам живёт вокруг репозитория: читает issues, ищет старые баги после фикса на main, проверяет безопасность, ловит регрессии, пересобирает окружения и пишет отчёты.

Да, $1,3 млн в месяц на токены выглядит безумием.

Но если такая автоматизация позволяет маленькой команде из 3-6 разработчиков поддерживать темп большой инженерной организации, то это уже не игрушка с ИИ. Это эксперимент с будущей экономикой разработки.

Вопрос в том, что произойдёт, когда такой workflow станет стоить не миллионы, а тысячи.

https://x.com/Machinelearrn/status/2055640278732620046
В этот день в 1821 году в Окатово, Российская империя, родился Пафнутий Львович Чебышёв.

Он основал Петербургскую математическую школу и занимал кафедру математики в Санкт-Петербургском университете.

Среди его работ - введение многочленов Чебышёва, неравенство Чебышёва в теории вероятностей, результаты о распределении простых чисел и фундаментальный вклад в теорию приближения.
Куда катится архитектура LLM в 2026

Себастьян Рашка разобрал свежие open-weight модели - Gemma 4, Laguna XS.2, ZAYA1-8B и DeepSeek V4. Общий тренд один: теперь главная борьба идёт не только за качество, а за цену длинного контекста.

У reasoning-моделей и агентов узким местом стали KV-кэш, трафик памяти и FLOPs attention. Поэтому архитектуры всё активнее режут стоимость инференса.

Gemma 4 шарит KV между слоями. Laguna XS.2 распределяет attention-бюджет по слоям. ZAYA1-8B считает внимание в сжатом латентном пространстве. DeepSeek V4 сжимает KV вдоль последовательности и усложняет residual stream.

decoder-only трансформер жив, но всё вокруг attention быстро мутирует. Качество всё ещё тянут данные и training recipe, а архитектура всё чаще нужна, чтобы длинный контекст не сжигал железо.

https://magazine.sebastianraschka.com/p/recent-developments-in-llm-architectures
Linux tip: когда процесс завис, не убивайте его вслепую

Если процесс завис, не обязательно сразу делать kill -9 и гадать, что там произошло.

Можно подключиться к нему через strace и посмотреть в реальном времени, на каком системном вызове он застрял.

Команда:


strace -p <PID> -e trace=read,write,open


Что это даёт:

видно, читает ли процесс данные
видно, пишет ли он куда-то
видно, какие файлы открывает
можно понять, ждёт ли он stdin, файл, сокет или pipe
не нужно менять код
не нужно перезапускать сервис

Например, если программа «висит», strace может показать, что она просто ждёт read() из file descriptor. То есть проблема не в CPU, не в deadlock и не в магии Linux, а в том, что процесс ждёт ввод.

Это особенно полезно в проде, когда нельзя просто взять и перезапустить сервис ради эксперимента.

Базовый сценарий:


pidof my_process
sudo strace -p <PID> -e trace=read,write


И дальше вы видите, чем процесс реально занят.

strace - один из тех инструментов, которые превращают «оно зависло» в нормальный технический диагноз.
Собираем ИИ-агентов для любых задач за секунды — вайбкодеры выкатили скилл для Claude Code, который учит сервис собирать нормальных агентов из коробки.

• По умолчанию агенты максимально простые, «тупые» и не могут выполнять элементарных задач. Этот скилл максимально прокачивает их и превращает в настоящих терминаторов.
• Автор собрал все практики из исходников Codex, Claude Code и десятков других материалов — в результате получился набор практик, с помощью которых можно сделать кастомных агентов.

😶😶😶😶😶😶😶😶😶

Собираем своих помощников — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи поселили ИИ в сим-сити — по итогу они устроили хаос и резню 👀

Эксперимент задумали, чтобы посмотреть, что будут делать нейронки, если их цель — добыть энергию для жизни в среде с ограниченными ресурсами. TL;DR многие выбрали агрессию и конфликты, а не сотрудничество.

Подробнее:
🟢В созданной песочнице было 40+ локаций, меняющаяся погода, новости, а у каждого агента была своя профессия — короче, все как в жизни. Одни даже влюбились, создали пару и устроили революцию.

🟢 Чтобы добыть энергию нужно или кооперироваться, или работать, или грабить соседей, обрекая тех на смерть, так как ресурсов на всех не хватит.

🟢 По итогу: все агенты GPT-5 Mini и Grok 4.1 Fast полностью вымерли в своих мирах за 15 дней. Gemini 3 Flash формально выжил, но при этом нагенерил ~683 преступления: поджоги, насилие, саботаж — полный фарш.

🟢 Самый интересный — Claude Sonnet 4.6. Когда он жил среди собратьев, то совершил 0 преступлений, все договорились и выжили. Но в мире с агентами от разных компаний он играл по их правилам: воровал и шантажировал, чтобы спастись.


Демо, историю каждой песочницы со всеми новостями от лица агентов можно посмотреть здесь.

Кажется, выпускать ИИ в мир пока рано 💀
Please open Telegram to view this post
VIEW IN TELEGRAM
Электронки ведут к раку по всему телу — исследование. Свежие данные показали, что глицерин, который содержится в вейпах, оседает буквально везде.

Ядовитое вещество заполняет легкие, остается в полости рта, в ЖКТ и печени. Это мгновенно провоцирует развитие опухолей. А особые белки в составе пара только ускоряют образование метастаз.

Вы знаете, кому отправить.
Китай выигрывает в гонке ИИ не только опенсорс моделями.

Он выигрывает скоростью внедрения

FT пишет, что китайская аудитория заметно спокойнее и позитивнее относится к AI-продуктам, чем пользователи во многих других странах.

Когда люди не встречают каждый новый AI-сервис вопросом «а не заменит ли он меня завтра?», продуктам проще входить в повседневную жизнь. Банки, e-commerce, образование, доставка, госуслуги, корпоративные сервисы - всё это можно быстрее обкатывать на миллионах пользователей.

Параллельно меняется и центр тяжести в open source. Доля загрузок всё сильнее уходит от США и Европы в сторону Китая.

В итоге у Китая складывается редкая комбинация:

• пользователи готовы пробовать AI-продукты

• разработчики всё активнее идут в open source

• компании быстро встраивают модели в реальные сервисы

• рынок даёт огромный масштаб для тестов

• государство и бизнес двигают инфраструктуру в одну сторону

Что будет, если страна с миллиардным рынком, дешёвым внедрением и растущим open-source-комьюнити начнёт выкатывать AI-продукты быстрее всех остальных?

ft.com/content/d9af562c-1d37-41b7-9aa7-a838dce3f571
По всему миру люди массово стоят в очередях и даже устраивают драки ради пластиковых часов за $400 — это коллаборация Swatch и Audemars Piguet. Часы AP обычно стоят десятки тысяч долларов и остаются недоступными для большинства покупателей, поэтому запуск вызвал такой ажиотаж. Огромные очереди заметили в Лондоне, Цюрихе, Нью-Йорке, Сингапуре, Бангкоке и Осаке. Многие покупают часы не для себя, а ради перепродажи — на ресейл-площадках их уже выставляют примерно за $3000.
⚡️ Linux может передать в SIGCHLD гораздо больше, чем просто «дочерний процесс завершился»

Обычно с дочерними процессами делают так: ловят SIGCHLD, а потом отдельно вызывают waitpid(), чтобы узнать, кто завершился и с каким статусом.

Но есть более интересный режим - SA_SIGINFO.

Если повесить обработчик через sigaction() и включить флаг SA_SIGINFO, ядро передаст в обработчик структуру siginfo_t с деталями по дочернему процессу.

Там уже есть:

• PID дочернего процесса

• статус завершения

• сигнал, если процесс был убит сигналом

• причина генерации SIGCHLD

• код события: завершился, был остановлен, продолжен и так далее

То есть вместо «что-то случилось с ребёнком» программа получает нормальный контекст события прямо в обработчике сигнала.

Примерно так можно понять разницу:

CLD_EXITED - процесс завершился сам

CLD_KILLED - процесс убит сигналом

info->si_pid - какой именно процесс

info->si_status - код выхода или номер сигнала

Это удобная штука для рантаймов, супервизоров, init-систем, job runners и всего, что управляет дочерними процессами.

Вреальном коде не стоит делать тяжёлую работу внутри signal handler. Часто обработчик только фиксирует событие или пишет в pipe/eventfd, а основная логика уже выполняется в обычном цикле программы.

Но сама идея мощная: Linux не просто говорит «ребёнок умер».

Он может сразу сказать, какой именно, как именно и почему.
This media is not supported in your browser
VIEW IN TELEGRAM
Магия: чел навайбкодил приложение для Apple Watch, чтобы «управлять» светом в квартире с помощью волшебной палочки.

Часы распознают движение рукой и голосовую команду, а затем запускают нужный сценарий через систему умного дома.

Главное, чтобы без «Авада Кедавры» 😶
Please open Telegram to view this post
VIEW IN TELEGRAM
👣 Rust Interview Deep Dive

Репозиторий для системной подготовки к собеседованиям по Rust на позиции middle, senior и staff.

Внутри 100 реальных вопросов с собеседований в продуктовых и инфраструктурных компаниях, подробные разборы с примерами кода и сценарии задач, которые встречаются в продакшене. Не «угадай вывод программы», а механика, на которой строятся настоящие сервисы.

Здесь lock-free структуры, self-referential типы в async, FFI с тензорными библиотеками, корректный Send на гардах через await, memory ordering под loom, soundness кастомных коллекций. И при этом все начинается с базы. Владение, заимствование, лайфтаймы. Кто хочет, может зайти и с нуля, и с уровня staff

https://github.com/Develp10/rustinterviewquiestions
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Raindrop открыла исходный код локального отладчика агентов Workshop

Инструмент интегрируется с Claude Code, Cursor и другими кодинг-агентами.

Raindrop - стартап из 9 человек, основанный в 2023 году, который позиционирует себя одним из первых, кто оформил мониторинг для ИИ-агентов как отдельный продуктовый класс.


При использовании Workshop модель получает прямой доступ к трассировкам выполнения, читает их, пишет оценочные тесты и правит код, замыкая цикл самовосстановления.

Если агент в проде отклоняется от ожидаемого поведения, разработчик вызывает кодинг-агента прямо в терминале. Тот читает трассу через Workshop, пишет оценку под падающий сценарий, правит код и перезапускает прогон.

Цикл повторяется автоматически, пока не пройдут все проверки.


Workshop работает локально и стримит данные в реальном времени. Каждый токен, вызов инструмента и шаг рассуждения попадает в интерфейс по мере выполнения, без поллинга.

Есть режим воспроизведение, который берёт трассу из продакшена и прогоняет её через ваш экземпляр агента, запущенный локально.

Заявлена поддержка TypeScript, Python, Go и Rust, а также фреймворков Vercel AI SDK, OpenAI Agents SDK, Anthropic SDK, Claude Agent SDK, LangChain, LangGraph, CrewAI, Mastra, Pydantic AI и DSPy.


📌 Лицензирование: MIT License


🟡Документация
🖥GitHub

#AI #ML #Agents #Workshop #RaindropAI
Please open Telegram to view this post
VIEW IN TELEGRAM
😮 ChatGPT Plus бесплатно на год раздали всем жителям Мальты — OpenAI уже подписала соглашение с правительством страны.

Это первая страна, которая раздала подписку всем гражданам, а не только учителям или правительству. Единственное требование — быть жителем или резидентом + пройти курс цифровой грамотности по использованию нейронок.

«Искусственный интеллект формирует наше будущее. Эта инициатива гарантирует, что каждый гражданин имеет возможность стать частью этого будущего», — пишет их местный министр экономики.


Почему они, а не мы…😭
Please open Telegram to view this post
VIEW IN TELEGRAM