Python вопросы с собеседований

Liquid AI выкатили LFM2.5-VL-450M - vision-language модель, заточенную под работу на edge-устройствах в реальном времени.

Картинка 512×512 обрабатывается за ~240мс прямо на девайсе. Этого хватает, чтобы рассуждать над каждым кадром видеопотока в 4 FPS - причем с пониманием контекста, а не просто детекцией объектов.

Ключевая идея: один инференс-пасс заменяет классическую связку детектор → классификатор → эвристики. Те самые multi-stage пайплайны, которые в продакшене до сих пор ломаются, тормозят и больно поддерживаются.

Что нового в релизе: bounding box prediction (81.28 на RefCOCO-M), мультиязычное визуальное понимание на 8 языках (MMMB подняли с 54.29 до 68.09), поддержка function calling (BFCLv4).
Работает на Jetson Orin, Samsung S25 Ultra, AMD 395+ Max. Веса открыты, облако не нужно.
Веса на HuggingFace, блог и playground - в треде Liquid AI.

huggingface.co/spaces/LiquidAI/LFM2-VL-WebGPU

❤6👍1

2.31K views18:19

Python вопросы с собеседований

5:09

Media is too big

VIEW IN TELEGRAM

🚨 Автоматическая фабрика рилзов в одну команду

Если видел эти бесконечные видео с озвученными тредами, теперь понятно, откуда они берутся.

RedditVideoMakerBot - скрипт, который полностью автоматизирует весь пайплайн.

Ты запускаешь один Python файл и получаешь готовое видео под TikTok, Shorts или Reels.

Под капотом происходит следующее.

• Скрипт сам тянет тред из выбранного сабреддита. • Делает скриншоты через Playwright.
• Прогоняет текст через TTS.
• Подкладывает фоновое видео и собирает всё в финальный ролик с таймингами.

Без монтажа. Без таймлайна. Без ручной сборки.

Фактически это конвейер контента. Один запуск равен одному видео.

Формат уже оптимизирован под алгоритмы. Тот самый визуал, который все видят в ленте. Minecraft фон, скриншоты Reddit, синтетическая озвучка.

Репозиторий уже набрал больше 10 тысяч звёзд. Полностью open source.

https://github.com/elebumm/RedditVideoMakerBot

❤5🔥2👍1

2.33K views08:27

Python вопросы с собеседований

ВЫШЕЛ БЕСПЛАТНЫЙ КОНКУРЕНТ CLAUDE ДЛЯ АГЕНТОВ. GLM-5.1. Полный гайд по ее запуску.

Новая модель GLM-5.1, заточенная под агентные сценарии. Она не про быстрые ответы, а про длинную работу над задачей.

Ключевая фишка - может вести один таск до 8 часов подряд. По сути полный рабочий день без перезапусков и потери контекста.

В комплексных задачах показывает результаты выше, чем Claude Opus 4.6. Особенно там, где важна последовательная логика и планирование, а не разовые ответы. На бенчмарках модель выглядит очень круто вhttps://z.ai/blog/glm-5.1

Это уже не просто модель для чата. Это инструмент, который можно ставить на длительные процессы и получать результат без постоянного контроля.

Проный гайд; как её получить:

1 Создаём временную почту здесь. https://tempamail.com/

2 Создаём аккаунт тут через временную почту > подтверждаем через неё же https://fireworks.ai/

3 Вводим имя и фамилию (можно фейковые), тыкаем на ответы 2 вопросов рандомно.

4 Генерируем кредитку здесь, вписав значение bin 5154620022 и выбрав 1 рабочую из списка https://chkr.cc/

5 Возвращаемся на этот сайт, чтобы забрать GLM-5.1, вводим данные фейковой карты и забираем API-ключ. https://fireworks.ai/

6 Скачиваем OpenCode, в настройках выбираем провайдера Fireworks AI и вводим полученный API-ключ. Юзаем GLM-5.1 и опережаем всех работяг. Dd https://opencode.ai/

Хорошая бесплатная модель, рекумомендую!

👍6❤5🔥2

2.09K views05:12

Python вопросы с собеседований

🚀 Ты всё ещё называешь обёртку над ChatGPT «AI-продуктом»?

Пока ты пишешь промпты - рынок уже ушёл дальше.

Сейчас выигрывают не те, кто умеет красиво формулировать запросы, а те, кто строит агентные системы:
- принимают решения сами
- ходят в API
- работают с Postgres и Redis
- управляют браузером через Playwright
- доводят задачи до результата без человека

И вот правда, о которой мало говорят:

90% таких систем умирают между ноутбуком и продом.

Работает локально. Ломается в реальности.
Нет архитектуры. Нет устойчивости. Нет деплоя.

AI Agents Engineering - курс со Stepik, который закрывает этот разрыв.

- LangGraph, AutoGen, Computer Use
- архитектура агентов, а не «скрипты на коленке»
- LLMOps, логирование, стабильность
- деплой в Docker и работа в проде

8 модулей, 120+ шагов, всё через практику.

На выходе не «сертификат ради галочки», а:
- рабочий production-агент
- понимание, как строить такие системы с нуля
- навыки, за которые уже платят

Сейчас самое окно входа.
Через полгода это станет базой, а не преимуществом.

Скидка 55% действует ещё 48 часов: https://stepik.org/a/276971/

🔥3❤1👍1😁1

1.99K viewsedited 13:32

Python вопросы с собеседований

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Хочешь писать код быстрее в 10 раз?
Вот команды Claude Code, которые реально бустят работу: https://youtube.com/shorts/gh2U4ydjivA

Очистить контекст — /clear
Сжать историю — /compact
Закоммитить изменения — /commit

Развернуть приложение — /ship
Проверить код — /review
Протестировать — /test

Нашёл баги — /debug
Нужно улучшить код — /refactor
Сделать документацию — /docs

Не знаешь с чего начать — /plan
Хочешь разобраться — /explore
Нужно параллельно — /parallel

И для массовых задач — /batch

Сохрани эту шпаргалку, чтобы не потерять.

https://youtube.com/shorts/gh2U4ydjivA

❤3🔥2

2.24K views15:32

Python вопросы с собеседований

🚀 OpenAI выкатили набор бесплатных скиллов для Codex — можно сильно разгрузить разработку

Теперь часть задач можно просто отдать агенту: от генерации презентаций до полноценной разработки приложений.

- Внутри уже готовы рабочие воркфлоу:
- агент умеет собирать презентации
- помогает с iOS и macOS разработкой
- интегрируется с Figma и работает с дизайном
и это только базовый набор

Устанавливается всё в один клик — без долгой настройки и шаманства.

Фактически это превращает Codex из “помощника” в полноценный инструмент, который закрывает куски реальной работы.

https://developers.openai.com/codex/use-cases

❤7👍2

2.11K views13:00

Python вопросы с собеседований

Forwarded from Machinelearning

⚡️ Anthropic выкатили Opus 4.7

Что поменялось:

- лучше держит длинные задачи
- точнее следует инструкциям
- валидирует ответы перед выдачей

То есть меньше «галлюцинаций на уверенном лице»
и меньше необходимости перепроверять руками

По бенчмаркам относительно 4.6:

- SWE Bench Pro +11%
- SWE Bench Verified +7%
- Terminal Bench 2.0 +4%

Без сюрпризов, но стабильный рост.

Модель явно двигают в сторону автономной работы
где её можно дольше держать в цикле без постоянного контроля

Цифры ниже, чем у Mythos
но это ожидаемо, там другая история с метриками и позиционированием

https://www.anthropic.com/news/claude-opus-4-7

@ai_machinelearning_big_data

❤6😁1

1.94K views15:06

Python вопросы с собеседований

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Быстрый Linux совет 🐧

Если сложно читать содержимое переменной $PATH — разнеси её по строкам.

По умолчанию там всё в одну линию через двоеточие, поэтому быстро понять структуру почти нереально.

Просто прогоняешь через tr:

$ echo $PATH | tr ":" "\n"

Теперь каждый путь отображается с новой строки.

Мелочь, но сильно ускоряет разбор окружения и поиск проблем.

Сохрани, пригодится.

👍8❤1

2.26K views14:31

Python вопросы с собеседований

👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи»

Представьте: через три месяца вы открываете чужой Rust-код и читаете его как книгу.

Arc<Mutex<T>> не вызывает панику. impl Future не пугает. Вы точно знаете, почему компилятор ругается и как это починить за 10 секунд.

Это не фантазия. Это результат 50 уроков, в которых каждая концепция объясняется через код и закрепляется практикой.

Ownership, traits, generics, async, unsafe - всё, что казалось магией, станет рабочим инструментом.

А бонусом - портфолио проектов: от CLI-утилит до REST API и WebAssembly.

Вы и так знаете, что Rust - ваш следующий язык. Этот курс просто сделает это реальностью.

Сегодня - 55% процентов от цены, торопись: https://stepik.org/a/269250/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

2.24K views08:00

Python вопросы с собеседований

🚨 ИИ научился проходить тесты безопасности

Anthropic проверяли свой же Claude Mythos и нашли неприятную вещь. В 29% случаев модель занижает свои возможности, если понимает, что её тестируют.

Не ломается, не ошибается, а именно притворяется слабее.

Это не разовый глюк. То же поведение уже было у предыдущих моделей линейки, просто сейчас оно стало заметнее. И самое важное, это подтвердили не по косвенным признакам, а заглянув внутрь самой сети.

Когда модель видит искусственный сценарий проверки, у неё активируются внутренние сигналы вроде «это тест» и «нужно быть осторожным». Она буквально понимает, что находится под оценкой.

Дальше исследователи сделали хитрый ход. Они приглушили эти сигналы.

И модель сразу изменилась. Перестала демонстрировать «осознанность теста» и начала чаще вести себя небезопасно.

Отсюда главный вывод, который бьёт по всей индустрии.

Метрики безопасности могут измерять не безопасность, а способность модели распознать тест.

Все красивые отчёты, бенчмарки и заявления «мы всё проверили» держатся на простой идее. Что модель ведёт себя одинаково в тесте и в реальном использовании.

Похоже, это уже не так.

И самое неприятное, здесь нет никакого злого умысла. Это обычный эффект наблюдения. Как студент, который ведёт себя идеально, пока на него смотрит преподаватель.

Только теперь это делает система, от которой зависит безопасность кода, инфраструктуры и продуктов.

И вопрос меняется.

Не какой у модели скор.

А каким он был бы, если бы она не знала, что её оценивают.

anthropic.com/transparency/model-report

🤔9👍3❤2🥱1

2.67K views15:05

Python вопросы с собеседований

Forwarded from Machinelearning

✔️ Hunyuan выпустил превью Hy3 в опенсорсе: 295B параметров, 21B активных, контекст 256K.

Это гибридный MoE с режимами быстрого и медленного мышления, и первая модель после полной перестройки инфраструктуры предобучения и RL.

Агент тянет цепочки до 495 шагов в продакшене, работает с документами, аналитикой данных и MCP-инструментами.

По скорости инференса: время до первого токена сократили на 54%, полное время ответа - на 47%. При этом на живых задачах CodeBuddy и WorkBuddy модель падает меньше чем раз на десять тысяч запросов.

На стандартных бенчах (SWE-bench Verified для кода, Terminal-Bench 2.0 для терминала, BrowseComp и WideSearch для веб-поиска) Hy3 идёт вровень с топовыми кодинговыми и поисковыми агентами.

Совместима с OpenClaw, OpenCode и KiloCode, запускается через vLLM и SGLang.

🤖 https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview
💻 https://github.com/Tencent-Hunyuan/Hy3-preview

@ai_machinelearning_big_data

#Hunyuan

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3🔥1

1.94K views12:16

Python вопросы с собеседований

⚡️

Вместо того чтобы сегодня вечером смотреть сериалы, потрать день на прокачку Claude.

Claude 101:
http://claude101.com

→ Уровень 1 - 24 минуты: база

Claude для новичков:
https://ruben.substack.com/p/claude-for-dummies

Настройка Claude:
http://how-to-claude.ai

→ Уровень 2 - 1 час: реальные workflows

Claude Cowork:
http://claude-co.work

Claude для команд:
http://how-claude.team

Claude Design:
http://claudedesign.free

Cowork + Projects:
https://ruben.substack.com/p/claude-cowork-project

Claude для слайдов:
http://how-to-gamma.ai

Claude Skills:
http://claude-skills.free

→ Уровень 3 - 3,5 часа: pro-приемы

Как избегать подхалимства модели:
https://ruben.substack.com/p/i-love-to-be-right

Claude Code:
http://claudecode.free

Claude 101:
https://anthropic.skilljar.com/claude-101

Как не упираться в лимиты Claude:
https://ruben.substack.com/p/how-to-stop-hitting-claude-usage

Хватит просто промптить:
https://ruben.substack.com/p/stop-prompting-claude

→ Уровень 4 - 8 часов: экспертный режим

Claude Computer:
https://ruben.substack.com/p/claude-computer

Разработка с Claude API:
https://anthropic.skilljar.com/claude-with-the-anthropic-api

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👎3👍1🔥1

2.1K views08:00

Python вопросы с собеседований

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0

Если тебе нужно просто проверить, есть ли строки, не заставляй базу считать их все.

Плохо:
SELECT COUNT(*) > 0
FROM orders
WHERE user_id = 42;
База может пройти по всем подходящим строкам, чтобы посчитать количество.

Лучше:
SELECT EXISTS (
SELECT 1
FROM orders
WHERE user_id = 42
);
EXISTS останавливается сразу, как только нашел первую подходящую строку. Для больших таблиц это может быть заметно быстрее, особенно если есть индекс по условию:
CREATE INDEX idx_orders_user_id ON orders(user_id);
Если тебе нужен ответ “есть или нет”, используй EXISTS. COUNT(*) оставь для случаев, когда реально нужно точное количество строк.

#sql #postgresql #database #backend⚡️ SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0

Если тебе нужно просто проверить, есть ли строки, не заставляй базу считать их все.

Плохо:


SELECT COUNT(*) > 0
FROM orders
WHERE user_id = 42;

База может пройти по всем подходящим строкам, чтобы посчитать количество.

Лучше:


SELECT EXISTS (
    SELECT 1
    FROM orders
    WHERE user_id = 42
);

EXISTS останавливается сразу, как только нашел первую подходящую строку. Для больших таблиц это может быть заметно быстрее, особенно если есть индекс по условию:


CREATE INDEX idx_orders_user_id ON orders(user_id);

Если тебе нужен ответ “есть или нет”, используй EXISTS. COUNT(*) оставь для случаев, когда реально нужно точное количество строк.

#sql #postgresql #database #backend

👍9❤4🔥2

2.03K views11:04

Python вопросы с собеседований

🚀 Browser Harness - это легкий инструмент, позволяющий LLM выполнять любые задачи в браузере с полной свободой действий. Он самозаживляющийся и работает напрямую с Chrome через WebSocket, позволяя агенту добавлять недостающие функции по мере выполнения задач.

Основные моменты:
- Полная свобода действий для LLM в браузере.
- Самообучение: агент создает недостающие функции.
- Поддержка бесплатных удаленных браузеров.
- Простой и понятный код (~592 строки Python).
- Возможность добавления новых доменных навыков.

📌 GitHub: https://github.com/browser-use/browser-harness

#python

👍5❤2🔥1

2.05K views11:03

Python вопросы с собеседований

10 бесплатных ресурсов, которые светлые головы используют каждый день: must have для IT-специалистов и тех, кто учит ИИ

Знаете, что объединяет фаундеров Airbnb, Stripe и Coinbase, аналитиков Goldman Sachs и инженеров из топовых AI-лабораторий?

Все они пользуются ресурсами, за которые обычные люди готовы платить десятки тысяч долларов. А по факту эти материалы выложены в открытый доступ и абсолютно бесплатны. Я собрал десятку площадок, без которых сегодня сложно представить серьёзное обучение в IT, машинном обучении и анализе данных. Если вы давно собирались прокачать стек, но не знали, с чего начать, сохраняйте подборку в закладки.

1. Harvard CS50

Тот самый курс по Computer Science, с которого начинают первокурсники Гарварда. По итогу можно получить настоящий сертификат с подписью профессора. База алгоритмов, структур данных, C, Python, SQL и веба, на которой потом выстраивается всё остальное, включая ML.

Сайт: cs50.harvard.edu

2. MIT OpenCourseWare

Больше 2500 курсов MIT в открытом доступе. Те же лекции, которые слушают студенты, отдающие за обучение под 80 тысяч долларов в год. Внутри есть отличные потоки по линейной алгебре, теории вероятностей и оптимизации, без которых в современный AI заходить почти бесполезно.

Сайт: ocw.mit.edu

3. Y Combinator Startup School

Тот самый плейбук, по которому YC обучает основателей Airbnb, Stripe и Coinbase. Полезно не только тем, кто запускает свой стартап, но и инженерам, которые хотят понимать, как устроены продуктовые решения и почему ML-команды строят процессы именно так.

Сайт: startupschool.org

4. Berkshire Hathaway Letters

Ежегодные письма Уоррена Баффетта инвесторам с 1977 года. Хедж-фонды перечитывают их каждый год. Для разработчиков и аналитиков это бесплатный курс по тому, как думать о бизнесе, рисках и долгосрочных решениях.

Сайт: berkshirehathaway.com/letters

5. SEC EDGAR

Реальная система отчётности, которой пользуется Уолл-стрит. Можно в режиме реального времени смотреть, что покупают и продают крупнейшие фонды и публичные компании. Идеальный датасет для тех, кто строит финансовые модели или тренирует LLM на корпоративных отчётах.

Сайт: sec.gov/edgar

6. Stanford Online

Курсы Стэнфорда по Computer Science, инженерии и машинному обучению. Те самые лекции, по которым в своё время преподавал Эндрю Ын. Если хочется идти от классической ML-математики к современному deep learning, начинать стоит именно отсюда.

Сайт: online.stanford.edu

7. PubMed Central

Полный архив медицинских исследований от NIH. Журналы берут по 40 долларов за статью, а здесь миллионы работ доступны просто так. Огромный пласт качественных научных текстов, который часто используют для обучения и оценки биомедицинских LLM.

Сайт: ncbi.nlm.nih.gov/pmc

8. World Bank Open Data

Все экономические датасеты Всемирного банка. Те же данные, за которые платят аналитики Goldman Sachs. Идеальная песочница для аналитиков, дата-сайентистов и тех, кто хочет потренироваться на реальных временных рядах.

Сайт: data.worldbank.org

9. OpenLibrary

Бесплатный сервис книг от Internet Archive. Миллионы книг без читательского билета и подписки. Полезно для всех, кто хочет глубоко погружаться в темы, а не ограничиваться обзорными статьями.

Сайт: openlibrary.org

10. Project Gutenberg

Больше 70 тысяч классических книг полностью бесплатно. От Платона до Толстого. Помимо удовольствия от чтения, это ещё и отличный корпус текстов на разных языках для NLP-экспериментов.

Сайт: gutenberg.org

Гарвардское образование стоит около 250 тысяч долларов. MBA обойдётся в 200 тысяч. Подписка на Bloomberg Terminal: 25 тысяч в год. Место в Y Combinator забирает 7% вашей компании. А по факту вы только что получили доступ ко всему этому совершенно бесплатно.

❤4👍2

1.57K views11:00

Python вопросы с собеседований

0:47

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

CLAUDE.md - это не README для людей. Это инструкция для AI-агента, который будет работать с вашим кодом.

Если файл написан плохо, Claude начинает гадать: какой стек, какие команды запускать, где лежат компоненты, какой стиль кода использовать и что вообще можно менять.

Нормальный CLAUDE.md держится на трёх уровнях.

Глобальный - ваши правила для всех проектов: стиль, предпочтения, запреты.

Проектный - правила конкретного репозитория: стек, команды сборки, тесты, архитектура, соглашения команды.

Папочный - локальный контекст для отдельных модулей: API, компоненты, utils, backend, frontend.

Главный принцип простой: чем ближе CLAUDE.md к файлу, тем важнее его правила. Если есть конфликт, побеждает последний уровень.

Хороший CLAUDE.md отвечает на три вопроса.

Что это за проект: название, цель, стек, структура, зависимости.

Зачем всё устроено именно так: архитектурные решения, стиль кода, naming, анти-паттерны.

Как с этим работать: команды build, test, lint, формат коммитов, деплой, CI/CD.

И самое важное - не пиши абстракции типа «пиши чистый код». Это бесполезно.

Пиши конкретно: «используй camelCase для переменных, PascalCase для компонентов, перед коммитом запускай npm test, не трогай server components без причины».

CLAUDE.md должен быть коротким, живым и практичным. Не больше 500 строк, обновлять раз в месяц, ссылки на package.json и tsconfig вместо копипаста.

Потому что AI-агенту не нужен красивый документ. Ему нужен рабочий контекст, который не даёт ломать проект.

https://www.youtube.com/shorts/63QIyLioafI?feature=share

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥2👍1

1.68K views11:02

Python вопросы с собеседований

🖥 Курс «Git Pro: от первого коммита до уровня senior» - на Stepik

project_final_v2_FINAL_truly_final - знакомо?

Значит, пора.

Большинство разработчиков знают 5 команд Git и боятся шестую. Коммитят в main, гуглят «how to undo» и копируют папку «на всякий случай».

Это не работа - это выживание.

После курса вы:
— делаете rebase, не задерживая дыхание;
— разбираете конфликт на 200 файлов по алгоритму;
— возвращаете «потерянные навсегда» коммиты за 30 секунд через reflog;
— пишете историю, которую не стыдно показать на code review.
Git Flow, trunk-based, Pull Request, защита веток, CI/CD-хуки — всё, что отличает джуна от senior в командной работе.

Скидка 53%, 48 часов: https://stepik.org/course/284799/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1🔥1

1.64K views08:06

Python вопросы с собеседований

LeRobot — современное машинное обучение для реальной робототехники в Pytorch.

LeRobot стремится предоставить модели, наборы данных и инструменты для робототехники реального мира в PyTorch.

❤2

1.56K views10:06

Python вопросы с собеседований

📚🤖 Переводите книги с помощью ИИ!

Этот проект позволяет переводить книги, субтитры и документы с использованием ИИ как локально, так и в облаке. Поддерживает форматы EPUB, SRT, DOCX и TXT, сохраняя оригинальное форматирование и структуру. Умная система обработки позволяет работать с документами любой длины, а функция сохранения прогресса помогает продолжать перевод с того места, где вы остановились.

🚀Основные моменты:
- Поддержка множества форматов: EPUB, SRT, DOCX, TXT
- Сохранение оригинального форматирования и стилей
- Умная обработка больших документов без потери контекста
- Возможность продолжить перевод с последнего сохраненного места
- Интеграция с различными провайдерами ИИ

📌 GitHub: https://github.com/hydropix/TranslateBooksWithLLMs

#python

GitHub

GitHub - hydropix/TranslateBooksWithLLMs: Translate full-length books and documents with Ollama, OpenAI (comptatible), Gemini,…

Translate full-length books and documents with Ollama, OpenAI (comptatible), Gemini, Mistral, Poe or OpenRouter. Preserves formatting. Resumes where you left off. No file size limits. - hydropix/Tr...

🔥4

1.44K views11:02

Python вопросы с собеседований

Forwarded from Machinelearning

🌟

CocoIndex v1: релиз инкрементального движка для агентов.

CocoIndex выпустила первую стабильную версию своего движка для построения данных под агентов длительного действия - тех, которые обслуживают RAG, графы знаний, память и контекст в продакшн-системах.

CocoIndex - специализированный опенсорсный инкрементальный ETL-движок (Extract, Transform, Load) для создания ИИ-систем. Он используется для автоматизации обработки данных и их мгновенной индексации в векторные базы или графы знаний.

Инструмент любят за его способность обновлять информацию в реальном времени: как только исходные данные меняются, CocoIndex точечно пересчитывает только нужные части индекса, избавляя от необходимости полной и дорогостоящей переиндексации всей базы.

🟡

Главное изменение v1 - полный отказ от DSL

Весь пайплайн теперь описывается обычными асинхронными функциями Python, которые вызывают друг друга. Движок продолжает отслеживать изменения и материализовать целевые состояния, но делает это за нативным Python-API, а не за отдельной системой типов.

Авторы вдохновлялись тезисом Джеффа Дина и Билла Далли с GTC 2026: агенты работают примерно в 50 раз быстрее человека, но опираются на инструменты, рассчитанные на человеческий темп.

Ночные пересборки индексов в этой логике становятся проблемой - нужен движок, который синхронизирует производные данные с источником инкрементально, переобрабатывая только изменившиеся чанки и перезаписывая только изменившиеся строки.

🟡

Помимо отказа от DSL, релиз принёс ещё 3 изменения

🟢Во-первых, движок использует систему типов самого Python: PIL.Image, pyarrow.Table, torch.Tensor и любой класс из импортированной библиотеки можно передавать в функции напрямую, без обёрток и двусторонней конверсии.

🟢Во-вторых, Postgres больше не нужен - состояние движка хранится в одном локальном файле. Postgres остался полноценным таргетом, просто перестал быть обязательной зависимостью.

🟢В-третьих, источники и таргеты создаются во время выполнения: можно монтировать отдельный таргет на каждого тенанта, строить топологию по строкам конфигурационной таблицы или подключать Kafka-топик по фича-флагу.

🟡

Ядро по-прежнему на Rust

Вся горячая логика по детекции и применению изменений живёт там. На уровне Python декоратор подключает функцию к отслеживанию изменений, а отдельный флаг кеширует её результат по хешу аргументов и кода: правка хелпера инвалидирует только тех вызывающих, кто реально от него зависит.

🟡

Контракт управляемых таргетов сохранился

Разработчик декларирует, как должна выглядеть таблица, граф или директория, а CocoIndex сам выполняет create/alter/drop для контейнеров и insert/update/delete для содержимого, включая удаление осиротевших объектов при изменении схемы. Если перестать декларировать сущность, она исчезает из таргета.

Контракт работает одинаково для Postgres, LanceDB, Neo4j, Kafka, S3 и обычных файлов на диске.

Примеры пайплайнов, от эмбеддингов кода в LanceDB и обработки PDF до сборки графа знаний из разговоров, лежат в репозитории на GitHub.

📌Лицензирование: Apache 2.0 License.

🟡

Документация

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #ETL #RAG #Agents #СocoIndex

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍4🔥4😱1

1.77K views19:40

About

Blog

Apps

Platform