Machinelearning

🌟

Moebius: ультракомпактная модель для инпейнта изображений

Команда из китайского университета HUST и лаборатории VIVO AI Lab опубликовала проект Moebius для восстановления и дорисовки недостающих или удалённых фрагментов изображений.

Модель объёмом 220 млн параметров, по словам авторов, достигает качества, сопоставимого с системами на порядок большего размера, при значительно более высокой скорости работы.

На 6 тестовых наборах Moebius работает на уровне моделей с 10 млрд параметров (FLUX.1-Fill-Dev), а в отдельных случаях (сложные текстуры и правдоподобность лиц) превосходит их.

Скорость инференса составляет около 26 мс на один шаг вычислений, а суммарное ускорение более чем в 15 раз по сравнению с крупными системами.

🟡

Под капотом два решения

Первое, блок Local-λ Mix Interaction, который перестраивает механизм внимания, сводя пространственный и смысловой контекст к матрицам фиксированного размера.

Второе - дистилляция знаний от более крупной модели-учителя PixelHacker, выполненная в латентном пространстве.

На Hugging Face технический отчет Moebius занял первое место в ежедневном рейтинге статей, а сам проект подан на конференцию ECCV 2026.

Опубликованы код для дообучения и веса:

🟢

Базовый чекпоинт

🟠

Дообученная версия на Places2 (общие знания);

🟠

Дообученная версия на CelebA-HQ (фото знаменитостей);

🟠

Дообученная версия на FFHQ (люди с Flickr).

📌Лицензирование кода : Apache 2.0 License

📌Лицензирование моделей: MIT License

🟡

Страница проекта

🟡

Arxiv