Команда из китайского университета HUST и лаборатории VIVO AI Lab опубликовала проект Moebius для восстановления и дорисовки недостающих или удалённых фрагментов изображений.
Модель объёмом 220 млн параметров, по словам авторов, достигает качества, сопоставимого с системами на порядок большего размера, при значительно более высокой скорости работы.
На 6 тестовых наборах Moebius работает на уровне моделей с 10 млрд параметров (FLUX.1-Fill-Dev), а в отдельных случаях (сложные текстуры и правдоподобность лиц) превосходит их.
Скорость инференса составляет около 26 мс на один шаг вычислений, а суммарное ускорение более чем в 15 раз по сравнению с крупными системами.
Первое, блок Local-λ Mix Interaction, который перестраивает механизм внимания, сводя пространственный и смысловой контекст к матрицам фиксированного размера.
Второе - дистилляция знаний от более крупной модели-учителя PixelHacker, выполненная в латентном пространстве.
На Hugging Face технический отчет Moebius занял первое место в ежедневном рейтинге статей, а сам проект подан на конференцию ECCV 2026.
Опубликованы код для дообучения и веса:
@ai_machinelearning_big_data
#AI #ML #Diffusers #InPaint #Moebius
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41❤15🔥7🎉2😁1