Forwarded from Михаил Пожидаев
Сбер представил новую версию генеративной модели ruGPT-3.5. Это событие на общем фоне новостей LLM, возможно, не самая сенсация, но предыдущая их версия была крайне удобной для любых академических и технических экспериментов.
Эту версию пока не запускал. Было бы хорошо, если бы она не стала бы принципиально тяжелее, к чему, естественно, всегда есть тенденция. Прежняя ruGPT запускалась на ноутбуках от 8G RAM и основывалась на кодовой базе Transformers от HuggingFace, что открывало необъятные просторы для её изучения.
Если качество возрастёт, эта серия моделей может оказаться ключевой в решении ряда задач, включая производство синтезированных аудиокниг, где пока не всё ещё гладко. Для русского языка конкурентом этой модели можно считать YaML100B от Яндекса.
https://3dnews.ru/1090296/sber-vilogil-v-otkritiy-dostup-model-rugpt35
#ruGPT #GPT #LLM #Сбер
Эту версию пока не запускал. Было бы хорошо, если бы она не стала бы принципиально тяжелее, к чему, естественно, всегда есть тенденция. Прежняя ruGPT запускалась на ноутбуках от 8G RAM и основывалась на кодовой базе Transformers от HuggingFace, что открывало необъятные просторы для её изучения.
Если качество возрастёт, эта серия моделей может оказаться ключевой в решении ряда задач, включая производство синтезированных аудиокниг, где пока не всё ещё гладко. Для русского языка конкурентом этой модели можно считать YaML100B от Яндекса.
https://3dnews.ru/1090296/sber-vilogil-v-otkritiy-dostup-model-rugpt35
#ruGPT #GPT #LLM #Сбер
3DNews - Daily Digital Digest
«Сбер» выложил в открытый доступ русскоязычную ИИ-модель ruGPT-3.5
Инженеры «Сбера» выложили в открытый доступ нейросетевую модель ruGPT-3.