Метаверсище и ИИще
47.1K subscribers
5.99K photos
4.45K videos
45 files
6.89K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Продолжаем пару гиковато-диковатых постов.

Телегам принес новости про Ctrl-X
Это как бы ControlNet от Нвидии да еще и с исходным кодом.
https://genforce.github.io/ctrl-x/

На картинках все сладко. Иду тестировать.
Первое, что вижу - адовый интерфейс.
Шесть полей для картинок, странные подписи на них.

Второе, что вижу - это SDXL.

Пробую их же примеры - и после Флюкса это выглядит настолько архаично, что закрываю и забываю.

Даю второй шанс - кидаю своего вирусного Спикера - получаю адъ. Закрываю снова.

Хотя идея отличная. Пишут, что может работать лучше связки ControlNet+IP на сложных композициях. Может кому-то пригодится.

Такое бы добро во Флюкс.
А пока ставим на полку.
Скрины выше.

@cgevent
10
This media is not supported in your browser
VIEW IN TELEGRAM
А это я тестировал опенсорсный CogVideo в режиме image2video.

Тут ему полегче стартовать с высокой базы. Также я заметил, что он как рекс натренирован на эмбедингах типа dancing. Но jumping, shaking - все мимо. Видать Тикток - родовой датасет.

Пойду присуну это в FaceFusion 3.

@cgevent
😁43👍17🔥95👎5
Ну и вот примерно те чувства, которые я испытывал, тестируя, а точнее устанавливая все это опенсорсное адищще. Покрал картинку у Андрея, уж больно хороша и отзывается.

Кстати, ровно год назад писал мемуары, как порешать проблемы с картинки с помощью chatGPT. Повторю пожалуй ниже.
37😁37🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
С chatGPT и Линукс не страшен

Недавно провели исследование того, как chatGPT помогает людям в работе.
Тестировали не на всех людях, а на консультантах (там Boston Consulting Group в партнерах исследования, и понятно почему).
Если вкратце, то люди использующие chatGPT в своей консультационной деятельности были более, чем на 40% продуктивны (по метрикам принятым в этой деятельности). Подробно можно прочитать об этом тут, а я приподнавалю личного опыта и истерик по этому поводу.

Я три года назад описывал свои ламерские пляски с Линуксом вот тут. И главный урок, который я извлек, работая с Линуксом - видишь ошибку при установке чего-нибудь, гуглишь ея, на пятом ответе нападаешь на след и делаешь все как говорят на стековерфлоу в самом первом ответе. Потом мне этот же совет озвучивали разные линуксоведы.
(тут дисклаймер - я ни разу не линуксоид, я упоротый виндовед, с опытом работы в IRIX в лихих 90-х).

А тут мне достался доступ по ssh к серваку с Убунтой, где жужжат восемь A100 80 ГБ.
И мне, конечно, приспичило накатить туда и Automatic1111 и Fooocus и много еще чего для тестирования. Написать скрипты, сообразить как смотреть картинки через gradio, как править файлы на серваке.
И я уже по привычке занес непрямые руки над гуглом, получив первую порцию странных ошибок, но потом вспомнил про chatGPT.
И робко спросил его "шозахрень".
chatGPT мне мило растолковал за кодировки файлов и формат конца строк (хотя ошибки были о чем угодно, только не об этом), присоветовал Notepad ++. Потом помог разобраться с X11Forwarding-ом, просветил за WSL и рассказал еще много чего полезного про Убунту и не только.
Если бы я по старинке гуглил, то потратил бы те самые две недели, как в 2020-м. А тут управился за вечер. Да еще и поумнел (старт с низкой базы вестимо).
В общем это я о чем.
Через пару лет (быстрее), мы забудем про гуглинг и про просеивание ссылок.
Будет просто вопрос и ответ. Уточнения и ответ. А не запрос и рытьё в ссылках, уточнение запроса и рытье в ссылках.
Интернетик сожмется до ввода вопросов, и вывода ответов. Интерфейсик сами подберете.
Или вам нравится рыться в ссылках, перебирать сайтами и читать бесконечные обзоры типа "ваще крутые ИИ-инструменты на каждый день"?
👍35🔥163👎1🙏1
Forwarded from TechSparks
Все лидеры бигтеха, занятого разработкой ИИ, любят говорить, что в процессе всеобщего улучшения будущего ИИ сильно изменит образование, оно станет персонализированным, эффективным и прочие общие слова. Но вот Гугл поставил интересный эксперимент для получения в этой теме более конкретных ответов. Инструмент выбран правильно: собранные со всего мира стартапы в области EdTech. Таковых набралось 21, я тут не буду весь список приводить, лучше его посмотреть по ссылке.
Но некоторые описания целей стартапов реально круты и интригуют, вот примеры:
◦ Превратить стандартный Chromebook или планшет в в единое обучающее пространство, сохраняющее в основе своей рукописный текст
◦ ИИ-генератор рассказов как платформа для обучения чтению, на которой обучение грамотности сочетается с персональным захватывающим контентом
◦ Платформа, предназначенная для бизнесов и вендоров софта, которая позволяет проводить выскоуровневые тренинги и обеспечивает учебные материалы для переподготовки персонала и подготовки пользователей
◦ Высокотехнологичная обучающая платформа, доступная на низкотехнологичных устройствах
По каждому заинтересовавшему стартапу можно сразу уйти на его сайт читать подробности, я на некоторых залип:)

https://blog.google/outreach-initiatives/entrepreneurs/ai-for-education-cohort/
👍23🔥64👎1
Forwarded from Psy Eyes
В Kling теперь доступны липсинк и API.

Не вау, но лучше, чем было, и нет "зажёванности" рта как у Wav2lip. Работает с Kling V 1 и V 1.5. На животных пока не пашет.

Через API теперь можно получить доступ к генерации видео, картинок, и виртуальной примерочной Virtual Try-on.

Также появилась секция Community, где можно шарить свои видео и есть шанс получить кредиты.

PS: теперь у ключевых генераторов видео (Runway, Luma, Kling) есть API.

Анонс
Подробнее о Kling
👍318🔥8👎1
У меня не хватает сил и времени написать обзор OpenAI DevDay.

Надеюсь завтра будет обзор от Игоря.
А пока принес вам вот такие ссылки на блог-трансляции. Если вы в теме - найдете там массу интересного. И любопытные ссылки.

https://community.openai.com/t/devday-2024-san-francisco-live-ish-news/963456/8

https://simonwillison.net/2024/Oct/1/openai-devday-2024-live-blog/

@cgevent
1👍16👎4🔥2
Пика жжот. Буквально. Эффектами.

По ходу видегенераторов скоро будет (или уже есть) больше, чем генераторов картинок.
Ну и когда мы говорим "генератор" - мы имеем в виду код со своей foundation model, а не нашлепки над Stable Diffusion или Flux типа Leonardo или Mystic (ну ок, Леонардо недавно натренили свою модель, хорошо бы знать, сколько их юзеров пользуют ее, а сколько файнтюны SD).

Короче, всеми позабытая PIKA бахнула обновление до версии 1.5

И вместо того, чтобы делать упор на фотореализьм или монтажные фичи, они сделали акцент на .. производство VFX! Ну то есть на видосы с разными эффектами типа взрывов, дымов и "разорви-мои-мозги сейчас".

Демо из их твиттора выглядит слишком нарядным и явно обработанным на посте, чтобы его постить тут. А я вам привалю реальных генераций из новой Пики 1.5.
Ну и две новости

Хорошая. У них такие есть бесплатные кредиты на попробовать (негусто)
Плохая. Все намертво висит. Как писал Денис, халявные кредиты выжигают железо и, к сожалению, бюджет.

Но в целом новость отличная. Ибо конкуренция - это отлично!

P.S. Смотрите ролик про унитаз. Работа с физикой просто поражает. И меня у Пики не особо трясет качество, а именно работа с "пониманием" пространства. Ну и B-movie типа "смерть в унитазе" не знают что делать, плакать или радоваться. Вот оно дешевое производство, как оно есть.

P.P.S. Теперь точно за эфыксеров, не чокаясь.
@cgevent
3🔥44👍95👎5😁2
Берем производную от мемов.

Отдельного поста заслуживает совершенно мемная фича в новой ПИКЕ 1.5 по названием "раздави(сомни в труху) это"

Мемная, потому что эффект как бы один и быстро взлетит и быстро надоест.

Зато можно брать мемы и мемно над ними издеваться. И не только над мемами.

Знаете какой тут сложный промт, инфоцыгане?

Image to video prompt: 'Squish it'

@cgevent
1🔥42😁146👎3😱2👍1