Продолжаем пару гиковато-диковатых постов.
Телегам принес новости про Ctrl-X
Это как бы ControlNet от Нвидии да еще и с исходным кодом.
https://genforce.github.io/ctrl-x/
На картинках все сладко. Иду тестировать.
Первое, что вижу - адовый интерфейс.
Шесть полей для картинок, странные подписи на них.
Второе, что вижу - это SDXL.
Пробую их же примеры - и после Флюкса это выглядит настолько архаично, что закрываю и забываю.
Даю второй шанс - кидаю своего вирусного Спикера - получаю адъ. Закрываю снова.
Хотя идея отличная. Пишут, что может работать лучше связки ControlNet+IP на сложных композициях. Может кому-то пригодится.
Такое бы добро во Флюкс.
А пока ставим на полку.
Скрины выше.
@cgevent
Телегам принес новости про Ctrl-X
Это как бы ControlNet от Нвидии да еще и с исходным кодом.
https://genforce.github.io/ctrl-x/
На картинках все сладко. Иду тестировать.
Первое, что вижу - адовый интерфейс.
Шесть полей для картинок, странные подписи на них.
Второе, что вижу - это SDXL.
Пробую их же примеры - и после Флюкса это выглядит настолько архаично, что закрываю и забываю.
Даю второй шанс - кидаю своего вирусного Спикера - получаю адъ. Закрываю снова.
Хотя идея отличная. Пишут, что может работать лучше связки ControlNet+IP на сложных композициях. Может кому-то пригодится.
Такое бы добро во Флюкс.
А пока ставим на полку.
Скрины выше.
@cgevent
❤10
This media is not supported in your browser
VIEW IN TELEGRAM
А это я тестировал опенсорсный CogVideo в режиме image2video.
Тут ему полегче стартовать с высокой базы. Также я заметил, что он как рекс натренирован на эмбедингах типа dancing. Но jumping, shaking - все мимо. Видать Тикток - родовой датасет.
Пойду присуну это в FaceFusion 3.
@cgevent
Тут ему полегче стартовать с высокой базы. Также я заметил, что он как рекс натренирован на эмбедингах типа dancing. Но jumping, shaking - все мимо. Видать Тикток - родовой датасет.
Пойду присуну это в FaceFusion 3.
@cgevent
😁43👍17🔥9❤5👎5
Ну и вот примерно те чувства, которые я испытывал, тестируя, а точнее устанавливая все это опенсорсное адищще. Покрал картинку у Андрея, уж больно хороша и отзывается.
Кстати, ровно год назад писал мемуары, как порешать проблемы с картинки с помощью chatGPT. Повторю пожалуй ниже.
Кстати, ровно год назад писал мемуары, как порешать проблемы с картинки с помощью chatGPT. Повторю пожалуй ниже.
❤37😁37🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
С chatGPT и Линукс не страшен
Недавно провели исследование того, как chatGPT помогает людям в работе.
Тестировали не на всех людях, а на консультантах (там Boston Consulting Group в партнерах исследования, и понятно почему).
Если вкратце, то люди использующие chatGPT в своей консультационной деятельности были более, чем на 40% продуктивны (по метрикам принятым в этой деятельности). Подробно можно прочитать об этом тут, а я приподнавалю личного опыта и истерик по этому поводу.
Я три года назад описывал свои ламерские пляски с Линуксом вот тут. И главный урок, который я извлек, работая с Линуксом - видишь ошибку при установке чего-нибудь, гуглишь ея, на пятом ответе нападаешь на след и делаешь все как говорят на стековерфлоу в самом первом ответе. Потом мне этот же совет озвучивали разные линуксоведы.
(тут дисклаймер - я ни разу не линуксоид, я упоротый виндовед, с опытом работы в IRIX в лихих 90-х).
А тут мне достался доступ по ssh к серваку с Убунтой, где жужжат восемь A100 80 ГБ.
И мне, конечно, приспичило накатить туда и Automatic1111 и Fooocus и много еще чего для тестирования. Написать скрипты, сообразить как смотреть картинки через gradio, как править файлы на серваке.
И я уже по привычке занес непрямые руки над гуглом, получив первую порцию странных ошибок, но потом вспомнил про chatGPT.
И робко спросил его "шозахрень".
chatGPT мне мило растолковал за кодировки файлов и формат конца строк (хотя ошибки были о чем угодно, только не об этом), присоветовал Notepad ++. Потом помог разобраться с X11Forwarding-ом, просветил за WSL и рассказал еще много чего полезного про Убунту и не только.
Если бы я по старинке гуглил, то потратил бы те самые две недели, как в 2020-м. А тут управился за вечер. Да еще и поумнел (старт с низкой базы вестимо).
В общем это я о чем.
Через пару лет (быстрее), мы забудем про гуглинг и про просеивание ссылок.
Будет просто вопрос и ответ. Уточнения и ответ. А не запрос и рытьё в ссылках, уточнение запроса и рытье в ссылках.
Интернетик сожмется до ввода вопросов, и вывода ответов. Интерфейсик сами подберете.
Или вам нравится рыться в ссылках, перебирать сайтами и читать бесконечные обзоры типа "ваще крутые ИИ-инструменты на каждый день"?
Недавно провели исследование того, как chatGPT помогает людям в работе.
Тестировали не на всех людях, а на консультантах (там Boston Consulting Group в партнерах исследования, и понятно почему).
Если вкратце, то люди использующие chatGPT в своей консультационной деятельности были более, чем на 40% продуктивны (по метрикам принятым в этой деятельности). Подробно можно прочитать об этом тут, а я приподнавалю личного опыта и истерик по этому поводу.
Я три года назад описывал свои ламерские пляски с Линуксом вот тут. И главный урок, который я извлек, работая с Линуксом - видишь ошибку при установке чего-нибудь, гуглишь ея, на пятом ответе нападаешь на след и делаешь все как говорят на стековерфлоу в самом первом ответе. Потом мне этот же совет озвучивали разные линуксоведы.
(тут дисклаймер - я ни разу не линуксоид, я упоротый виндовед, с опытом работы в IRIX в лихих 90-х).
А тут мне достался доступ по ssh к серваку с Убунтой, где жужжат восемь A100 80 ГБ.
И мне, конечно, приспичило накатить туда и Automatic1111 и Fooocus и много еще чего для тестирования. Написать скрипты, сообразить как смотреть картинки через gradio, как править файлы на серваке.
И я уже по привычке занес непрямые руки над гуглом, получив первую порцию странных ошибок, но потом вспомнил про chatGPT.
И робко спросил его "шозахрень".
chatGPT мне мило растолковал за кодировки файлов и формат конца строк (хотя ошибки были о чем угодно, только не об этом), присоветовал Notepad ++. Потом помог разобраться с X11Forwarding-ом, просветил за WSL и рассказал еще много чего полезного про Убунту и не только.
Если бы я по старинке гуглил, то потратил бы те самые две недели, как в 2020-м. А тут управился за вечер. Да еще и поумнел (старт с низкой базы вестимо).
В общем это я о чем.
Через пару лет (быстрее), мы забудем про гуглинг и про просеивание ссылок.
Будет просто вопрос и ответ. Уточнения и ответ. А не запрос и рытьё в ссылках, уточнение запроса и рытье в ссылках.
Интернетик сожмется до ввода вопросов, и вывода ответов. Интерфейсик сами подберете.
Или вам нравится рыться в ссылках, перебирать сайтами и читать бесконечные обзоры типа "ваще крутые ИИ-инструменты на каждый день"?
Telegraph
Хождение за три Линукса.
В общем я потратил пару викендов и еще несколько рандомных дней, чтобы погрузиться в дивные эксперименты по установке Линукса на новехонький ноутбук Lenovo Creator со всеми модными пирогами - 2080 Max Q, две видеокарты, RAID из двух NVME SSD и прочими ништяками.…
👍35🔥16❤3👎1🙏1
Forwarded from TechSparks
Все лидеры бигтеха, занятого разработкой ИИ, любят говорить, что в процессе всеобщего улучшения будущего ИИ сильно изменит образование, оно станет персонализированным, эффективным и прочие общие слова. Но вот Гугл поставил интересный эксперимент для получения в этой теме более конкретных ответов. Инструмент выбран правильно: собранные со всего мира стартапы в области EdTech. Таковых набралось 21, я тут не буду весь список приводить, лучше его посмотреть по ссылке.
Но некоторые описания целей стартапов реально круты и интригуют, вот примеры:
◦ Превратить стандартный Chromebook или планшет в в единое обучающее пространство, сохраняющее в основе своей рукописный текст
◦ ИИ-генератор рассказов как платформа для обучения чтению, на которой обучение грамотности сочетается с персональным захватывающим контентом
◦ Платформа, предназначенная для бизнесов и вендоров софта, которая позволяет проводить выскоуровневые тренинги и обеспечивает учебные материалы для переподготовки персонала и подготовки пользователей
◦ Высокотехнологичная обучающая платформа, доступная на низкотехнологичных устройствах
По каждому заинтересовавшему стартапу можно сразу уйти на его сайт читать подробности, я на некоторых залип:)
https://blog.google/outreach-initiatives/entrepreneurs/ai-for-education-cohort/
Но некоторые описания целей стартапов реально круты и интригуют, вот примеры:
◦ Превратить стандартный Chromebook или планшет в в единое обучающее пространство, сохраняющее в основе своей рукописный текст
◦ ИИ-генератор рассказов как платформа для обучения чтению, на которой обучение грамотности сочетается с персональным захватывающим контентом
◦ Платформа, предназначенная для бизнесов и вендоров софта, которая позволяет проводить выскоуровневые тренинги и обеспечивает учебные материалы для переподготовки персонала и подготовки пользователей
◦ Высокотехнологичная обучающая платформа, доступная на низкотехнологичных устройствах
По каждому заинтересовавшему стартапу можно сразу уйти на его сайт читать подробности, я на некоторых залип:)
https://blog.google/outreach-initiatives/entrepreneurs/ai-for-education-cohort/
Google
21 startups transforming education with AI
Learn more about the 21 startups from across EMEA selected for the Growth Academy: AI for Education program.
👍23🔥6❤4👎1
Forwarded from Psy Eyes
В Kling теперь доступны липсинк и API.
Не вау, но лучше, чем было, и нет "зажёванности" рта как у Wav2lip. Работает с Kling V 1 и V 1.5. На животных пока не пашет.
Через API теперь можно получить доступ к генерации видео, картинок, и виртуальной примерочной Virtual Try-on.
Также появилась секция Community, где можно шарить свои видео и есть шанс получить кредиты.
PS: теперь у ключевых генераторов видео (Runway, Luma, Kling) есть API.
Анонс
Подробнее о Kling
Не вау, но лучше, чем было, и нет "зажёванности" рта как у Wav2lip. Работает с Kling V 1 и V 1.5. На животных пока не пашет.
Через API теперь можно получить доступ к генерации видео, картинок, и виртуальной примерочной Virtual Try-on.
Также появилась секция Community, где можно шарить свои видео и есть шанс получить кредиты.
PS: теперь у ключевых генераторов видео (Runway, Luma, Kling) есть API.
Анонс
Подробнее о Kling
👍31❤8🔥8👎1
У меня не хватает сил и времени написать обзор OpenAI DevDay.
Надеюсь завтра будет обзор от Игоря.
А пока принес вам вот такие ссылки на блог-трансляции. Если вы в теме - найдете там массу интересного. И любопытные ссылки.
https://community.openai.com/t/devday-2024-san-francisco-live-ish-news/963456/8
https://simonwillison.net/2024/Oct/1/openai-devday-2024-live-blog/
@cgevent
Надеюсь завтра будет обзор от Игоря.
А пока принес вам вот такие ссылки на блог-трансляции. Если вы в теме - найдете там массу интересного. И любопытные ссылки.
https://community.openai.com/t/devday-2024-san-francisco-live-ish-news/963456/8
https://simonwillison.net/2024/Oct/1/openai-devday-2024-live-blog/
@cgevent
OpenAI Developer Community
DevDay 2024: San Francisco - Live(-ish) News
We’ll be posting as many new updates here as we get them! We’re as excited as all of you to see what’s in store for devs this year. 2024-10-01T16:56:00Z (UTC) 2024-10-26T17:28:00Z (UTC) o1 rate limit doubled.1 Realtime API Speech to speech. …
1👍16👎4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Пика жжот. Буквально. Эффектами.
По ходу видегенераторов скоро будет (или уже есть) больше, чем генераторов картинок.
Ну и когда мы говорим "генератор" - мы имеем в виду код со своей foundation model, а не нашлепки над Stable Diffusion или Flux типа Leonardo или Mystic (ну ок, Леонардо недавно натренили свою модель, хорошо бы знать, сколько их юзеров пользуют ее, а сколько файнтюны SD).
Короче, всеми позабытая PIKA бахнула обновление до версии 1.5
И вместо того, чтобы делать упор на фотореализьм или монтажные фичи, они сделали акцент на .. производство VFX! Ну то есть на видосы с разными эффектами типа взрывов, дымов и "разорви-мои-мозги сейчас".
Демо из их твиттора выглядит слишком нарядным и явно обработанным на посте, чтобы его постить тут. А я вам привалю реальных генераций из новой Пики 1.5.
Ну и две новости
Хорошая. У них такие есть бесплатные кредиты на попробовать (негусто)
Плохая. Все намертво висит. Как писал Денис, халявные кредиты выжигают железо и, к сожалению, бюджет.
Но в целом новость отличная. Ибо конкуренция - это отлично!
P.S. Смотрите ролик про унитаз. Работа с физикой просто поражает. И меня у Пики не особо трясет качество, а именно работа с "пониманием" пространства. Ну и B-movie типа "смерть в унитазе" не знают что делать, плакать или радоваться. Вот оно дешевое производство, как оно есть.
P.P.S. Теперь точно за эфыксеров, не чокаясь.
@cgevent
По ходу видегенераторов скоро будет (или уже есть) больше, чем генераторов картинок.
Ну и когда мы говорим "генератор" - мы имеем в виду код со своей foundation model, а не нашлепки над Stable Diffusion или Flux типа Leonardo или Mystic (ну ок, Леонардо недавно натренили свою модель, хорошо бы знать, сколько их юзеров пользуют ее, а сколько файнтюны SD).
Короче, всеми позабытая PIKA бахнула обновление до версии 1.5
И вместо того, чтобы делать упор на фотореализьм или монтажные фичи, они сделали акцент на .. производство VFX! Ну то есть на видосы с разными эффектами типа взрывов, дымов и "разорви-мои-мозги сейчас".
Демо из их твиттора выглядит слишком нарядным и явно обработанным на посте, чтобы его постить тут. А я вам привалю реальных генераций из новой Пики 1.5.
Ну и две новости
Хорошая. У них такие есть бесплатные кредиты на попробовать (негусто)
Плохая. Все намертво висит. Как писал Денис, халявные кредиты выжигают железо и, к сожалению, бюджет.
Но в целом новость отличная. Ибо конкуренция - это отлично!
P.S. Смотрите ролик про унитаз. Работа с физикой просто поражает. И меня у Пики не особо трясет качество, а именно работа с "пониманием" пространства. Ну и B-movie типа "смерть в унитазе" не знают что делать, плакать или радоваться. Вот оно дешевое производство, как оно есть.
P.P.S. Теперь точно за эфыксеров, не чокаясь.
@cgevent
3🔥44👍9❤5👎5😁2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Берем производную от мемов.
Отдельного поста заслуживает совершенно мемная фича в новой ПИКЕ 1.5 по названием "раздави(сомни в труху) это"
Мемная, потому что эффект как бы один и быстро взлетит и быстро надоест.
Зато можно брать мемы и мемно над ними издеваться. И не только над мемами.
Знаете какой тут сложный промт, инфоцыгане?
Image to video prompt: 'Squish it'
@cgevent
Отдельного поста заслуживает совершенно мемная фича в новой ПИКЕ 1.5 по названием "раздави(сомни в труху) это"
Мемная, потому что эффект как бы один и быстро взлетит и быстро надоест.
Зато можно брать мемы и мемно над ними издеваться. И не только над мемами.
Знаете какой тут сложный промт, инфоцыгане?
Image to video prompt: 'Squish it'
@cgevent
1🔥42😁14❤6👎3😱2👍1