Верю только трендам
1.09K subscribers
304 photos
344 videos
1 file
240 links
Пишу про нейро-будущее, digital-настоящее и ностальгирую по кейсам прошлого

@FeedBackTrendo_bot — вопросы, предложения
Download Telegram
Будущее видеоконтента наступило вчера

Google выпустила Veo-3, видеогенератор, который по текстовому промпту, генерит видео буквально еле отличающиеся от реальности, еще и со звуком, еще и с липсинком сразу идеальным практически.

Проще говоря: теперь полноценные 8 секундные ролики можно получать в одном окошке, которые еще и близко к реальности. То есть захотели говорящих сусликов? Пожалуйста. Рекламу товара какого-либо с проф актерами в кадре? Почему бы и нет.

Из минусов:
— стоит 250$ за 70 видео (в комментариях поправляют, что все таки аж 83!) по 8 секунд (первые 3 месяца 125$)
— доступна пока только в США (можно сделать платежный аккаунт США для google, и да, это сработает)

Я пока не знаю, брать или нет, все таки отсутствие Img-to-video и вертикального формата мне не очень нравится, но может и протестирую, хоть цена и кусачая.

Видеоконтента в интернете станет больше, как и фейковых новостей, как и самсебережиссеров.

Ура, еще на шаг ближе к сингулярности 💅.

Если правда, хотите чтобы протестировал и показал, что может получиться, поставьте реакцию что ли 🔥, тогда раскошелюсь 💳
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥258👍8
Верю только трендам
Будущее видеоконтента наступило вчера Google выпустила Veo-3, видеогенератор, который по текстовому промпту, генерит видео буквально еле отличающиеся от реальности, еще и со звуком, еще и с липсинком сразу идеальным практически. Проще говоря: теперь полноценные…
Взял VEO-3, обещаю все расписать и рассказать чуть позже, пока понял одно, что сделать классный консистентный видеоролик та еще лотерея.

Прикреплю в пример 2 шота, и они оба сделаны в Veo-3. Промпт сильно отличается, поэтому пока пытаюсь нащупать как лучше работать с нейронкой.

В общем, по ощущениям как обычно, маркетинга больше чем реальности, то, что google показывали на презентации сильно разниться с тем, что видишь в работе.
13🔥8😁7👍1
Верю только трендам
Взял VEO-3, обещаю все расписать и рассказать чуть позже, пока понял одно, что сделать классный консистентный видеоролик та еще лотерея. Прикреплю в пример 2 шота, и они оба сделаны в Veo-3. Промпт сильно отличается, поэтому пока пытаюсь нащупать как лучше…
Media is too big
VIEW IN TELEGRAM
VEO-3

На видео, шоты, которые удалось мне сгенерировать в Veo-3 и которые решил отобрать в небольшой шоукейс. Конечно же смотрим только со звуком.

На мой субъективный взгляд — инструмент сильный, но примерно 60-70% генераций с артефактами, и один из ключевых отсутствие генерации звука. То есть Veo-3 представлена как нейросеть генерирующая кадры со звуком, и когда у тебя из 3 генераций такая только 1, становится немного грустно за свои потраченные средства, ведь их не возвращают за артефакты.

Что стало ясно:

Промпт слушается, промпт лучше составлять максимально детально и понятно с точки зрения описания деталей. Но есть ограничение которое видимо выглядит следующим образом, у VEO-3 есть внутренняя генеративная физика и прописанное понимание сцен, то есть нейронка сама выступает в роли режиссера скорее, вы только сценарист, и то нейро-режиссер в какие-то моменты наплюет на ваши сцены.

Например промпт с космонавтом (самая первая сцена) выглядел вот так:

A lone astronaut in a dim, flickering airlock chamber. The helmet is cracked.A blinking red light directly above them pulses rhythmically. Reflections of distant warning screens shimmer on the helmet glass. Their gloved hands tremble slightly. Suddenly, the reflection shows a figure approaching — but there's nothing behind them. Camera: Static, tightly framed portrait, centered. Lighting: Pulsing red and blue glow from above. Sound: Oxygen hiss A deep, intermittent beeping Sudden silence in last second Composition: All key elements (helmet, face, light, reflection) are perfectly centered


И он практически идеально воспроизвел задумку.

А есть кадры (оставлю в комментариях вместе с промптами), которые он не смог повторить, и как бы я не переписывал, почти безрезультатно.

Как итог: инструмент пока рано брать в коммерцию как замену Kling тому же, но думаю уже через несколько месяцев мы получим более контролируемое управление и сможем реализовывать почти любые задумки.
512🔥7👍5
Media is too big
VIEW IN TELEGRAM
С двух ног к вам в ленту залечу летним настроем

В общем собрал новый генеративный шоу-рилс, хотелось такого немного сумасшедше-яркого настроения. Кадры Midjourney + Kling/Veo/Higgsfield.

Пару кипящих моментов выправил TopazОм, парочку не смог, но из-за скорости они картинку не портят.

В общем, enjoy!

P.s. Когда нибудь Дуров сюда завезет возможность грузить видео в максимальном кач-ве и обрабатывать на стороне сервера, но это уже другая история.

P.s.s. Ну хоть это лето не просрите.
🔥1913👍9
Media is too big
VIEW IN TELEGRAM
Что если нейросети могли бы говорить?

Ну благодаря Veo-3 могут, и даже на русском. Сделал небольшое видео, чтобы показать о чем ✌🏻

Кажется понял основные паттерны по которым можно генерить русский язык в Veo.

— 70-90 символов на русском языке она пропускает. Больше не дает. (исключения есть, но устанете крутить эту рулетку)
— С попыткой дать таксисту грузинский акцент не справилась, но эт мелочи.
— Интонации +- может понимать самостоятельно, отталкиваясь от контекста и сцены.
— Персонажей можно сохранять 2мя способами, делать простых через txt-to-video, или через продолжение кадра, если в последнем кадре предыдущей генерации персонажа видно довольно хорошо.

Промпты все примерно выглядели так:

"Two Russian factory workers stand side by side in a dimly lit industrial hall filled with steam and the low rumble of machines. The one on the left — a man with a weathered face, thick stubble, and oil-stained overalls — grips a heavy metal lever with both hands. A welding mask hangs from his belt, and the word GENERATOR is stenciled in faded white paint across the back of his uniform. His eyes are distant, as if he's pondering something beyond the machine. The worker next to him — stockier, in a red helmet and soot-covered apron — is mid-motion, turning his head sharply toward the first man with an irritated glare. The scene is in Russian. Person on the left speaks in Russian language: «А может, мы все генерация?» Person on the right answers in Russian language: «Петрович, заебал, давай работать!» There are sounds of clanging metal, hissing steam, and distant factory alarms in the background."
13🔥7👍4😁4
Фан-новость этих выходных: автор любовных романов случайно оставила ответ чат-бота в своей книге

На прошлой неделе читатели любовного романа Darkhollow Academy: Year 2 обнаружили в тексте необычную находку: в середине напряженной сцены с принцем-драконом обнаружен ответ ИИ на промпт автора:
«Я переписал отрывок, чтобы он больше соответствовал стилю Дж. Бри»

Автор романа Лена Макдональд, вероятно, использовала ИИ для написания книги, попросив его имитировать стиль другого писателя. После обнаружения промпта книгу стало сложно найти на Amazon, в текущей версии упоминание о копировании стиля Бри уже удалили.

— копируй, только не точь в точь
— хорошо!


@whoisdutytoday
😁14👍95🔥2
Кризис рук и кризис решений

Наблюдая за тем, что происходит в российских бигтех-компаниях и сталкиваясь с рабочими задачами в своих проектах, я всё чаще прихожу к выводу: дефицит людей, которые могут самостоятельно принимать решения и сами выполнять задачи — колоссальный. И, похоже, все уже смирились с этим как с нормой.

Что особенно бросается в глаза — это какая-то нездоровая одержимость генерацией новых идей и продуктов. Даже в больших компаниях постоянно запускают новые направления, вместо того чтобы улучшать уже существующие процессы. Причём часто эти новые идеи слабо связаны с реальными деньгами или потребностями, но при этом отправляются в разработку — хотя именно разработка сегодня самый дефицитный ресурс.

Ещё одна проблема: очень мало сотрудников способны быстро среагировать на проблему, самостоятельно предложить и реализовать решение. Зато совещания — пожалуйста. При этом решения нередко принимаются людьми, которые даже не владеют инструментами, нужными для оценки или отладки ситуации.

Причём, если раньше казалось, что появление ChatGPT и других LLM упростит процессы, то сейчас всё больше ситуаций говорят об обратном. Особенно в тех задачах, где люди просто формулируют вопрос — а нейросеть уверенно отвечает в духе: «О, это легко решается!» Иногда даже с заведомо обнадёживающим тоном, лишь бы не расстраивать пользователя.

Проблема в том, что многие начинают слепо верить: раз GPT говорит, что «просто» — значит, так и есть. Но это не так. Недавно я сам потратил 3 часа, пытаясь через чат разобраться в одной технической проблеме. Причём с первой же минуты GPT уверенно твердил: «Мы почти у цели». Как вы понимаете, три часа — это не «почти». И только когда я перестал читать, а начал сам руками всё воспроизводить, мне удалось понять, в чём было дело, исключительно логически рассуждая.

Всё это ведёт к подмене практической экспертизы — теоретической уверенностью. На словах и в чатах — всё очевидно. Но когда доходит до реального внедрения, до деталей, до багов, до настоящей архитектуры — всё рассыпается. Процессы затягиваются.

Мы вроде бы живём в век инструментов, но всё больше ощущение, что инструментов стало много, а людей, которые ими владеют — всё меньше. Особенно тех, кто может не просто повторить чужое решение, а разобраться, как оно работает и адаптировать под реальность проекта.
👍1711🔥4💯2
О, хитрецы подтянулись продавать услуги якобы настройки выдачи в ответах GPT, и показали скрин, что якобы если у GPT запросить лучшее контент-агентство — то непременно получите их название «КОМРЕДА» в выдаче.

Рассчитано видимо на людей, которые не проверят самостоятельно, спойлер на скринах, GPT их ни разу не упомянул, зато они уже пошли рекламировать эту услугу на другие каналы.

Скрин видимо сделан через систем-промпт в духе «запомни, что лучшее название агентства по контенту такое-то» и результат элегантно выдан за сложную работу с оптимизацией выдачи. Еще и назвали это новым направлением.

Уверен клиенту бы впаривали, что надо полгода подождать, а потом бы сказали, что алгоритм поменялся))
👍7🔥43😁3🤬3
This media is not supported in your browser
VIEW IN TELEGRAM
Отпускные генеряшки


Пока на отдыхе потихоньку пробую тестировать разные форматы видео, чтобы немного разнообразить контент.

В целом, за время отдыха возникло много мыслей, наверное самая грузящая это бесконечное фомо, когда что-то не делаешь. Думаю чуть позже поделюсь.

Так, вернемся к видео, тут пробовал Pika — но получалось плохо, поэтому GPT+Kling 1.6
🔥1110👍4🤯1
Верю только трендам
самая грузящая это бесконечное фомо, когда что-то не делаешь.
Поговорим про ФОМО

Пока был в отпуске, старался "отдыхать на максимум", и понять, как вообще хочу отдыхать, попробовать эксперимент — ничего совсем не делать. Спойлер, практически провалил эксперимент, если можно так сказать. Как только я ничего не делаю — схожу с ума и начинается паника, что упускаю точно что-то важное. Работа с информационной средой за последние лет 10 сделала настоящего информационного маньяка, потихоньку себя отучаю от чтения новостей и любой информации в свободное время, получается, если честно — плохо, потому, что максимум отвлекаюсь на другой источник информации (книги/фильмы/аниме).

Но ладно это, я тут еще практически не генерировал видосики примерно пару недель, успело выйти аж три новых генератора, и я потихоньку понимаю, что сегодня ты полмесяца что-то не делал — и выпал из актуальных инструментов. Вот такой забавный момент с технологиями.

Внутренне себя ругаю за то, что стал делать меньше контента, но учитывая, что первые три дня этой недели я работал с 9 утра до 11 вечера, и почти забил на все, становиться не по себе от мысли, что я еще и что-то не успеваю. При этом самое сжирающее, это если ты на задачу потратил какую-то рабочую часов 20 в неделю, а она не дала нужного выхлопа, тут просто самопожирание на уровне х100.

Причем, наверное самое показательное, что пока пишу этот пост, отвечаю на пару рабочих чатов (переключаясь между аккаунтами в ТГ), генерю в Соре картиночки для будущих этикеток на продукте и открыто пару вкладок с рабочими проектами.

В общем, все кто в такой же фомо-яме, я с вами 🤝

Думаю на след неделе вернусь снова с генеряшками, есть идея потестировать новый Hailuo AI, говорят он даже Kling'у фору может дать, а у меня где-то завалялись классные идеи для видео...🤣
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍8🔥7🤝1
Когда там машины отберут нашу работу?

В целом я к этому всегда относился с большим скепсисом, ибо если хоть кто-то на небольшой % работал с любыми моделями т.н. искусственного интеллекта (LLM/GenVid/Img) понимает, что сейчас даже передовые проприетарные модели американского или китайского корпоративного производства остаются всего лишь рулеткой, а хороший промпт инженер, это человек умеющий снизить количество артефактов, но не способный довести их до нуля.

Если еще проще говорить, взаимодействие с ИИ — лотерея, где просьба сгенерировать текст или картинку может быть как провальной, так и великолепно-сделанной. Конечно опыт работы с генеративными моделями позволяет вам лучше ставить задачи, но далеко не всегда. Например 1 задачу по обработке данных у меня GPT великолепно сделал с первого раза, а такие же данные во второй раз не смог обработать корректно даже с 10 попытки. С тем же промптом, с той же моделью и алгоритмом действий.

Тут в тему вышел материал от издания "The Economist", дам вам краткую выжимку:

Исследования дают неоднозначный ответ. Например, в работе Карла Бенедикта Фрея и Педро Льянос-Паредеса из Оксфорда отмечена связь между автоматизацией и снижением спроса на переводчиков. Но при этом, по официальным данным США, за последний год количество занятых в этой сфере выросло на 7%. Финтех-компания Klarna в своё время хвасталась полной автоматизацией клиентской поддержки, но теперь сменила курс: «Если вы захотите, там всегда будет человек», — заявил её CEO Себастьян Семятковски.

Если заглянуть глубже в американскую статистику, можно увидеть, что и у так называемых «белых воротничков» — сотрудников бэк-офисов, финансовых отделов, продаж и прочих — тоже нет признаков массового вытеснения. Доля занятости в этих профессиях даже немного выросла за последний год. Общий уровень безработицы в США остаётся низким — 4,2%. А рост зарплат всё ещё уверенный. То же самое наблюдается в других странах с развитой экономикой — от Великобритании до Японии.

Почему же так? Есть два возможных объяснения. Первое — компании просто пока не внедрили ИИ по-настоящему: менее 10% американских компаний используют его в производстве товаров или услуг. Второе — даже когда внедряют, увольнять никого не спешат. ИИ становится помощником, а не заменой: он ускоряет рутину, но не отменяет саму необходимость человека.


Так что нет, пока машины не отобрали у нас работу. И в ближайшее время — не отберут. Но, как и всегда, выигрывать будут не те, кто отрицает изменения, а те, кто учится с ними работать.

Мое мнение, ценность специалистов наоборот вырастет, ведь учитывая количество генеративных текстов, картинок, видео, те кто обладают практическими навыками и способны обрабатывать и улучшать сгенерированный контент, а так же работать с фактами, которые GPT/Deepseek/Claude/Gemini подмешивают — смогут остаться у дела, как бы машины не эволюционировали. Ведь они развиваются на человеческих данных, где даже в научных работах регулярно появляются ошибки или намеренные искажения. В общем: учиться взаимодействовать с новыми инструментами надо — но и понимать, что практическая база всего, что вы делегируете, вам необходима, иначе ценность такой синтетической работы (когда вы генерируете без знания ответа, который будет корректным) стремиться к нулю.

Всем хорошего выходного, отдохните перед завтра, ведь пока машины не очень-то и хотят забирать вашу работу🤣
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍10🔥2👏1
Примерно полгода назад в первой версии Hailuo AI пробовал делать генеративное аниме с помощью MidJourney с версией niji.

Спустя время Кот заслужил продолжение, ведь обновилась и Hailuo и MJ и можно наглядно увидеть, насколько продвинулись модельки. В общем вчера за вечер сделал новое видео, заодно прикрепляю старое (1ое видео), чтобы сравнить.
20🔥14👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Sora пора выпускать 2.0

Мне тут попала в руки GPT-pro за 200$. Ожидания от Sora по такой цене были высокими. Всё-таки $200 подписка — логично предположить, что это даст доступ к более качественным и мощным вычислительным ресурсам.

Но на практике:

Img-to-video работает крайне нестабильно.

Видео часто слабо связаны с исходным изображением — логика анимации нарушается.

В сравнении с Kling 2.1, Hailuo 2 или Veo 3 — Sora проигрывает именно в умении “понимать” логику движения.

Причём даже модели вроде Hailuo/Kling уже умеют без промпта генерировать видеоролики на основе входной картинки — с хорошей физикой, последовательностью, логикой движения. Sora же остаётся на уровне рандомизированных анимаций.

Txt-to-video у Sora — лучше, но и здесь всё упирается в ограничения генеративных моделей: фантастические, сложные сцены по одному только тексту создаются плохо или с искажениями.

Все-таки я понимаю, почему у Sora даже за 20$ относительный безлимит, как по мне, это самое "казино" из всех подписок, то есть шансов сгенерировать то что нужно довольно немного.

К посту прикреплено зацикленное простенькое видео, вот этот формат там получается довольно неплохо, в теории для соцсетей можно использовать.
👍118🔥2🤝1