Константин Доронин
3.88K subscribers
622 photos
313 videos
1 file
337 links
По любым вопросам, которые не хотите задавать в комментариях, можете писать напрямую – @kdoronin
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня наконец-то Veo3 стал доступен по API.

Следовательно, в этот же день на платформе fal.ai, которую я использую для генераций, появилось не только text-to-video, но и image-to-video.

Наконец-то не придётся убеждать Manus в том, что мне надо сгенерировать видео именно в Veo3 и в том, что я достоин генерации (true story: когда Veo3 только появился, мне в чате приходилось убеждать Manus, что у меня корректная подписка для генерации видео).

Стоимость у image-to-video на fal.ai осталась той же, что и для text-to-video: $0.5 за секунду генерации без звука и $0.75 за секунду со звуком.

Да, это $6 за 8-секундное видео со звуком. Но стоит помнить, что Veo3 может генерировать более сложные сцены с меньшего количества попыток. Обеспечивая отличное понимание промпта. Плюс ещё голос и Lipsync на русском языке.
1🔥7👍65🤯1
"Как нейросети помогают увеличить продажи фрилансеру?"

На днях проводил эфир для закрытого сообщества с одноимённой темой.

Фактически, разобрал процесс взаимодействия фрилансера с заказчиком на этапы и по каждому этапу дал примеры того, как AI может помочь.

На эфире я не затрагивал сам процесс выполнения заказа. Что логично – фрилансеры бывают разные, поэтому и работа у них разная. Большей части специалистов я едва ли смогу рассказать, как им следует делать непосредственно их работу.

Фактически, все кейсы применения AI помогали в следующих аспектах:

1. Как фрилансеру лучше понять и оценить себя. За какие сроки и стоимость ему будет действительно комфортно выполнить определённый объём работы. Заодно – понять своё место на рынке.

2. Как в процессе работы давать больше, чем ожидает от фрилансера бизнес.

3. Как выстроить равные, партнёрские отношения с заказчиком и работать с доверием друг к другу.

Заметили, да? Всё это возможно сделать и без AI. Но внедрение обозначенных процессов в работу позволяет увеличить LTV от заказчика, а также включает тот самый "сарафан", на который надеятся многие фрилансеры.

Когда я формулировал для себя правила взаимодействия с заказчиками в качестве фрилансера, AI ещё не был инструментом, способным помочь в реализации обозначенных пунктов.

Однако с нейросетями можно сделать больше, потратив меньше времени. Особенно в вопросах выстраивания отношений.

Кейсы применения AI, на самом деле, не особо сложные, но могут оказаться полезными в работе. Как для фрилансеров, так и для тех, кто работает в найме. Ставьте 🔥, если желаете прочитать про них (и не только) подробнее.
1🔥24👍65
История с кардерами на 30000+ рублей. Не совсем про AI.

Я уже несколько раз писал в этом блоге о различных видах мошенничества. Вот пост из раннего про общительных ботов, которые по итогу пытаются развести на деньги. Или о том, как использовать знания об AI при общении со взломщиками личных аккаунтов.

Поэтому сегодняшнюю историю я не мог не рассказать вам. Для того, чтобы показать ещё один потенциальный источник угрозы со стороны мошенников.

3 августа, прогуливаясь воскресным вечером по моллу, я получаю SMS о списании с моей карты банка FAB (First Abu Dhabi Bank) 1711 MYR в пользу компании Facebook (вот уж где действительно стоит упомянуть, какие они на самом деле экстремисты). Конкретно – за пополнение аккаунта Facebook Ads. Естественно, платёж я не проводил.

Тут же пытаюсь дозвониться до службы поддержки. Пока дозваниваюсь – приходит ещё одно SMS об ещё одной попытке снятия средств. Она не увенчалась успехом, потому что на карте просто не было необходимой суммы – буквально за два дня до этого я снимал с этого счёта наличные.

Дело в том, что в ОАЭ часть операций с "доверенными" компаниями может проходить без OTP (SMS с номером для подтверждения). Как вы понимаете, Малазийскому аккаунту Facebook Ads мой банк очень доверяет, а вот я – не очень.

Как вообще данные карты утекли?

Подозреваю, что тут дело как раз-таки в AI-сервисах. В рамках подготовки материалов к практикуму по AI-видео я тестировал множество сервисов (в том числе и неизвестных мне ранее) для решения тех или иных задач. И в какой-то момент потерял бдительность. На 30000 рублей.

Что было дальше?

На следующий день, в понедельник 4 августа, я поехал в банк. Под внимательным взором сотрудницы банка заполнил форму о неправомерном снятии средств, сфорографировал её на телефон и отправил на специальный e-mail (можно было и полностью онлайн это сделать, но я предпочёл получить консультацию о правильности заполнения). Заодно удостоверился, что карту мне уже выпускают новую и скоро доставят на дом.

А потом – тишина. Даже не было сообщения после отправки формы о том, что "да, мы получили твой e-mail. Всё с ним хорошо!". Через сутки я отправил ещё одно сообщение (с текстом "вы там ничего не потеряли?") на тот же e-mail и в ответ пришло – "Мы получили твой e-mail".

Вообще, деньги от того перевода ещё три дня висели в статусе "Hold". И я надеялся, что форму обработают быстро и они попросту не успеют уйти…

11 августа мне на почту приходит письмо "Здравствуйте! Мы зарегистрировали ваше обращение под номером XXXXX". И рядом ещё одно письмо: "Мы ничего не потеряли. Зарегистрировали ваше обращение под номером XXXXX".

На тот момент деньги уже окончательно покинули мой счёт и вышли из статуса "Hold". Стоит ли говорить, что надежды на их возвращение у меня не осталось?

Сегодня, 16 августа, мне на счёт вернули деньги. Чему я очень рад. Так как у меня с малазийскими кардерами не настолько тёплые отношения, чтобы делать столь щедрые подарки.

Для чего этот пост?

Ещё раз напомнить: сохраняйте бдительность. Особенно, если вы регулярно тестируете (в том числе – платные) AI-сервисы (да и вообще делаете платежи в интернете). Большая часть белых сервисов проводит платежи с использованием Stripe / Link / Paypal / ApplePay / GooglePay. Если малоизвестный сервис просит вводить данные карты у себя в личном кабинете (и не предлагает альтернатив), то это, скорее всего, мошенники.

В одном из следующих постов расскажу, как теперь я выстроил систему взаимодействия с картами, чтобы кардеры, даже имея данные карты, не могли с неё снять значимых сумм.
114👍9🔥7
Про строку состояния в Claude Code.

У CC есть команда /statusline, которая позволяет в вайб-режиме установить строку состояния. Также потом можно попробовать её настроить посредством промптов (пробовал – у CC получается не самое приятное отображение, если честно).

Либо можно пойти в официальную документацию и настроить Status line самостоятельно по примерам.

Но есть и куда более "ленивый" режим настройки. Через проект ccstatusline.

Это консольное микроприложение, которое позволяет в дружелюбном интерфейсе настроить до трёх строк состояния (одна под другой), посмотреть их на превью, а потом одной командой установить в Claude Code.

Полный список того, что можно добавить в качестве элемента в Status line:

Model Name - Shows the current Claude model (e.g., "Claude 3.5 Sonnet")

Git Branch - Displays current git branch name

Git Changes - Shows uncommitted insertions/deletions (e.g., "+42,-10")

Session Clock - Shows elapsed time since session start (e.g., "2hr 15m")

Version - Shows Claude Code version

Output Style - Shows the currently set output style in Claude Code

Tokens Input - Shows input tokens used

Tokens Output - Shows output tokens used

Tokens Cached - Shows cached tokens used

Tokens Total - Shows total tokens used

Context Length - Shows current context length in tokens

Context Percentage - Shows percentage of context limit used (out of 200k)

Context Percentage (usable) - Shows percentage of usable context (out of 160k, accounting for auto-compact at 80%)

Terminal Width - Shows detected terminal width (for debugging)

Custom Text - Add your own custom text to the status line

Custom Command - Execute shell commands and display their output (refreshes whenever the statusline is updated by Claude Code)

Separator - Visual divider between items (customizable: |, -, comma, space)

Flex Separator - Expands to fill available space


Удобный инструмент, чтобы отслеживать текущее состояние контекста, параметры git-а, а также время до обновления лимитов.
111👍8🔥6
Про Hooks в Claude Code.

Чем глубже я изучаю Claude Code, тем больше убеждаюсь, что решение от Anthropic – ультимативный инструмент для AI-Coding.

В обзоре на Kiro, что был чуть больше месяца назад, я очень тепло отозвался о функциональности Agent Hooks.

Просто на тот момент я не знал, что Claude Code даёт в своих Hooks куда больше возможностей.

Самая главная особенность Hooks – добавление большей детерменированности в процесс написания кода.

Claude Code позволяет подключиться через хук в любой момент, начиная от отправки пользователем промпта, заканчивая уведомлением от Claude Code о завершении работы, и выполнить необходимое действие. При этом мы можем как принудительно запустить другого агента, так и выполнить произвольный код или команду в терминале.

Документацию на официальном сайте изучать тут, а примеры в референсах можно посмотреть здесь.

Несколько примеров использования Hooks для вдохновения:

1. Максим опубликовал классный geek-пример того, как он на свой Stream Deck (там буква r после t) выводит информацию о запущенных проектах в Claude Code.

2. А в этом видео разработчик построил полноценную систему, которая в real-time-режиме отслеживает всё, что делают AI-агенты и субагенты в процессе работы Claude Code.

3. Или вот репозиторий, в котором через хуки реализован TDD-надсмотрщик, неустанно бдящий, чтобы Claude Code следовал Test-driven-подходу в разработке (AI-агентов хлебом не корми – дай только срезать углы).

Итог: hooks – ещё один инструмент, позволяющий добавить контроля при взаимодействии с Claude Code. Это тот самый момент, когда от открывающихся с инструментом возможностей захватывает дух 🔥
317🔥14👍12
Qwen Image Edit сдвигает с пьедестала Flux Kontext.

Некоторое время у меня была в быстром доступе ссылка на https://www.easyedit.io/ , чтобы иметь под рукой inpaint от Flux Kontext.

На днях вышел Qwen Image Edit. И сразу отправился в Open Source. То есть в скором времени нас ожидает большое количество файн-тюнов и лор для этой модели.

Он доступен бесплатно на сайте Qwen. Чтобы использовать режим, нужно предварительно нажать на кнопку "Редактирование изображения" под полем ввода.

Что умеет хорошо:

1. Менять цвет объекта.

2. Добавлять новые предметы.

3. Заменять один предмет на другой.

4. Поменять стиль изображения (опять гиблифицировать 🙂).

5. Добавлять английские надписи на изображение.

6. Понимать промпты. В том числе – на русском языке.

7. Сохранять исходное изображение, не затронутое inpaint-ом.

8. Менять ракурс исходного изображения. Но только в простых сценах.

Что умеет плохо:

1. Писать текст кириллицей. Для этих целей ChatGPT подходит лучше всех. Но, возможно, появится fine-tune Qwen3 под эту задачу.

2. Сохранять лица, если они затронуты inpaint-ом. Делает это лучше, чем ChatGPT, но всё равно узнаваемость легко потерять.

3. Обрабатывать несколько изображений. Загрузить можно, но корректно обработать он может только одно загруженное. То есть перенести предмет с одной фотографии на другую не получится.

4. Иногда модель "ломается". И не может произвести даже простой inpaint. Что приводит к полной перерисовке изображения. Я с таким столкнулся буквально пару раз. Помогла смена языка промпта на английский.

Скорее всего, как и в случае с Flux, я буду достаточно редко использовать Qwen Image Edit. Ибо ChatGPT, как правило, справляется с возникающими у меня задачами. У меня мало кейсов, когда критически важно сохранить неизменными все части исходного изображения. Возможно, у вас кейсов больше и в таком случае Qwen Image Edit – отличный инструмент.
1👍143🔥3
Тот самый кейс для UX/UI-дизайнеров.

Отлично подходит для переработки сложных взаимодействий приложения/сайта с пользователем. Когда необходим продуманный интерактив.

Порой, на этапе сбора требований по интерактивным системам, дизайнерам приходится сломать немало копий (с названиями по типу точно_финальное_ТЗ_дизайнеру(28).docx), чтобы получить описание всех нюансов работы бизнес-процесса.

А можно собрать за 15-30 минут полноценный интерактивный прототип в Manus (или Genspark – тут уж что вам ближе). Дать заказчику "потыкать" этот прототип, собрать с его помощью обратную связь и оформить в виде ТЗ. Это сильно облегчает взаимодействие, так как вы работаете уже с осязаемыми и наглядными примерами, а не с абстракциями, которые каждый интерпретирует по-своему.

С помощью подобных прототипов можно также накидать несколько различных сценариев взаимодействия. Чтобы понять, какой подходит лучше всего.

Пример из жизни.

Мой товарищ Александр занимается тем, что помогает людям реализовать мечту – купить себе землю под строительство дачного домика на берегу Волги.

Сегодня я увидел, что они выложили на своём сайте "калькулятор дачи". Посмотреть можете тут под заголовком "Собери свою дачу так, как хочешь".

Предложил Саше эксперимент с переосмыслением калькулятора при помощи Manus. Получил согласие, за которое очень благодарен 🙂

Мне нравятся формы, которые заполняются в несколько этапов. Поэтому и решение, собранное при помощи Manus, сделано в данном формате.

Посмотреть результат переосмысления можно здесь.

А изучить весь процесс моего взаимодействия с AI-агентом Manus в рамках данной задачи можете по ссылке.

На мобильных устройствах прототип может быть немного "корявым", но на то он и прототип 🙂

Создание данного прототипа стоило 1368 кредитов от Manus. В деньгах это примерно $14-15. За упрощение взаимодействий с заказчиком – отличная цена. Тем более, что если вы будете разрабатывать прототип с нуля, а не парсить информацию с готового сайта, стоимость будет в 3-5 раз ниже.
2👍1512🔥7
Официальный MCP-сервер Figma.

Оказывается, ещё четвёртого июня Figma представила официальный MCP-сервер.

Получается, всё? Теперь MCP-сервера от сторонних разработчиков не нужны? Авторы софта сами всё сделали идеально?

Как бы не так.

Самое крутое, что сделали в Figma – это процесс установки. Не буду повторяться, всё отлично объяснено на официальном сайте. Установка очень простая и вообще без взаимодействия с терминалом.

Потом начинаются странности... Если быть точнее – инструменты. Их всего 5, так что я их перечислю с краткими комментариями от себя.

get_code_connect_map – или, как говорят в Figma, "кыш отсюда, нищеброд!". Доступен только в планах "Organization" и "Enterprise". Судя по описанию, это полезный инструмент. Так как именно get_code_connect_map показывает связи между нодами. Чтобы AI-агент хотя бы мог ориентироваться в проекте. Мне непонятно, для чего тут платить. Структуру нод можно сделать через API и для "Professional"-подписки.

get_image – круто, да? То, чего не хватает моему mcp-серверу – экспорт изображений из макета. Как бы не так. Инструмент get_image нужен для того, чтобы делать скриншоты блоков по ID.

get_code – а вот он, как ни странно, выкачивает изображения. И это не всё. Также он, по заявлениям разработчиков, генерирует "полноценный HTML выбранной ноды". Оптимизирует код под Tailwind+React. Настолько не уверен в себе, что предлагает делать скриншот ноды через get_image. Тогда AI-агент-разработчик будет в контексте того, что происходит.

get_variable_defs – выдаёт JSON с установленными в Figma переменными. Полезный инструмент. По поводу него у меня даже ироничных комментариев нет.

create_design_system_rules – инструмент, который возвращает промпт. С помощью этого промпта, по задумке, мы должны генерировать специфические правила для AI-агента специально под наш проект.

Я пробовал с этими четырьмя (или даже тремя с половиной?) инструментами получить от Figma MCP хоть что-то удобоваримое. Пытался придумать какую-то схему работы. Лучше всего сработала "вёрстка по картинке". Когда у AI-агента есть скриншот ноды и задание "сверстай". В таком случае итоговая вёрстка получается хотя бы похожей.

Попытки собрать из get_code страницу на React+Tailwind успехом не увенчались даже с относительно несложными блоками.

Вывод: судя по всему, это работает только для очень простых макетов. Вроде тех, что на YouTube используют дабы показать работу официального Figma MCP-сервера. Правда в том, что эта схема работала и с тем Figma-MCP, про который я рассказывал ещё в марте. С более-менее сложными макетами "официальный" сервер не справляется. Пойду добавлю экспорт картинок в свой.
310👍7🔥6
Заметили, как стремительно развивается AI-Coding?

Новые подходы и возможности появляются буквально каждую неделю.

Начиналось всё с безобидного общения в веб-интерфейсе OpenAI, а сейчас рой AI-агентов автономно пылесосит репозитории и создаёт пулреквесты, исправляя ваш код.

Легко запутаться во всех существующих инструментах и подходах.

Поэтому мы с другими авторами, пишущими про AI-Coding решили провести эфир. Формат – беседа в режиме онлайн, без строгой модерации. С модулем "ответы на вопросы" в конце эфира.

Будем разбираться, какие есть подходы к AI-разработке, в каких ситуациях использовать различные инструменты, а также как заставить AI-агента выдать качественный код.


Помимо меня, также участвуют:

1. Николай Шейко, "AI и Грабли"

2. Глеб Кудрявцев, "Глеб про AI"

3. Родион Мостовой, "AI-Driven Development"

4. Тимур Хахалев, "The AI Architect | AI Coding"


Дата и время: четверг, 28 августа, в 16:30 по МСК.

Мероприятие бесплатное. Ссылка для регистрации.

Увидимся на эфире!
1👍17🔥1073🆒1
Выкатил обновление для Figma MCP-сервера.

Добавил в него реализацию экспорта изображений.

Инструмент позволяет извлекать как растровые, так и векторные изображения и сразу сохраняет их в папку проекта.

Похоже, что все необходимые инструменты для полноценного превращения Figma-макета в HTML+CSS у меня теперь есть.

Следующие этапы по работе с Figma-MCP:

1. Упростить установку и запуск сервера. Сейчас это не самый простой процесс.

2. Подготовить настроенных AI-агентов для популярных AI-IDE, чтобы они максимально-эффективно использовали MCP-сервер.

3. Оптимизация сервера и удаление тех инструментов, которые не используются.
1🔥22👍54🤝2
В Kling 2.1 наконец-то добавили последний кадр для генерации AI-видео.

Что приятно – видео по-прежнему стоит 70 кредитов и наличие последнего кадра никак не влияет на стоимость 10-секундной генерации. В пересчёте на деньги, 70 кредитов – это примерно $1 за видео.

В связи с этим, я решил вспомнить небольшой сюжет, который я генерировал в ноябре прошлого года. Создавал я то видео по случаю того, что "Kling добавил генерацию по первому и последнему кадру". Даже и не помню, что там была за модель. Скорее всего, Kling1.6.

Повторил схожий нарратив, используя Kling2.1.

Качество выросло значительно, добавился звук и ушли многие проблемы, которые существовали чуть больше полугода назад.

p.s.: правда, звук получился нарезанным на 10-секундные отрезки. Потому что отдельный инструмент для озвучивания видео, который есть у Kling, нагло врёт. Утверждает, что может озвучить видео продолжительностью до 3 минут, но на деле не даёт обработать отрезки длиннее 20 секунд. Ну, либо я не справился с интерфейсом 🙃
1👍63🔥1
Генерация видео в Google Veo3 всего за 8 рублей. Без сложных манипуляций с "Я студент! Честное слово!".

Более того – скорее всего, у вас уже всё для этого есть.

Оказывается, в Perplexity добавили генерацию видео. Под капотом – Veo3.

Как это работает:

1. Заходим на сайт Perplexity. Из приложения пока не работает.

2. Выбираем обыкновенный "Поиск" и модель "Лучший".

3. Вбиваем в строку поиска, что мы хотим сгенерировать (активируем генерацию через "сгенерируй видео"). Image-to-video также работает, поэтому можно подгрузить первый кадр.

4. Для генерации, конечно же, потребуется pro-аккаунт, который всё ещё можно взять тут в среднем за 500 рублей.

Лимиты достаточно жёсткие. На одном pro-аккаунте можно сгенерировать всего лишь 5 видео в месяц. То есть 60 видео в год. Получается, что при цене pro-подписки в 500 рублей за год, одна генерация видео стоит примерно 8 рублей и 35 копеек.

Получается, закупаем сотню аккаунтов по 188 рублей/штука и идём пилить Veo3-полнометражку? 🙂

UPD: в комментариях также подсказали, что для массовой генерации Veo3-видео, можно там же взять сразу аккаунт Google. Правда, из РФ он напрямую работать не будет.

Спасибо Андрею, который рассказал в чате Hegai о наличии Veo3-генераций в Perplexity.
2🔥9👍63
Какие плюсы есть от того, что карту слили кардерам и её пришлось заблокировать?

Для себя отметил следующие:

1. Ещё в одной сфере жизни появилась "душная" схема. Теперь из моих карточек в интернете есть только одна. На ней всегда стоит жёсткий лимит и физически не бывает много средств.

2. Список подписок на AI-сервисы очистился круче, чем каналы в Венеции во время коронавируса. Фактически, остались только те, отключение которых из-за не удавшейся оплаты тут же влияет на ежедневные сценарии использования AI.

В общем, даже неприятные события в жизни можно обратить в плюс.

А как вы отслеживаете свои AI-подписки?
1🔥96👍4
"Сделай рефакторинг кода моего проекта", как способ добить навайбкоженный проект.

Если проект делался "на вайбе" и с минимумом контроля, то в какой-то момент внесение новых функций обязательно начнёт буксовать.

Далее – истинный вайбкодер обязательно узнает слова "качество кода" и "рефакторинг" и попробует применить магию рефакторинга в деле.

Тот самый запрос из заголовка поста: "Сделай рефакторинг кода моего проекта". Далее – согласие со всеми изменениями и, как итог, проект с очень красивым переделанным кодом.

Жаль только не работает.

Потому что AI-агент не волшебник и мысли создателя читать не умеет. Без явного описания "а что тут, собственно, происходит?" он с радостью додумает себе бизнес-контекст вашей программы и исправит всё. Вот вообще всё. Даже то, что являлось частью бизнес-логики, но выглядело как-то "неправильно" с точки зрения агента.

На этом этапе проект пора закапывать. И это – лучшее решение.

Если не закопать, то можно просадить все лимиты, потратить все токены и нервы.

Вопрос "Как сделать так, чтобы работало?" мы обсудим совсем скоро на эфире. Вся информация о нём в этом посте.

Регистрируйтесь, если ещё не успели! 🔥
2👍9🔥52