This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня наконец-то Veo3 стал доступен по API.
Следовательно, в этот же день на платформе fal.ai, которую я использую для генераций, появилось не только text-to-video, но и image-to-video.
Наконец-то не придётся убеждать Manus в том, что мне надо сгенерировать видео именно в Veo3 и в том, что я достоин генерации(true story: когда Veo3 только появился, мне в чате приходилось убеждать Manus, что у меня корректная подписка для генерации видео) .
Стоимость у image-to-video на fal.ai осталась той же, что и для text-to-video: $0.5 за секунду генерации без звука и $0.75 за секунду со звуком.
Да, это $6 за 8-секундное видео со звуком. Но стоит помнить, что Veo3 может генерировать более сложные сцены с меньшего количества попыток. Обеспечивая отличное понимание промпта. Плюс ещё голос и Lipsync на русском языке.
Следовательно, в этот же день на платформе fal.ai, которую я использую для генераций, появилось не только text-to-video, но и image-to-video.
Наконец-то не придётся убеждать Manus в том, что мне надо сгенерировать видео именно в Veo3 и в том, что я достоин генерации
Стоимость у image-to-video на fal.ai осталась той же, что и для text-to-video: $0.5 за секунду генерации без звука и $0.75 за секунду со звуком.
Да, это $6 за 8-секундное видео со звуком. Но стоит помнить, что Veo3 может генерировать более сложные сцены с меньшего количества попыток. Обеспечивая отличное понимание промпта. Плюс ещё голос и Lipsync на русском языке.
1🔥7👍6❤5🤯1
"Как нейросети помогают увеличить продажи фрилансеру?"
На днях проводил эфир для закрытого сообщества с одноимённой темой.
Фактически, разобрал процесс взаимодействия фрилансера с заказчиком на этапы и по каждому этапу дал примеры того, как AI может помочь.
На эфире я не затрагивал сам процесс выполнения заказа. Что логично – фрилансеры бывают разные, поэтому и работа у них разная. Большей части специалистов я едва ли смогу рассказать, как им следует делать непосредственно их работу.
Фактически, все кейсы применения AI помогали в следующих аспектах:
1. Как фрилансеру лучше понять и оценить себя. За какие сроки и стоимость ему будет действительно комфортно выполнить определённый объём работы. Заодно – понять своё место на рынке.
2. Как в процессе работы давать больше, чем ожидает от фрилансера бизнес.
3. Как выстроить равные, партнёрские отношения с заказчиком и работать с доверием друг к другу.
Заметили, да? Всё это возможно сделать и без AI. Но внедрение обозначенных процессов в работу позволяет увеличить LTV от заказчика, а также включает тот самый "сарафан", на который надеятся многие фрилансеры.
Когда я формулировал для себя правила взаимодействия с заказчиками в качестве фрилансера, AI ещё не был инструментом, способным помочь в реализации обозначенных пунктов.
Однако с нейросетями можно сделать больше, потратив меньше времени. Особенно в вопросах выстраивания отношений.
Кейсы применения AI, на самом деле, не особо сложные, но могут оказаться полезными в работе. Как для фрилансеров, так и для тех, кто работает в найме. Ставьте 🔥, если желаете прочитать про них (и не только) подробнее.
На днях проводил эфир для закрытого сообщества с одноимённой темой.
Фактически, разобрал процесс взаимодействия фрилансера с заказчиком на этапы и по каждому этапу дал примеры того, как AI может помочь.
На эфире я не затрагивал сам процесс выполнения заказа. Что логично – фрилансеры бывают разные, поэтому и работа у них разная. Большей части специалистов я едва ли смогу рассказать, как им следует делать непосредственно их работу.
Фактически, все кейсы применения AI помогали в следующих аспектах:
1. Как фрилансеру лучше понять и оценить себя. За какие сроки и стоимость ему будет действительно комфортно выполнить определённый объём работы. Заодно – понять своё место на рынке.
2. Как в процессе работы давать больше, чем ожидает от фрилансера бизнес.
3. Как выстроить равные, партнёрские отношения с заказчиком и работать с доверием друг к другу.
Заметили, да? Всё это возможно сделать и без AI. Но внедрение обозначенных процессов в работу позволяет увеличить LTV от заказчика, а также включает тот самый "сарафан", на который надеятся многие фрилансеры.
Когда я формулировал для себя правила взаимодействия с заказчиками в качестве фрилансера, AI ещё не был инструментом, способным помочь в реализации обозначенных пунктов.
Однако с нейросетями можно сделать больше, потратив меньше времени. Особенно в вопросах выстраивания отношений.
Кейсы применения AI, на самом деле, не особо сложные, но могут оказаться полезными в работе. Как для фрилансеров, так и для тех, кто работает в найме. Ставьте 🔥, если желаете прочитать про них (и не только) подробнее.
1🔥24👍6❤5
История с кардерами на 30000+ рублей. Не совсем про AI.
Я уже несколько раз писал в этом блоге о различных видах мошенничества. Вот пост из раннего про общительных ботов, которые по итогу пытаются развести на деньги. Или о том, как использовать знания об AI при общении со взломщиками личных аккаунтов.
Поэтому сегодняшнюю историю я не мог не рассказать вам. Для того, чтобы показать ещё один потенциальный источник угрозы со стороны мошенников.
3 августа, прогуливаясь воскресным вечером по моллу, я получаю SMS о списании с моей карты банка FAB (First Abu Dhabi Bank) 1711 MYR в пользу компании Facebook(вот уж где действительно стоит упомянуть, какие они на самом деле экстремисты) . Конкретно – за пополнение аккаунта Facebook Ads. Естественно, платёж я не проводил.
Тут же пытаюсь дозвониться до службы поддержки. Пока дозваниваюсь – приходит ещё одно SMS об ещё одной попытке снятия средств. Она не увенчалась успехом, потому что на карте просто не было необходимой суммы – буквально за два дня до этого я снимал с этого счёта наличные.
Дело в том, что в ОАЭ часть операций с "доверенными" компаниями может проходить без OTP (SMS с номером для подтверждения). Как вы понимаете, Малазийскому аккаунту Facebook Ads мой банк очень доверяет,а вот я – не очень.
Как вообще данные карты утекли?
Подозреваю, что тут дело как раз-таки в AI-сервисах. В рамках подготовки материалов к практикуму по AI-видео я тестировал множество сервисов (в том числе и неизвестных мне ранее) для решения тех или иных задач. И в какой-то момент потерял бдительность. На 30000 рублей.
Что было дальше?
На следующий день, в понедельник 4 августа, я поехал в банк. Под внимательным взором сотрудницы банка заполнил форму о неправомерном снятии средств, сфорографировал её на телефон и отправил на специальный e-mail(можно было и полностью онлайн это сделать, но я предпочёл получить консультацию о правильности заполнения) . Заодно удостоверился, что карту мне уже выпускают новую и скоро доставят на дом.
А потом – тишина. Даже не было сообщения после отправки формы о том, что "да, мы получили твой e-mail. Всё с ним хорошо!". Через сутки я отправил ещё одно сообщение (с текстом "вы там ничего не потеряли?") на тот же e-mail и в ответ пришло – "Мы получили твой e-mail".
Вообще, деньги от того перевода ещё три дня висели в статусе "Hold". И я надеялся, что форму обработают быстро и они попросту не успеют уйти…
11 августа мне на почту приходит письмо "Здравствуйте! Мы зарегистрировали ваше обращение под номером XXXXX". И рядом ещё одно письмо: "Мы ничего не потеряли. Зарегистрировали ваше обращение под номером XXXXX".
На тот момент деньги уже окончательно покинули мой счёт и вышли из статуса "Hold". Стоит ли говорить, что надежды на их возвращение у меня не осталось?
Сегодня, 16 августа, мне на счёт вернули деньги. Чему я очень рад. Так как у меня с малазийскими кардерами не настолько тёплые отношения, чтобы делать столь щедрые подарки.
Для чего этот пост?
Ещё раз напомнить: сохраняйте бдительность. Особенно, если вы регулярно тестируете (в том числе – платные) AI-сервисы (да и вообще делаете платежи в интернете). Большая часть белых сервисов проводит платежи с использованием Stripe / Link / Paypal / ApplePay / GooglePay. Если малоизвестный сервис просит вводить данные карты у себя в личном кабинете (и не предлагает альтернатив), то это, скорее всего, мошенники.
В одном из следующих постов расскажу, как теперь я выстроил систему взаимодействия с картами, чтобы кардеры, даже имея данные карты, не могли с неё снять значимых сумм.
Я уже несколько раз писал в этом блоге о различных видах мошенничества. Вот пост из раннего про общительных ботов, которые по итогу пытаются развести на деньги. Или о том, как использовать знания об AI при общении со взломщиками личных аккаунтов.
Поэтому сегодняшнюю историю я не мог не рассказать вам. Для того, чтобы показать ещё один потенциальный источник угрозы со стороны мошенников.
3 августа, прогуливаясь воскресным вечером по моллу, я получаю SMS о списании с моей карты банка FAB (First Abu Dhabi Bank) 1711 MYR в пользу компании Facebook
Тут же пытаюсь дозвониться до службы поддержки. Пока дозваниваюсь – приходит ещё одно SMS об ещё одной попытке снятия средств. Она не увенчалась успехом, потому что на карте просто не было необходимой суммы – буквально за два дня до этого я снимал с этого счёта наличные.
Дело в том, что в ОАЭ часть операций с "доверенными" компаниями может проходить без OTP (SMS с номером для подтверждения). Как вы понимаете, Малазийскому аккаунту Facebook Ads мой банк очень доверяет,
Как вообще данные карты утекли?
Подозреваю, что тут дело как раз-таки в AI-сервисах. В рамках подготовки материалов к практикуму по AI-видео я тестировал множество сервисов (в том числе и неизвестных мне ранее) для решения тех или иных задач. И в какой-то момент потерял бдительность. На 30000 рублей.
Что было дальше?
На следующий день, в понедельник 4 августа, я поехал в банк. Под внимательным взором сотрудницы банка заполнил форму о неправомерном снятии средств, сфорографировал её на телефон и отправил на специальный e-mail
А потом – тишина. Даже не было сообщения после отправки формы о том, что "да, мы получили твой e-mail. Всё с ним хорошо!". Через сутки я отправил ещё одно сообщение (с текстом "вы там ничего не потеряли?") на тот же e-mail и в ответ пришло – "Мы получили твой e-mail".
Вообще, деньги от того перевода ещё три дня висели в статусе "Hold". И я надеялся, что форму обработают быстро и они попросту не успеют уйти…
11 августа мне на почту приходит письмо "Здравствуйте! Мы зарегистрировали ваше обращение под номером XXXXX". И рядом ещё одно письмо: "Мы ничего не потеряли. Зарегистрировали ваше обращение под номером XXXXX".
На тот момент деньги уже окончательно покинули мой счёт и вышли из статуса "Hold". Стоит ли говорить, что надежды на их возвращение у меня не осталось?
Сегодня, 16 августа, мне на счёт вернули деньги. Чему я очень рад. Так как у меня с малазийскими кардерами не настолько тёплые отношения, чтобы делать столь щедрые подарки.
Для чего этот пост?
Ещё раз напомнить: сохраняйте бдительность. Особенно, если вы регулярно тестируете (в том числе – платные) AI-сервисы (да и вообще делаете платежи в интернете). Большая часть белых сервисов проводит платежи с использованием Stripe / Link / Paypal / ApplePay / GooglePay. Если малоизвестный сервис просит вводить данные карты у себя в личном кабинете (и не предлагает альтернатив), то это, скорее всего, мошенники.
В одном из следующих постов расскажу, как теперь я выстроил систему взаимодействия с картами, чтобы кардеры, даже имея данные карты, не могли с неё снять значимых сумм.
1❤14👍9🔥7
Про строку состояния в Claude Code.
У CC есть команда(пробовал – у CC получается не самое приятное отображение, если честно) .
Либо можно пойти в официальную документацию и настроить Status line самостоятельно по примерам.
Но есть и куда более "ленивый" режим настройки. Через проект ccstatusline.
Это консольное микроприложение, которое позволяет в дружелюбном интерфейсе настроить до трёх строк состояния (одна под другой), посмотреть их на превью, а потом одной командой установить в Claude Code.
Полный список того, что можно добавить в качестве элемента в Status line:
Удобный инструмент, чтобы отслеживать текущее состояние контекста, параметры git-а, а также время до обновления лимитов.
У CC есть команда
/statusline
, которая позволяет в вайб-режиме установить строку состояния. Также потом можно попробовать её настроить посредством промптов Либо можно пойти в официальную документацию и настроить Status line самостоятельно по примерам.
Но есть и куда более "ленивый" режим настройки. Через проект ccstatusline.
Это консольное микроприложение, которое позволяет в дружелюбном интерфейсе настроить до трёх строк состояния (одна под другой), посмотреть их на превью, а потом одной командой установить в Claude Code.
Полный список того, что можно добавить в качестве элемента в Status line:
Model Name - Shows the current Claude model (e.g., "Claude 3.5 Sonnet")
Git Branch - Displays current git branch name
Git Changes - Shows uncommitted insertions/deletions (e.g., "+42,-10")
Session Clock - Shows elapsed time since session start (e.g., "2hr 15m")
Version - Shows Claude Code version
Output Style - Shows the currently set output style in Claude Code
Tokens Input - Shows input tokens used
Tokens Output - Shows output tokens used
Tokens Cached - Shows cached tokens used
Tokens Total - Shows total tokens used
Context Length - Shows current context length in tokens
Context Percentage - Shows percentage of context limit used (out of 200k)
Context Percentage (usable) - Shows percentage of usable context (out of 160k, accounting for auto-compact at 80%)
Terminal Width - Shows detected terminal width (for debugging)
Custom Text - Add your own custom text to the status line
Custom Command - Execute shell commands and display their output (refreshes whenever the statusline is updated by Claude Code)
Separator - Visual divider between items (customizable: |, -, comma, space)
Flex Separator - Expands to fill available space
Удобный инструмент, чтобы отслеживать текущее состояние контекста, параметры git-а, а также время до обновления лимитов.
1❤11👍8🔥6
Про Hooks в Claude Code.
Чем глубже я изучаю Claude Code, тем больше убеждаюсь, что решение от Anthropic – ультимативный инструмент для AI-Coding.
В обзоре на Kiro, что был чуть больше месяца назад, я очень тепло отозвался о функциональности Agent Hooks.
Просто на тот момент я не знал, что Claude Code даёт в своих Hooks куда больше возможностей.
Самая главная особенность Hooks – добавление большей детерменированности в процесс написания кода.
Claude Code позволяет подключиться через хук в любой момент, начиная от отправки пользователем промпта, заканчивая уведомлением от Claude Code о завершении работы, и выполнить необходимое действие. При этом мы можем как принудительно запустить другого агента, так и выполнить произвольный код или команду в терминале.
Документацию на официальном сайте изучать тут, а примеры в референсах можно посмотреть здесь.
Несколько примеров использования Hooks для вдохновения:
1. Максим опубликовал классный geek-пример того, как он на свой Stream Deck(там буква r после t) выводит информацию о запущенных проектах в Claude Code.
2. А в этом видео разработчик построил полноценную систему, которая в real-time-режиме отслеживает всё, что делают AI-агенты и субагенты в процессе работы Claude Code.
3. Или вот репозиторий, в котором через хуки реализован TDD-надсмотрщик, неустанно бдящий, чтобы Claude Code следовал Test-driven-подходу в разработке(AI-агентов хлебом не корми – дай только срезать углы) .
Итог: hooks – ещё один инструмент, позволяющий добавить контроля при взаимодействии с Claude Code. Это тот самый момент, когда от открывающихся с инструментом возможностей захватывает дух 🔥
Чем глубже я изучаю Claude Code, тем больше убеждаюсь, что решение от Anthropic – ультимативный инструмент для AI-Coding.
В обзоре на Kiro, что был чуть больше месяца назад, я очень тепло отозвался о функциональности Agent Hooks.
Просто на тот момент я не знал, что Claude Code даёт в своих Hooks куда больше возможностей.
Самая главная особенность Hooks – добавление большей детерменированности в процесс написания кода.
Claude Code позволяет подключиться через хук в любой момент, начиная от отправки пользователем промпта, заканчивая уведомлением от Claude Code о завершении работы, и выполнить необходимое действие. При этом мы можем как принудительно запустить другого агента, так и выполнить произвольный код или команду в терминале.
Документацию на официальном сайте изучать тут, а примеры в референсах можно посмотреть здесь.
Несколько примеров использования Hooks для вдохновения:
1. Максим опубликовал классный geek-пример того, как он на свой Stream Deck
2. А в этом видео разработчик построил полноценную систему, которая в real-time-режиме отслеживает всё, что делают AI-агенты и субагенты в процессе работы Claude Code.
3. Или вот репозиторий, в котором через хуки реализован TDD-надсмотрщик, неустанно бдящий, чтобы Claude Code следовал Test-driven-подходу в разработке
Итог: hooks – ещё один инструмент, позволяющий добавить контроля при взаимодействии с Claude Code. Это тот самый момент, когда от открывающихся с инструментом возможностей захватывает дух 🔥
3❤17🔥14👍12
Qwen Image Edit сдвигает с пьедестала Flux Kontext.
Некоторое время у меня была в быстром доступе ссылка на https://www.easyedit.io/ , чтобы иметь под рукой inpaint от Flux Kontext.
На днях вышел Qwen Image Edit. И сразу отправился в Open Source. То есть в скором времени нас ожидает большое количество файн-тюнов и лор для этой модели.
Он доступен бесплатно на сайте Qwen. Чтобы использовать режим, нужно предварительно нажать на кнопку "Редактирование изображения" под полем ввода.
Что умеет хорошо:
1. Менять цвет объекта.
2. Добавлять новые предметы.
3. Заменять один предмет на другой.
4. Поменять стиль изображения(опять гиблифицировать 🙂) .
5. Добавлять английские надписи на изображение.
6. Понимать промпты. В том числе – на русском языке.
7. Сохранять исходное изображение, не затронутое inpaint-ом.
8. Менять ракурс исходного изображения. Но только в простых сценах.
Что умеет плохо:
1. Писать текст кириллицей. Для этих целей ChatGPT подходит лучше всех. Но, возможно, появится fine-tune Qwen3 под эту задачу.
2. Сохранять лица, если они затронуты inpaint-ом. Делает это лучше, чем ChatGPT, но всё равно узнаваемость легко потерять.
3. Обрабатывать несколько изображений. Загрузить можно, но корректно обработать он может только одно загруженное. То есть перенести предмет с одной фотографии на другую не получится.
4. Иногда модель "ломается". И не может произвести даже простой inpaint. Что приводит к полной перерисовке изображения. Я с таким столкнулся буквально пару раз. Помогла смена языка промпта на английский.
Скорее всего, как и в случае с Flux, я буду достаточно редко использовать Qwen Image Edit. Ибо ChatGPT, как правило, справляется с возникающими у меня задачами. У меня мало кейсов, когда критически важно сохранить неизменными все части исходного изображения. Возможно, у вас кейсов больше и в таком случае Qwen Image Edit – отличный инструмент.
Некоторое время у меня была в быстром доступе ссылка на https://www.easyedit.io/ , чтобы иметь под рукой inpaint от Flux Kontext.
На днях вышел Qwen Image Edit. И сразу отправился в Open Source. То есть в скором времени нас ожидает большое количество файн-тюнов и лор для этой модели.
Он доступен бесплатно на сайте Qwen. Чтобы использовать режим, нужно предварительно нажать на кнопку "Редактирование изображения" под полем ввода.
Что умеет хорошо:
1. Менять цвет объекта.
2. Добавлять новые предметы.
3. Заменять один предмет на другой.
4. Поменять стиль изображения
5. Добавлять английские надписи на изображение.
6. Понимать промпты. В том числе – на русском языке.
7. Сохранять исходное изображение, не затронутое inpaint-ом.
8. Менять ракурс исходного изображения. Но только в простых сценах.
Что умеет плохо:
1. Писать текст кириллицей. Для этих целей ChatGPT подходит лучше всех. Но, возможно, появится fine-tune Qwen3 под эту задачу.
2. Сохранять лица, если они затронуты inpaint-ом. Делает это лучше, чем ChatGPT, но всё равно узнаваемость легко потерять.
3. Обрабатывать несколько изображений. Загрузить можно, но корректно обработать он может только одно загруженное. То есть перенести предмет с одной фотографии на другую не получится.
4. Иногда модель "ломается". И не может произвести даже простой inpaint. Что приводит к полной перерисовке изображения. Я с таким столкнулся буквально пару раз. Помогла смена языка промпта на английский.
Скорее всего, как и в случае с Flux, я буду достаточно редко использовать Qwen Image Edit. Ибо ChatGPT, как правило, справляется с возникающими у меня задачами. У меня мало кейсов, когда критически важно сохранить неизменными все части исходного изображения. Возможно, у вас кейсов больше и в таком случае Qwen Image Edit – отличный инструмент.
1👍14❤3🔥3
Тот самый кейс для UX/UI-дизайнеров.
Отлично подходит для переработки сложных взаимодействий приложения/сайта с пользователем. Когда необходим продуманный интерактив.
Порой, на этапе сбора требований по интерактивным системам, дизайнерам приходится сломать немало копий(с названиями по типу точно_финальное_ТЗ_дизайнеру(28).docx) , чтобы получить описание всех нюансов работы бизнес-процесса.
А можно собрать за 15-30 минут полноценный интерактивный прототип в Manus (или Genspark – тут уж что вам ближе). Дать заказчику "потыкать" этот прототип, собрать с его помощью обратную связь и оформить в виде ТЗ. Это сильно облегчает взаимодействие, так как вы работаете уже с осязаемыми и наглядными примерами, а не с абстракциями, которые каждый интерпретирует по-своему.
С помощью подобных прототипов можно также накидать несколько различных сценариев взаимодействия. Чтобы понять, какой подходит лучше всего.
Пример из жизни.
Мой товарищ Александр занимается тем, что помогает людям реализовать мечту – купить себе землю под строительство дачного домика на берегу Волги.
Сегодня я увидел, что они выложили на своём сайте "калькулятор дачи". Посмотреть можете тут под заголовком "Собери свою дачу так, как хочешь".
Предложил Саше эксперимент с переосмыслением калькулятора при помощи Manus. Получил согласие, за которое очень благодарен 🙂
Мне нравятся формы, которые заполняются в несколько этапов. Поэтому и решение, собранное при помощи Manus, сделано в данном формате.
Посмотреть результат переосмысления можно здесь.
А изучить весь процесс моего взаимодействия с AI-агентом Manus в рамках данной задачи можете по ссылке.
На мобильных устройствах прототип может быть немного "корявым", но на то он и прототип 🙂
Создание данного прототипа стоило 1368 кредитов от Manus. В деньгах это примерно $14-15. За упрощение взаимодействий с заказчиком – отличная цена. Тем более, что если вы будете разрабатывать прототип с нуля, а не парсить информацию с готового сайта, стоимость будет в 3-5 раз ниже.
Отлично подходит для переработки сложных взаимодействий приложения/сайта с пользователем. Когда необходим продуманный интерактив.
Порой, на этапе сбора требований по интерактивным системам, дизайнерам приходится сломать немало копий
А можно собрать за 15-30 минут полноценный интерактивный прототип в Manus (или Genspark – тут уж что вам ближе). Дать заказчику "потыкать" этот прототип, собрать с его помощью обратную связь и оформить в виде ТЗ. Это сильно облегчает взаимодействие, так как вы работаете уже с осязаемыми и наглядными примерами, а не с абстракциями, которые каждый интерпретирует по-своему.
С помощью подобных прототипов можно также накидать несколько различных сценариев взаимодействия. Чтобы понять, какой подходит лучше всего.
Пример из жизни.
Мой товарищ Александр занимается тем, что помогает людям реализовать мечту – купить себе землю под строительство дачного домика на берегу Волги.
Сегодня я увидел, что они выложили на своём сайте "калькулятор дачи". Посмотреть можете тут под заголовком "Собери свою дачу так, как хочешь".
Предложил Саше эксперимент с переосмыслением калькулятора при помощи Manus. Получил согласие, за которое очень благодарен 🙂
Мне нравятся формы, которые заполняются в несколько этапов. Поэтому и решение, собранное при помощи Manus, сделано в данном формате.
Посмотреть результат переосмысления можно здесь.
А изучить весь процесс моего взаимодействия с AI-агентом Manus в рамках данной задачи можете по ссылке.
На мобильных устройствах прототип может быть немного "корявым", но на то он и прототип 🙂
Создание данного прототипа стоило 1368 кредитов от Manus. В деньгах это примерно $14-15. За упрощение взаимодействий с заказчиком – отличная цена. Тем более, что если вы будете разрабатывать прототип с нуля, а не парсить информацию с готового сайта, стоимость будет в 3-5 раз ниже.
2👍15❤12🔥7
Официальный MCP-сервер Figma.
Оказывается, ещё четвёртого июня Figma представила официальный MCP-сервер.
Получается, всё? Теперь MCP-сервера от сторонних разработчиков не нужны? Авторы софта сами всё сделали идеально?
Как бы не так.
Самое крутое, что сделали в Figma – это процесс установки. Не буду повторяться, всё отлично объяснено на официальном сайте. Установка очень простая и вообще без взаимодействия с терминалом.
Потом начинаются странности... Если быть точнее – инструменты. Их всего 5, так что я их перечислю с краткими комментариями от себя.
get_code_connect_map – или, как говорят в Figma, "кыш отсюда, нищеброд!". Доступен только в планах "Organization" и "Enterprise". Судя по описанию, это полезный инструмент. Так как именно get_code_connect_map показывает связи между нодами. Чтобы AI-агент хотя бы мог ориентироваться в проекте. Мне непонятно, для чего тут платить. Структуру нод можно сделать через API и для "Professional"-подписки.
get_image – круто, да? То, чего не хватает моему mcp-серверу – экспорт изображений из макета. Как бы не так. Инструмент get_image нужен для того, чтобы делать скриншоты блоков по ID.
get_code – а вот он, как ни странно, выкачивает изображения. И это не всё. Также он, по заявлениям разработчиков, генерирует "полноценный HTML выбранной ноды". Оптимизирует код под Tailwind+React. Настолько не уверен в себе, что предлагает делать скриншот ноды через get_image. Тогда AI-агент-разработчик будет в контексте того, что происходит.
get_variable_defs – выдаёт JSON с установленными в Figma переменными. Полезный инструмент. По поводу него у меня даже ироничных комментариев нет.
create_design_system_rules – инструмент, который возвращает промпт. С помощью этого промпта, по задумке, мы должны генерировать специфические правила для AI-агента специально под наш проект.
Я пробовал с этими четырьмя(или даже тремя с половиной?) инструментами получить от Figma MCP хоть что-то удобоваримое. Пытался придумать какую-то схему работы. Лучше всего сработала "вёрстка по картинке". Когда у AI-агента есть скриншот ноды и задание "сверстай". В таком случае итоговая вёрстка получается хотя бы похожей.
Попытки собрать из get_code страницу на React+Tailwind успехом не увенчались даже с относительно несложными блоками.
Вывод: судя по всему, это работает только для очень простых макетов. Вроде тех, что на YouTube используют дабы показать работу официального Figma MCP-сервера. Правда в том, что эта схема работала и с тем Figma-MCP, про который я рассказывал ещё в марте. С более-менее сложными макетами "официальный" сервер не справляется. Пойду добавлю экспорт картинок в свой.
Оказывается, ещё четвёртого июня Figma представила официальный MCP-сервер.
Получается, всё? Теперь MCP-сервера от сторонних разработчиков не нужны? Авторы софта сами всё сделали идеально?
Как бы не так.
Самое крутое, что сделали в Figma – это процесс установки. Не буду повторяться, всё отлично объяснено на официальном сайте. Установка очень простая и вообще без взаимодействия с терминалом.
Потом начинаются странности... Если быть точнее – инструменты. Их всего 5, так что я их перечислю с краткими комментариями от себя.
get_code_connect_map – или, как говорят в Figma, "кыш отсюда, нищеброд!". Доступен только в планах "Organization" и "Enterprise". Судя по описанию, это полезный инструмент. Так как именно get_code_connect_map показывает связи между нодами. Чтобы AI-агент хотя бы мог ориентироваться в проекте. Мне непонятно, для чего тут платить. Структуру нод можно сделать через API и для "Professional"-подписки.
get_image – круто, да? То, чего не хватает моему mcp-серверу – экспорт изображений из макета. Как бы не так. Инструмент get_image нужен для того, чтобы делать скриншоты блоков по ID.
get_code – а вот он, как ни странно, выкачивает изображения. И это не всё. Также он, по заявлениям разработчиков, генерирует "полноценный HTML выбранной ноды". Оптимизирует код под Tailwind+React. Настолько не уверен в себе, что предлагает делать скриншот ноды через get_image. Тогда AI-агент-разработчик будет в контексте того, что происходит.
get_variable_defs – выдаёт JSON с установленными в Figma переменными. Полезный инструмент. По поводу него у меня даже ироничных комментариев нет.
create_design_system_rules – инструмент, который возвращает промпт. С помощью этого промпта, по задумке, мы должны генерировать специфические правила для AI-агента специально под наш проект.
Я пробовал с этими четырьмя
Попытки собрать из get_code страницу на React+Tailwind успехом не увенчались даже с относительно несложными блоками.
Вывод: судя по всему, это работает только для очень простых макетов. Вроде тех, что на YouTube используют дабы показать работу официального Figma MCP-сервера. Правда в том, что эта схема работала и с тем Figma-MCP, про который я рассказывал ещё в марте. С более-менее сложными макетами "официальный" сервер не справляется. Пойду добавлю экспорт картинок в свой.
3❤10👍7🔥6
Заметили, как стремительно развивается AI-Coding?
Новые подходы и возможности появляются буквально каждую неделю.
Начиналось всё с безобидного общения в веб-интерфейсе OpenAI, а сейчас рой AI-агентов автономно пылесосит репозитории и создаёт пулреквесты, исправляя ваш код.
Легко запутаться во всех существующих инструментах и подходах.
Поэтому мы с другими авторами, пишущими про AI-Coding решили провести эфир. Формат – беседа в режиме онлайн, без строгой модерации. С модулем "ответы на вопросы" в конце эфира.
Будем разбираться, какие есть подходы к AI-разработке, в каких ситуациях использовать различные инструменты, а также как заставить AI-агента выдать качественный код.
Помимо меня, также участвуют:
1. Николай Шейко, "AI и Грабли"
2. Глеб Кудрявцев, "Глеб про AI"
3. Родион Мостовой, "AI-Driven Development"
4. Тимур Хахалев, "The AI Architect | AI Coding"
Дата и время: четверг, 28 августа, в 16:30 по МСК.
Мероприятие бесплатное. Ссылка для регистрации.
Увидимся на эфире!
Новые подходы и возможности появляются буквально каждую неделю.
Начиналось всё с безобидного общения в веб-интерфейсе OpenAI, а сейчас рой AI-агентов автономно пылесосит репозитории и создаёт пулреквесты, исправляя ваш код.
Легко запутаться во всех существующих инструментах и подходах.
Поэтому мы с другими авторами, пишущими про AI-Coding решили провести эфир. Формат – беседа в режиме онлайн, без строгой модерации. С модулем "ответы на вопросы" в конце эфира.
Будем разбираться, какие есть подходы к AI-разработке, в каких ситуациях использовать различные инструменты, а также как заставить AI-агента выдать качественный код.
Помимо меня, также участвуют:
1. Николай Шейко, "AI и Грабли"
2. Глеб Кудрявцев, "Глеб про AI"
3. Родион Мостовой, "AI-Driven Development"
4. Тимур Хахалев, "The AI Architect | AI Coding"
Дата и время: четверг, 28 августа, в 16:30 по МСК.
Мероприятие бесплатное. Ссылка для регистрации.
Увидимся на эфире!
1👍17🔥10❤7⚡3🆒1
Выкатил обновление для Figma MCP-сервера.
Добавил в него реализацию экспорта изображений.
Инструмент позволяет извлекать как растровые, так и векторные изображения и сразу сохраняет их в папку проекта.
Похоже, что все необходимые инструменты для полноценного превращения Figma-макета в HTML+CSS у меня теперь есть.
Следующие этапы по работе с Figma-MCP:
1. Упростить установку и запуск сервера. Сейчас это не самый простой процесс.
2. Подготовить настроенных AI-агентов для популярных AI-IDE, чтобы они максимально-эффективно использовали MCP-сервер.
3. Оптимизация сервера и удаление тех инструментов, которые не используются.
Добавил в него реализацию экспорта изображений.
Инструмент позволяет извлекать как растровые, так и векторные изображения и сразу сохраняет их в папку проекта.
Похоже, что все необходимые инструменты для полноценного превращения Figma-макета в HTML+CSS у меня теперь есть.
Следующие этапы по работе с Figma-MCP:
1. Упростить установку и запуск сервера. Сейчас это не самый простой процесс.
2. Подготовить настроенных AI-агентов для популярных AI-IDE, чтобы они максимально-эффективно использовали MCP-сервер.
3. Оптимизация сервера и удаление тех инструментов, которые не используются.
1🔥22👍5❤4🤝2
В Kling 2.1 наконец-то добавили последний кадр для генерации AI-видео.
Что приятно – видео по-прежнему стоит 70 кредитов и наличие последнего кадра никак не влияет на стоимость 10-секундной генерации. В пересчёте на деньги, 70 кредитов – это примерно $1 за видео.
В связи с этим, я решил вспомнить небольшой сюжет, который я генерировал в ноябре прошлого года. Создавал я то видео по случаю того, что "Kling добавил генерацию по первому и последнему кадру". Даже и не помню, что там была за модель. Скорее всего, Kling1.6.
Повторил схожий нарратив, используя Kling2.1.
Качество выросло значительно, добавился звук и ушли многие проблемы, которые существовали чуть больше полугода назад.
p.s.: правда, звук получился нарезанным на 10-секундные отрезки. Потому что отдельный инструмент для озвучивания видео, который есть у Kling, нагло врёт. Утверждает, что может озвучить видео продолжительностью до 3 минут, но на деле не даёт обработать отрезки длиннее 20 секунд. Ну, либо я не справился с интерфейсом 🙃
Что приятно – видео по-прежнему стоит 70 кредитов и наличие последнего кадра никак не влияет на стоимость 10-секундной генерации. В пересчёте на деньги, 70 кредитов – это примерно $1 за видео.
В связи с этим, я решил вспомнить небольшой сюжет, который я генерировал в ноябре прошлого года. Создавал я то видео по случаю того, что "Kling добавил генерацию по первому и последнему кадру". Даже и не помню, что там была за модель. Скорее всего, Kling1.6.
Повторил схожий нарратив, используя Kling2.1.
Качество выросло значительно, добавился звук и ушли многие проблемы, которые существовали чуть больше полугода назад.
p.s.: правда, звук получился нарезанным на 10-секундные отрезки. Потому что отдельный инструмент для озвучивания видео, который есть у Kling, нагло врёт. Утверждает, что может озвучить видео продолжительностью до 3 минут, но на деле не даёт обработать отрезки длиннее 20 секунд. Ну, либо я не справился с интерфейсом 🙃
1👍6❤3🔥1
Генерация видео в Google Veo3 всего за 8 рублей. Без сложных манипуляций с "Я студент! Честное слово!".
Более того – скорее всего, у вас уже всё для этого есть.
Оказывается, в Perplexity добавили генерацию видео. Под капотом – Veo3.
Как это работает:
1. Заходим на сайт Perplexity. Из приложения пока не работает.
2. Выбираем обыкновенный "Поиск" и модель "Лучший".
3. Вбиваем в строку поиска, что мы хотим сгенерировать (активируем генерацию через "сгенерируй видео"). Image-to-video также работает, поэтому можно подгрузить первый кадр.
4. Для генерации, конечно же, потребуется pro-аккаунт, который всё ещё можно взять тут в среднем за 500 рублей.
Лимиты достаточно жёсткие. На одном pro-аккаунте можно сгенерировать всего лишь 5 видео в месяц. То есть 60 видео в год. Получается, что при цене pro-подписки в 500 рублей за год, одна генерация видео стоит примерно 8 рублей и 35 копеек.
Получается, закупаем сотню аккаунтов по 188 рублей/штука и идём пилить Veo3-полнометражку? 🙂
UPD: в комментариях также подсказали, что для массовой генерации Veo3-видео, можно там же взять сразу аккаунт Google. Правда, из РФ он напрямую работать не будет.
Спасибо Андрею, который рассказал в чате Hegai о наличии Veo3-генераций в Perplexity.
Более того – скорее всего, у вас уже всё для этого есть.
Оказывается, в Perplexity добавили генерацию видео. Под капотом – Veo3.
Как это работает:
1. Заходим на сайт Perplexity. Из приложения пока не работает.
2. Выбираем обыкновенный "Поиск" и модель "Лучший".
3. Вбиваем в строку поиска, что мы хотим сгенерировать (активируем генерацию через "сгенерируй видео"). Image-to-video также работает, поэтому можно подгрузить первый кадр.
4. Для генерации, конечно же, потребуется pro-аккаунт, который всё ещё можно взять тут в среднем за 500 рублей.
Лимиты достаточно жёсткие. На одном pro-аккаунте можно сгенерировать всего лишь 5 видео в месяц. То есть 60 видео в год. Получается, что при цене pro-подписки в 500 рублей за год, одна генерация видео стоит примерно 8 рублей и 35 копеек.
Получается, закупаем сотню аккаунтов по 188 рублей/штука и идём пилить Veo3-полнометражку? 🙂
UPD: в комментариях также подсказали, что для массовой генерации Veo3-видео, можно там же взять сразу аккаунт Google. Правда, из РФ он напрямую работать не будет.
Спасибо Андрею, который рассказал в чате Hegai о наличии Veo3-генераций в Perplexity.
2🔥9👍6❤3
Какие плюсы есть от того, что карту слили кардерам и её пришлось заблокировать?
Для себя отметил следующие:
1. Ещё в одной сфере жизни появилась "душная" схема. Теперь из моих карточек в интернете есть только одна. На ней всегда стоит жёсткий лимит и физически не бывает много средств.
2. Список подписок на AI-сервисы очистился круче, чем каналы в Венеции во время коронавируса. Фактически, остались только те, отключение которых из-за не удавшейся оплаты тут же влияет на ежедневные сценарии использования AI.
В общем, даже неприятные события в жизни можно обратить в плюс.
А как вы отслеживаете свои AI-подписки?
Для себя отметил следующие:
1. Ещё в одной сфере жизни появилась "душная" схема. Теперь из моих карточек в интернете есть только одна. На ней всегда стоит жёсткий лимит и физически не бывает много средств.
2. Список подписок на AI-сервисы очистился круче, чем каналы в Венеции во время коронавируса. Фактически, остались только те, отключение которых из-за не удавшейся оплаты тут же влияет на ежедневные сценарии использования AI.
В общем, даже неприятные события в жизни можно обратить в плюс.
А как вы отслеживаете свои AI-подписки?
1🔥9❤6👍4
"Сделай рефакторинг кода моего проекта", как способ добить навайбкоженный проект.
Если проект делался "на вайбе" и с минимумом контроля, то в какой-то момент внесение новых функций обязательно начнёт буксовать.
Далее – истинный вайбкодер обязательно узнает слова "качество кода" и "рефакторинг" и попробует применить магию рефакторинга в деле.
Тот самый запрос из заголовка поста: "Сделай рефакторинг кода моего проекта". Далее – согласие со всеми изменениями и, как итог, проект с очень красивым переделанным кодом.
Жаль только не работает.
Потому что AI-агент не волшебник и мысли создателя читать не умеет. Без явного описания "а что тут, собственно, происходит?" он с радостью додумает себе бизнес-контекст вашей программы и исправит всё. Вот вообще всё. Даже то, что являлось частью бизнес-логики, но выглядело как-то "неправильно" с точки зрения агента.
На этом этапе проект пора закапывать. И это – лучшее решение.
Если не закопать, то можно просадить все лимиты, потратить все токены и нервы.
Вопрос "Как сделать так, чтобы работало?" мы обсудим совсем скоро на эфире. Вся информация о нём в этом посте.
Регистрируйтесь, если ещё не успели! 🔥
Если проект делался "на вайбе" и с минимумом контроля, то в какой-то момент внесение новых функций обязательно начнёт буксовать.
Далее – истинный вайбкодер обязательно узнает слова "качество кода" и "рефакторинг" и попробует применить магию рефакторинга в деле.
Тот самый запрос из заголовка поста: "Сделай рефакторинг кода моего проекта". Далее – согласие со всеми изменениями и, как итог, проект с очень красивым переделанным кодом.
Жаль только не работает.
Потому что AI-агент не волшебник и мысли создателя читать не умеет. Без явного описания "а что тут, собственно, происходит?" он с радостью додумает себе бизнес-контекст вашей программы и исправит всё. Вот вообще всё. Даже то, что являлось частью бизнес-логики, но выглядело как-то "неправильно" с точки зрения агента.
На этом этапе проект пора закапывать. И это – лучшее решение.
Если не закопать, то можно просадить все лимиты, потратить все токены и нервы.
Вопрос "Как сделать так, чтобы работало?" мы обсудим совсем скоро на эфире. Вся информация о нём в этом посте.
Регистрируйтесь, если ещё не успели! 🔥
2👍9🔥5❤2