Силиконовый Мешок
20.7K subscribers
734 photos
247 videos
20 files
715 links
Как заработать 💸 на Искусственном Интеллекте уже сегодня.


Написать админу @artem_subbotin

Чат канала: @prompt_chat
Download Telegram
Если вы используете API OpenAI, то можно получить от 1 до 10 млн бесплатных токенов в день.

Что нужно сделать? Продать душу разрешить анализировать ваши входящие и исходящие запросы. Заходите сюда и разрешаете OpenAI это делать - получаете бонус.
До 1 миллиона токенов в день для моделей gpt-5, gpt-5-chat-latest, gpt-4.1, gpt-4o, o1 и o3.

До 10 миллионов токенов в день для моделей gpt-5-mini, gpt-5-nano, gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini и codex-mini-latest.
1🔥315👍43👀3👏1
Силиконовый Мешок
Думаю, вы видели последнюю новость о том, что «пошаренные» чаты в ChatGPT были проиндексированы Google и теперь любой желающий может почитать ваше общение с агентом. Нужно просто вбить в поисковую строку site:chatgpt.com/share и указать в конце ключевое слово.…
Хаха, теперь и у Grok проиндексировалось около 400 000 диалогов с пользователями.

Все по классике, пишем в гугле:

site:grok.com/share [слово]


И находим любой диалог, где пользователь нажал «поделиться». Забавно, что когда эта ситуация произошла с OpenAI - Илон Маск сказал, что у Grok такой подставы быть не может.
🤣66🔥14😁841🤯1💯1
С понедельника посты в канале будут выходить не так часто, но это всего на неделю. Вы же помните, что я еду вожатым в лагерь для взрослых?

Буду свои мысли не буквами выдавать, а словами рассказывать — есть желание прямо какие-то интересные проекты с ребятами запустить в рамках недели лагеря.

Ну и с вами буду делиться происходящим (нечасто — вы такое не любите), а те, кто хочет поехать, — всё ещё могут это сделать. Не забывайте: чтобы получить суперскидку, всегда говорите: «я от силиконового мешка».
🔥30❤‍🔥754🤩3👍2👏2
Как научиться делать ИИ-агентов и не сойти с ума

Я подсчитал — в этом канале 150 постов про ИИ-агентов, это самая популярная тема последних лет тут.

Но все равно каждый день я получаю один и тот же вопрос, написанный в разных формулировках: «Как мне научиться создавать ИИ-агентов?».

Начнем с того, что я всё так же настаиваю начинать с курса от Hugging Face про ИИ-агентов. Считаю, что это база для новичка.

А теперь перейдем к этапам:

ФАЗА 0: ИГРУШКА
Хватит читать туториалы. Серьёзно. Возьмите один PDF-файл, своё резюме, статью из Википедии — что угодно — и создайте чат-бота, который сможет отвечать на вопросы по этому документу. Используйте LangChain или n8n. Не парьтесь насчёт UI. Не парьтесь, если он медленный. Ваша единственная цель — понять, как на самом деле связаны между собой промпт, контекстное окно и LLM. Вы должны прочувствовать ограничения базового RAG, прежде чем сможете оценить что-то другое.


ФАЗА 1: ИНСТРУМЕНТЫ
Теперь дайте своему боту один инструмент. Калькулятор, API погоды — что угодно. Именно здесь вы переходите от поискового бота к ии-агенту. Настоящая сложность не в том, чтобы вызвать API, а в работе с промптингом, чтобы заставить агента понимать, когда использовать инструмент, а когда просто сгенерировать ответ.


ФАЗА 2: ОРКЕСТРАТОР
Один агент не может всё делать одинаково хорошо. Поэтому создайте систему из специализированных агентов. Единственная задача агента-оркестратора — получить запрос и направить его нужному «специалисту»: агенту по биллингу, агенту поддержки и т. д. Здесь ваш простой скрипт превращается в настоящую систему, и вы вынуждены задуматься, как агенты общаются между собой.


ФАЗА 3: ПАМЯТЬ
Агент без памяти — это просто вызов функции. Он не может вести настоящий диалог. Теперь дайте своим агентам память. Начните с простой истории диалога, затем переходите к векторной базе для «долговременной памяти». Сложность не в том, чтобы сохранить память, а в том, чтобы извлечь только релевантные её части, не засирая контекстное окно.


ФАЗА 4: ОГРАНИЧИТЕЛИ
Именно на этом этапе большинство проектов проваливаются. Агент, который может всё, — это агент, который будет постоянно галлюцинировать и факапить. Теперь вы учитесь говорить «нет». Создайте жёсткие правила, валидацию вывода и контент-фильтры. Ваша задача научить агента говорить «я не знаю» вместо того, чтобы врать.


ФАЗА X: РЕАЛЬНЫЙ МИР
Всё, что было до этого — песочница. Настоящая работа начинается только сейчас. Вы его разворачиваете. Вы узнаете о задержках (latency), мониторинге и т.д. Вы создаёте циклы обратной связи, чтобы агент учился на своих ошибках. Вы сталкиваетесь с конфиденциальностью данных и доверием пользователей. Эта фаза никогда не заканчивается. Вы просто становитесь лучше в этом цикле.

Вот и всё. Вот и весь путь изучения ии-агентов. Просто повторяйте это каждый день и спина голова болеть не будет.
11105👍42🔥30😁54❤‍🔥32😍1🤝1💊1
Видимо, я самый последний делюсь впечатлением о новой Нанобанано, которая уже неделю доступна в гугловском AI Studio и на куче агрегаторов.

Знаете, мне понравилось — по моим ощущениям, эта контекстно-редактирующая модель лучше FLUX Context и GPT-шной.

На следующей неделе доберусь до компьютера и как следует её погоняю, а пока наслаждайтесь тем, как она восстановила самую первую в истории фотографию.
👍4323🤯13🔥84👎1
Ну что, дорогие постигаторы знаний, скоро в школу!

Задумался, что помимо учебников и новых портфелей вошло в наш с детьми ученический ИИ-сет. Пока мой список выглядит так:

Perplexity — идеальное решение для подготовки эссе, рефератов и погружения в новые темы. Ещё в прошлом году сделал детям отдельные аккаунты, воспользовавшись выгодным предложением за несколько баксов.

ChatGPT — конечно же, с режимом «Учеба и обучение». Это наша с детьми любимая функция, чтобы подучить какой-то материал или освоить новые знания. Максимальный рекомендасьон.

NotebookLM — тут сложно что-то новое написать: собираем кучу материалов в формате сайтов, PDF-ок и даже учебников, кидаем в недра «ноутбука» и вгрызаемся в гранит науки.

MathGPT — очень крутой инструмент для решения математических задач. Если честно, я и сам его использую для проверки домашних заданий у детей. Бесплатно.

Gemini — исключительно по причине гигантского контекстного окна и возможности создавать «Deep Research» объёмом с дипломную работу. А недавно, я для своего дошкольника начал там Storybook’и делать про дни недели на английском или времена года - вообще топ формат.

Gamma — в прошлом году почти все презентации для школы делали в ней. Для детей вполне хватает и бесплатной версии.

Это прямо наша база, но платформ для обучения и разных инструментов становится всё больше и больше. Иногда мне кажется, что уже и пользователей столько нет, сколько продуктов каждый день клепают. А вы что используете для себя или в помощь детям?
64🔥17👍10❤‍🔥3🙏1💯1🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну что! Я приехал. Включаюсь в работу, завтра будем разгребать, что там в мире ИИ произошло за неделю. Всех с Днём знаний!
🔥42🤣1575👏2❤‍🔥1😍1🦄1💊1😎1
Начнем сезон с обзора Nano Banana 🍌

По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый обзорчик».

26 августа 2025 года Google представила Gemini 2.5 Flash (внутреннее название Nano Banana) — свою новую модель для генерации и редактирования изображений. И это не очередной генератор картинок, а полноценная визуальная экосистема, способная понимать сложный контекст, поддерживать согласованность персонажей и объектов и, что самое главное, точно следовать инструкциям пользователя.

Я пользуюсь «Бананой» в Google AI Studio, там все просто и нативно. Переходите на aistudio.google.com и дальше:
1) Выбираете модель Gemini 2.5 Flash
2) Нажимаете на иконку изображения, чтобы прикрепить референсные картинки
3) Пишете промпты на любом языке, но английский модель понимает лучше
4) Можете поиграть с «температурой» (рекомендуется 0.4–0.8 для изображений).
5) Я поставил максимальное количество токенов на выходе для более детальной генерации.

Еще доступ к Gemini 2.5 Flash можно получить тут:
- Gemini API — для разработчиков (оплата за использование).
- Vertex AI — корпоративное решение с расширенными функциями.
- Gemini Native Image в чате Gemini — нажмите «Создать изображение».
- Adobe Firefly — полная интеграция (20 бесплатно в месяц, затем безлимитно с Creative Cloud).
- Adobe Express — удобный интерфейс для пользователей.
- Freepik — интеграция с инструментами ИИ для изображений.
- Poe by Quora — доступ к нескольким моделям, включая Gemini.

Цены и лимиты
При использовании через API/Studio/Vertex:
- $0.039 за изображение (в среднем 1290 токенов).
- Лимиты: 10 запросов в минуту (бесплатный тариф), 60 запросов в минуту (платный).
- Максимум на входе: 5 изображений одновременно.
- Разрешение на выходе: до 4K (4096×4096).

Через Adobe Firefly:
- 20 бесплатных изображений в месяц для всех пользователей.
- Безлимитно до 1 сентября для платных подписчиков Creative Cloud.
- После 1 сентября: пользователи Express получают безлимитный доступ.

Что мне больше всего понравилось в Nano Banana по сравнению с FLUX Kontext:
- Может объединить от 2 до 5 изображений в одну картинку.
- Очень хорошо удерживает «идентичность» персонажа при итерациях.
- Добавление и удаление объектов.
- Может изменять конкретные элементы через промпт.
- Есть знания о мире, и модель реально понимает культурные отсылки.
- Время генерации — 2–4 секунды.
- Отрисовка текста — действительно пишет слова правильно.
- Понимание 3D-пространства — поворачивает объекты, меняет перспективу.
- Понимает, какой свет должен быть в разное время суток.
- Реалистично изменяет текстуры.
- Создавать в нем скетчи — одно удовольствие.

Если интересно, могу следующим постом рассказать про бизнес-кейсы и «домашнее» использование Gemini 2.5 Flash. Просто дайте знать нашим тайным способом — 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19020👍10🤣33🍌2❤‍🔥1👏1🤗1😘1
Силиконовый Мешок
Начнем сезон с обзора Nano Banana 🍌 По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый…
Как задавать нужные позы в Nano Banana?

Я немного устал рисовать референсы карандашом на бумаге и нашел такой сайт: https://posemy.art/ - там можно изменять позы, крутить тело в любую сторону и все это в 3D. А еще бесплатно.

Дальше я кидаю два изображения в «Банану» с таким промптом:
Have the character in Figure 1 pose as shown in Figure 2, keeping their appearance, clothing, and style unchanged; adjust only the movements.

Еще можно использовать ИИ-апскейлеры, чтобы с исходных 900px дотащить до 4K.

Обратите внимание: если вы загружаете два референсных изображения, лучше всего, чтобы у них было одинаковое соотношение сторон. Если у изображений разные соотношения сторон, итоговое изображение будет с параметрами последнего.
549🔥30👏652
Искал готовые решения для создания коротких рекламных роликов в формате UGC на базе Nano Banana и Veo3 и перекопал кучу воркфлоу в n8n — пока это лучшее из того, что мне попадалось.

Процесс довольно простой: закидываешь в телеграм-бота референс (изображение товара), короткое пожелание к рекламе — и через пару минут у тебя готовый ролик. По стоимости выходит около 1–1,5 доллара за видео.

Здесь можно взять JSON-файл для n8n. Если что-то непонятно, я нашёл хороший туториал на YouTube.

Вот только композинг (сборку видео) я бы заменил на это API — мне больше понравилось, как оно собирает.
3🔥71158👏51
Если у вас есть активный PayPal - можно получить годовой Pro-аккаунт Perplexity бесплатно. А если нет, то действуем по старому сценарию.
2🔥3912👍8👏43😇2🦄2😘2
Сегодня обнаружил себя в трёх десятках рабочих телеграм-чатов. И в каждом кипит жизнь: люди что-то обсуждают, взаимодействуют и договариваются. А я просто хожу по этим чатам и собираю информацию: до чего договорились, когда решили созвониться, что вообще делаем дальше. И что-то я устал.

Уже открыл N8N, чтобы запилить автоматизацию процесса сбора саммари из рабочих чатов, но вовремя себя одёрнул. Может, уже давно существует решение моей проблемы? Поделитесь находками в нашем сообществе @prompt_chat
158🔥7💯3🙏2
Вчера же еще NotebookLM обновился, жду когда на мои аккаунты раскатают. Но мне понравилось, как переосмыслили генерацию подкастов. Будет доступно четыре вида аудиообзора (подкаста):
1. Краткий обзор (Brief): Обзор на 1-2 минуты, помогает быстро ознакомиться с основными идеями темы

2. Глубокое погружение (Deep Dive): Стандартный и более подробный обзор темы, обычно длительностью 10-15 минут. В этом режиме можно задавать вопросы прямо во время прослушивания подкаста

3. Дебаты (Debate): Два ИИ-агента обсуждают и спорят на заданную тему, представляя разные точки зрения. Длительность примерно такая же, как у "глубокого погружения"

4. Критика (Critique): ИИ анализирует и проверяет предоставленные документы, например, эссе или презентации, и даёт целевую обратную связь для их улучшения

Раньше я все это через промпт к подкасту пытался указывать и не всегда получалось, сейчас удобнее конечно.
1👏4818🔥17🙏1🤗1
Силиконовый Мешок
Искал готовые решения для создания коротких рекламных роликов в формате UGC на базе Nano Banana и Veo3 и перекопал кучу воркфлоу в n8n — пока это лучшее из того, что мне попадалось. Процесс довольно простой: закидываешь в телеграм-бота референс (изображение…
This media is not supported in your browser
VIEW IN TELEGRAM
Вот! Вот о чем я говорю! В этой безумной гонке врапперов (оберток вокруг API моделей) делать свой стартап - безумие. Ну только если у вас оригинальная и гениальная идея.

Буквально вчера я вам рассказывал про воркфлоу на N8N, чтобы генерировать UGC-видео при помощи Nano Banana и Veo3, а сегодня Higgsfield релизнул UGC Factory на базе этих же моделей.
💯2214🤣11👎1