ТАБУИИРОВАNNЫЙ
3.44K subscribers
110 photos
41 videos
40 files
157 links
Искусственный Интеллект | Artificial Neural Networks

📩 tabu.openai@gmail.com
Download Telegram
🎯 КАК ВАЙБКОДИТЬ С GPT-5

Короткий гайд по тому, как эффективно промптить GPT-5 в IDE и через API.

1️⃣ Будьте точны, без противоречий
Избегайте расплывчатых/конфликтующих инструкций, особенно в .cursor/rules и AGENTS.md.

2️⃣ Подбирайте усилие рассуждений
GPT-5 всегда рассуждает, но уровень можно задавать: для простого — low/medium, для реально сложного — high. Если «переобдумывает» мелочи, снижайте уровень и конкретизируйте задачу.

3️⃣ Структурируйте инструкции XML-синтаксисом
В паре с Cursor это помогает дать модельке чёткий контекст и дефолты стека.

<code_editing_rules>
<guiding_principles>
- Компоненты должны быть модульными и переиспользуемыми
- ...
</guiding_principles>
<frontend_stack_defaults>
- Styling: TailwindCSS
</frontend_stack_defaults>
</code_editing_rules>


4️⃣ Не перегибайте с «жёсткими» формулировками
Фразы вроде «БУДЬ ПРЕДЕЛЬНО ТЩАТЕЛЕН, ПОЛНОСТЬЮ СОБЕРИ КОНТЕКСТ» могут привести к излишней болтовне инструментов и замедлению. GPT-5 и так старательный, не заставляйте его «перестараться».

5️⃣Дайте место планированию и саморефлексии
Для задач «с нуля» полезно просить модель сначала подумать о критериях качества, а потом строить решение.

<self_reflection>
- Сначала продумай рубрику (5–7 категорий качества)
- Не показывай рубрику пользователю
- Применяй рубрику, пока ответ не дотягивает — улучшай
</self_reflection>


6️⃣Контролируйте «порывистость» код-агента
Задайте бюджет инструментов, когда параллелить вызовы, а когда нет, и как действовать при пробелах в требованиях.

<persistence>
- Не проси подтверждений по мелочам
- Делаешь разумные допущения, выполняешь задачу
- В конце явно перечисляешь, какие допущения сделал
</persistence>


Полезный ссылки:
Как получить бесплатные токены в OpenAI API
Оптимизатор промптов для GPT-5 от OpenAI
Серия гайдов по GPT-5 от OpenAI
3🤔3❤‍🔥2
Промпт, который изменил мою жизнь (часть 3)

Продолжаю делиться любимыми промптами, которые реально помогают в жизни.

Бывало ли у вас такое: увидели картинку с классным стилем и захотели использовать его для своих идей?

Вот простой способ быстро «снять» стиль и использовать его для генерации:

— Отправляете картинку в чат вместе с промптом.
— Нейросеть разбирает её и описывает стиль: палитру, свет, композицию, атмосферу.
— На основе этого формируется мастер-промпт.
— Дальше можно добавить туда текстовое описание своей идеи.
— Отправляем полученный промпт в СhatGPT, Midjourney, Flux и т.д.
— Генерация сразу повторяет фирменный вайб, в том стиле, который вы «сняли».

Полный промпт в комментариях.

🔗 Промпт, который изменил мою жизнь (часть 2)
13
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Решил делиться интересными датасетами, которые доступны в открытом доступе. Думаю, это может быть полезно тем, кто работает с данными или просто интересуется темой. Если формат зайдёт, продолжу делать такие посты.

🌍 Open Buildings Dataset

Проект Google’s Open Buildings — это крупнейший открытый датасет контуров зданий, созданный на основе спутниковых снимков. В нём более 1,8 млрд объектов по всей Африке, Южной и Юго-Восточной Азии, Латинской Америке и Карибскому региону.

📊 Данные применяются для:
— оценки численности населения и планирования вакцинации;
— гуманитарного реагирования при катастрофах;
— исследований в экологии и климате;
— планирования инфраструктуры и электрификации;
— цифровых адресных систем (Plus Codes).

Датасет доступен бесплатно под лицензиями CC BY-4.0 и ODbL v1.0.

🔗 Скачать данные: Open Buildings
👍62
This media is not supported in your browser
VIEW IN TELEGRAM
Вы доверили бы AI построить сайт или даже целый сервис с нуля?

Trickle — это не просто конструктор, а AI-платформа, которая берёт проект под ключ.
Из одной идеи вы получаете рабочий сайт, лендинг, форму или даже приложение.

Что делает Trickle особенным:
— Magic Canvas — создаёте и редактируете как в Figma: перетянули блок, поменяли стиль, увидели результат.
— AI сам понимает контекст, генерирует дизайн и логику, подстраивается под ваши правки.
— Можно собирать сразу многостраничные макеты, подключать домен и даже управлять базой данных.
— Встроенные интеграции с Supabase, Three.js и другими.

🔗 trickle.so
10
Какая бешеная неделя в AI 🤯

ИИ-дайджест №8 (16.08.2025 — 23.08.2025):

1️⃣ GPT-6: Сэм Альтман раскрыл главную фишку новой модели — «память». GPT-6 будет запоминать ваши предпочтения, привычки и стиль общения, чтобы стать по-настоящему персональным ассистентом.

2️⃣ Higgsfield Product-to-Video: AI-инструмент, который превращает одно фото продукта в полноценный рекламный ролик. Он сам генерирует окружение и даже добавляет актеров, взаимодействующих с товаром.

3️⃣ Qwen Image Edit: Open-source «убийца Photoshop» от Alibaba. Редактирует любую часть изображения по текстовой команде, сохраняя идеальное качество остальной картинки.

4️⃣ Tencent Yan: Китайский ответ на Google Genie 3. Нейросеть генерирует игровые сцены из текста или картинки в 1080p/60fps и позволяет редактировать их в реальном времени.

5️⃣ Desktop-агент от ByteDance: Полностью автономный AI-агент, который работает локально на вашем компьютере. Он «видит» экран и может управлять любыми приложениями, от Excel до браузера, выполняя ваши команды. Все данные остаются у вас.

6️⃣ Alibaba Qoder: Новый «агентский» AI-редактор кода, конкурирующий с Cursor. Он не просто пишет код, а понимает весь проект целиком, создаёт документацию и помогает с развёртыванием.

7️⃣ RAG-Anything: Open-source система, которая выводит RAG на новый уровень. Она «понимает» не только текст в документах, но и таблицы, формулы и изображения, создавая единую мультимодальную базу знаний.

8️⃣ Claude Code «Режим обучения»: Anthropic прокачала свой AI-кодер. Теперь он не просто пишет код, а работает как ментор: создаёт структуру, объясняет логику, но самые важные части оставляет вам для заполнения.

🔗 Дайджест за прошлую неделю
🔥6👍42
Ты тоже сохраняешь кучу статей, видео и заметок, а потом не можешь ничего найти?

getrecall.ai превращает хаос в организованную базу знаний

Основные возможности:
1️⃣ Автоматические резюме для подкастов, YouTube, новостей и PDF.
2️⃣ Умная автокатегоризация: теги по содержанию.
3️⃣ Граф знаний: все материалы связываются между собой для быстрого поиска.
4️⃣ Поддержка метода интервального повторения для лёгкого запоминания.
5️⃣ Данные хранятся локально: доступ даже офлайн.
6️⃣ Экспорт заметок в Markdown для интеграции с другими инструментами.
7️⃣ Резервное копирование в Google Cloud (ЕС).
7
Media is too big
VIEW IN TELEGRAM
В NotebookLM теперь доступны видеообзоры на русском!
Произношение пока не идеально, есть шероховатости, но впечатляет.
Слушается как живая лекция.
Можете оценить вдохновляющий разбор об ИИ-агентах от NotebookLM.
🔥63
Вышла новая модель для редактирования изображений — Nano Banana, которая оказалась Gemini 2.5 Flash Preview Image Generation от Google.

Уже попробовал и вот что заметил:
Послушность. Намного лучше, чем у flux-kontext: если там команда может проигнорироваться, то здесь всё работает чётко, нужно что-то изменить или удалить на картинке, выполняется без проблем.
Промптинг. По стилю ближе к flux-kontext, чем к gpt-image-1: нужны короткие и максимально понятные запросы. Длинные промпты/описания, которые можно подать в gpt-image-1, не так заходят.
Качество. Генерация заметно чётче, без той замыленности, которая есть у gpt-image-1.
Скорость. В среднем 15–30 секунд на генерацию. Для сравнения: flux-kontext справляется примерно за 10 секунд, а gpt-image-1 — около минуты.
Цена. По API примерно как у flux-kontext-pro — около $0.04 за генерацию. У gpt-image-1 стоимость может доходить до $0.24.

Похоже, это топ для редактирования изображений.

Попробовать можно уже сейчас бесплатно в Google AI Studio.
Гарвардский профессор выложил в открытый доступ свой учебник по ML-системам. 2048 страниц, бесплатно.

Это комплексное руководство, которое охватывает весь путь от теории до практики.

Ключевые темы:
— Фундамент: от истории ИИ и основ Deep Learning до современных DNN-архитектур и фреймворков.
— Системы и продакшн: инженерия данных, MLOps, оптимизация моделей, развертывание и безопасность.
— Практика и будущее: есть лабораторные работы на Raspberry Pi/Arduino.
— А также разделы об этике в ИИ и новейших моделях (SLM, VLM).

Это отличный ресурс для инженеров, чтобы систематизировать и углубить свои знания. Настоящий подарок для ML-сообщества.
9
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня я покажу вам убойную связку, которая взорвёт ваше воображение:
«Google Maps x Nano Banana x Tripo3D»

С помощью этого метода вы сможете превратить любое здание мира в очаровательную изометрическую 3D-модель. Звучит сложно? На самом деле всё элементарно!

Пошаговая инструкция:

1️⃣ Откройте Google Maps. Найдите любое известное здание (Эйфелеву башню, Колизей, да хоть ваш собственный дом!) и сделайте скриншот.

2️⃣ Загрузите скриншот в Nano Banana (Gemini 2.5 Flash Preview Image Generation). Используйте этот простой промпт:
Make the building isometric with color and clean the background.

AI превратит ваш скриншот в стильную изометрическую картинку с чистым фоном.

3️⃣ Перейдите в Tripo3D. Загрузите полученное изображение, и сервис автоматически сгенерирует для вас настоящую 3D-модель!

Что с этим можно делать?
— Создавать крутую 3D-анимацию для своих проектов.
— Распечатать модель на 3D-принтере и поставить на полку.
— Превратить это в уникальную бизнес-идею и новый источник дохода!
👍9🔥4
Какая бешеная неделя в AI 🤯

ИИ-дайджест №9 (23.08.2025 — 30.08.2025):

1️⃣ OpenAI Realtime API: OpenAI выпустила Realtime API и новую модель gpt-realtime, значительно улучшив возможности голосовых AI-агентов. Теперь они могут вести более естественные диалоги, понимать нюансы и даже менять голос в зависимости от ситуации. Стоимость снижена на 20%!

2️⃣ Google Nano Banana (Gemini 2.5 Flash Image): Google официально запустил Nano Banana, который многие называют "самой мощной моделью для редактирования изображений в мире". Он поддерживает "многокартиночное слияние", сохранение согласованности персонажей и редактирование на естественном языке.

3️⃣ Higgsfield WAN 2.2: Higgsfield выпустил более 30 "взрывных" пресетов для своей модели WAN 2.2, позволяя создавать вирусные видеоролики с полным контролем. Также представлен WAN 2.2-S2V, модель для создания кинематографических видео на основе аудио.

4️⃣ Kling 2.1: Kling 2.1 представил функцию Start/End Frame, которая позволяет контролировать переходы между сценами, делая их невероятно плавными и естественными.

5️⃣ Grok Code Fast 1: xAI выпустила новую модель Grok Code Fast 1, специально разработанную для программирования. Она отличается высокой скоростью (до 92 токенов в секунду) и конкурентоспособной ценой.

6️⃣ Google Vids: Google представил новый бесплатный инструмент для редактирования видео Google Vids, который использует Gemini AI, Veo3 и Imagen для создания привлекательных видеороликов без опыта дизайна.

7️⃣ NotebookLM Video Overviews: NotebookLM теперь полностью поддерживает видеообзоры на 80 языках, включая русский, а также предлагает контроль длины для аудиообзоров на других языках.

8️⃣ Google Translate AI-powered translations: Google внедряет AI-переводы в мобильные приложения Google Translate, а также бета-функцию для практики новых языков.

9️⃣ Claude for Chrome: Anthropic выпустила "Claude for Chrome", расширение, которое позволяет Claude выполнять действия в браузере от имени пользователя.

🔗 Дайджест за прошлую неделю
👍54🔥2
Промпт, который изменил мою жизнь (часть 4)

Я нашел новый способ, как быстрее разобраться в новой для себя теме.
Это промпт, который превращает ChatGPT в твоего личного тренера для мозга по методу Фейнмана.

Как это работает:
— Ты даёшь ему любую тему (от экономики до кода).
— Он пытается объяснить ее, как для 12-летнего. Без заумных слов, на простых примерах из жизни.
— Далее он задаёт вопросы, чтобы ты сам нашёл, что не понял и просит объяснить тему своими словами.
— И так через несколько таких итераций вы не просто запоминаете, а начинаете понимать концепцию.

Полный промпт, как всегда, в комментариях.

🔗 Промпт, который изменил мою жизнь (часть 3)
🔥134
Понимание LLM с нуля, без высшей математики

Если вы знаете, как складывать и умножать, вы поймёте:
— что такое эмбеддинги и токенизаторы;
— как работает self-attention и multi-head;
— почему softmax в конце почти везде;
— из чего собран GPT (блок за блоком);
— как собрать простой трансформер самому.

Это не “игрушечное” объяснение, по нему реально можно воспроизвести модель.
👉 Читать статью на сайте Medium

Мои подборки по теме изучения LLM:
Список полезных youtube каналов для изучения ИИ
5 визуализаций для понимания языковых моделей (LLM)
2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code теперь можно прокачать за пару минут.

Нашел ресурс, на котором собраны больше 400 бесплатных шаблонов: агенты, команды, MCP и готовые конфиги.

Все ставится одной командой.
Есть помощники для кода, документов, API, промпт-инжиниринга и много другого.

Отличный способ быстро стартовать без лишних настроек.

👉 aitmpl.com
7
Продолжаем выжимать максимум из Gemini 2.5 Flash Image (aka Nano Banana).

Вот вам 9 pro-техник для полного контроля над генерацией картинок:

1️⃣ «Семантические» негативные промпты
Не используйте прямые запреты вроде "no cars”, они создают артефакты. Вместо этого описывайте сцену позитивно: говорите, что на ней должно быть.
An empty, deserted street with no signs of traffic.



2️⃣ Пошаговая генерация
Для сложных сцен разбивайте промпт на последовательные шаги. Это кардинально улучшает логику и детализацию результата.
First, create a misty forest background. Then, add a mossy stone altar in the foreground. Finally, place a glowing sword on the altar.



3️⃣ Сохранение деталей
Чтобы Gemini не испортил лицо или логотип при редактировании, в промпте чётко опишите, что должно остаться неизменным.
Using the provided image, add this logo to her t-shirt. Ensure her facial features and expression remain completely unchanged.



4️⃣ Говорите как фотограф
Для фотореализма используйте профессиональную лексику. Это прямой путь к управлению ракурсом, светом и композицией.
low-angle perspective, macro shot, three-point softbox setup, captured with a 85mm f/1.4 lens.


5️⃣ Прозрачный фон
Нужен объект для коллажа или стикер? Прямо в промпте запрашивайте прозрачный фон.
A kawaii-style sticker of a red panda. The background must be transparent.


6️⃣ Контекст и цель
Объясняйте, зачем вам изображение. Контекст напрямую влияет на стиль и детали.
Create a logo for a premium, minimalist skincare brand.



7️⃣ Комиксы и раскадровки
Создавайте панели с читаемым текстом для визуальных историй.
A single comic book panel, noir style. A detective holds a glowing artifact. Caption box text: "It was heavier than it looked."



8️⃣ Интерливинг: текст + картинки
Получайте смешанный контент: запрашивайте иллюстрированные инструкции или рецепты, где текст и картинки идут вместе.
Generate an illustrated recipe for paella.


9️⃣ Gemini vs. Imagen
Это разные инструменты.
Gemini: для диалогового редактирования, композиции и гибкости.
Imagen: для максимального фотореализма, чёткости и типографики.


Все техники взяты из официальной доки.
7