ТАБУИИРОВАNNЫЙ
3.44K subscribers
110 photos
41 videos
40 files
157 links
Искусственный Интеллект | Artificial Neural Networks

📩 tabu.openai@gmail.com
Download Telegram
Какая бешеная неделя в AI 🤯

ИИ-дайджест №8 (16.08.2025 — 23.08.2025):

1️⃣ GPT-6: Сэм Альтман раскрыл главную фишку новой модели — «память». GPT-6 будет запоминать ваши предпочтения, привычки и стиль общения, чтобы стать по-настоящему персональным ассистентом.

2️⃣ Higgsfield Product-to-Video: AI-инструмент, который превращает одно фото продукта в полноценный рекламный ролик. Он сам генерирует окружение и даже добавляет актеров, взаимодействующих с товаром.

3️⃣ Qwen Image Edit: Open-source «убийца Photoshop» от Alibaba. Редактирует любую часть изображения по текстовой команде, сохраняя идеальное качество остальной картинки.

4️⃣ Tencent Yan: Китайский ответ на Google Genie 3. Нейросеть генерирует игровые сцены из текста или картинки в 1080p/60fps и позволяет редактировать их в реальном времени.

5️⃣ Desktop-агент от ByteDance: Полностью автономный AI-агент, который работает локально на вашем компьютере. Он «видит» экран и может управлять любыми приложениями, от Excel до браузера, выполняя ваши команды. Все данные остаются у вас.

6️⃣ Alibaba Qoder: Новый «агентский» AI-редактор кода, конкурирующий с Cursor. Он не просто пишет код, а понимает весь проект целиком, создаёт документацию и помогает с развёртыванием.

7️⃣ RAG-Anything: Open-source система, которая выводит RAG на новый уровень. Она «понимает» не только текст в документах, но и таблицы, формулы и изображения, создавая единую мультимодальную базу знаний.

8️⃣ Claude Code «Режим обучения»: Anthropic прокачала свой AI-кодер. Теперь он не просто пишет код, а работает как ментор: создаёт структуру, объясняет логику, но самые важные части оставляет вам для заполнения.

🔗 Дайджест за прошлую неделю
🔥6👍42
Ты тоже сохраняешь кучу статей, видео и заметок, а потом не можешь ничего найти?

getrecall.ai превращает хаос в организованную базу знаний

Основные возможности:
1️⃣ Автоматические резюме для подкастов, YouTube, новостей и PDF.
2️⃣ Умная автокатегоризация: теги по содержанию.
3️⃣ Граф знаний: все материалы связываются между собой для быстрого поиска.
4️⃣ Поддержка метода интервального повторения для лёгкого запоминания.
5️⃣ Данные хранятся локально: доступ даже офлайн.
6️⃣ Экспорт заметок в Markdown для интеграции с другими инструментами.
7️⃣ Резервное копирование в Google Cloud (ЕС).
7
Media is too big
VIEW IN TELEGRAM
В NotebookLM теперь доступны видеообзоры на русском!
Произношение пока не идеально, есть шероховатости, но впечатляет.
Слушается как живая лекция.
Можете оценить вдохновляющий разбор об ИИ-агентах от NotebookLM.
🔥63
Вышла новая модель для редактирования изображений — Nano Banana, которая оказалась Gemini 2.5 Flash Preview Image Generation от Google.

Уже попробовал и вот что заметил:
Послушность. Намного лучше, чем у flux-kontext: если там команда может проигнорироваться, то здесь всё работает чётко, нужно что-то изменить или удалить на картинке, выполняется без проблем.
Промптинг. По стилю ближе к flux-kontext, чем к gpt-image-1: нужны короткие и максимально понятные запросы. Длинные промпты/описания, которые можно подать в gpt-image-1, не так заходят.
Качество. Генерация заметно чётче, без той замыленности, которая есть у gpt-image-1.
Скорость. В среднем 15–30 секунд на генерацию. Для сравнения: flux-kontext справляется примерно за 10 секунд, а gpt-image-1 — около минуты.
Цена. По API примерно как у flux-kontext-pro — около $0.04 за генерацию. У gpt-image-1 стоимость может доходить до $0.24.

Похоже, это топ для редактирования изображений.

Попробовать можно уже сейчас бесплатно в Google AI Studio.
Гарвардский профессор выложил в открытый доступ свой учебник по ML-системам. 2048 страниц, бесплатно.

Это комплексное руководство, которое охватывает весь путь от теории до практики.

Ключевые темы:
— Фундамент: от истории ИИ и основ Deep Learning до современных DNN-архитектур и фреймворков.
— Системы и продакшн: инженерия данных, MLOps, оптимизация моделей, развертывание и безопасность.
— Практика и будущее: есть лабораторные работы на Raspberry Pi/Arduino.
— А также разделы об этике в ИИ и новейших моделях (SLM, VLM).

Это отличный ресурс для инженеров, чтобы систематизировать и углубить свои знания. Настоящий подарок для ML-сообщества.
9
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня я покажу вам убойную связку, которая взорвёт ваше воображение:
«Google Maps x Nano Banana x Tripo3D»

С помощью этого метода вы сможете превратить любое здание мира в очаровательную изометрическую 3D-модель. Звучит сложно? На самом деле всё элементарно!

Пошаговая инструкция:

1️⃣ Откройте Google Maps. Найдите любое известное здание (Эйфелеву башню, Колизей, да хоть ваш собственный дом!) и сделайте скриншот.

2️⃣ Загрузите скриншот в Nano Banana (Gemini 2.5 Flash Preview Image Generation). Используйте этот простой промпт:
Make the building isometric with color and clean the background.

AI превратит ваш скриншот в стильную изометрическую картинку с чистым фоном.

3️⃣ Перейдите в Tripo3D. Загрузите полученное изображение, и сервис автоматически сгенерирует для вас настоящую 3D-модель!

Что с этим можно делать?
— Создавать крутую 3D-анимацию для своих проектов.
— Распечатать модель на 3D-принтере и поставить на полку.
— Превратить это в уникальную бизнес-идею и новый источник дохода!
👍9🔥4
Какая бешеная неделя в AI 🤯

ИИ-дайджест №9 (23.08.2025 — 30.08.2025):

1️⃣ OpenAI Realtime API: OpenAI выпустила Realtime API и новую модель gpt-realtime, значительно улучшив возможности голосовых AI-агентов. Теперь они могут вести более естественные диалоги, понимать нюансы и даже менять голос в зависимости от ситуации. Стоимость снижена на 20%!

2️⃣ Google Nano Banana (Gemini 2.5 Flash Image): Google официально запустил Nano Banana, который многие называют "самой мощной моделью для редактирования изображений в мире". Он поддерживает "многокартиночное слияние", сохранение согласованности персонажей и редактирование на естественном языке.

3️⃣ Higgsfield WAN 2.2: Higgsfield выпустил более 30 "взрывных" пресетов для своей модели WAN 2.2, позволяя создавать вирусные видеоролики с полным контролем. Также представлен WAN 2.2-S2V, модель для создания кинематографических видео на основе аудио.

4️⃣ Kling 2.1: Kling 2.1 представил функцию Start/End Frame, которая позволяет контролировать переходы между сценами, делая их невероятно плавными и естественными.

5️⃣ Grok Code Fast 1: xAI выпустила новую модель Grok Code Fast 1, специально разработанную для программирования. Она отличается высокой скоростью (до 92 токенов в секунду) и конкурентоспособной ценой.

6️⃣ Google Vids: Google представил новый бесплатный инструмент для редактирования видео Google Vids, который использует Gemini AI, Veo3 и Imagen для создания привлекательных видеороликов без опыта дизайна.

7️⃣ NotebookLM Video Overviews: NotebookLM теперь полностью поддерживает видеообзоры на 80 языках, включая русский, а также предлагает контроль длины для аудиообзоров на других языках.

8️⃣ Google Translate AI-powered translations: Google внедряет AI-переводы в мобильные приложения Google Translate, а также бета-функцию для практики новых языков.

9️⃣ Claude for Chrome: Anthropic выпустила "Claude for Chrome", расширение, которое позволяет Claude выполнять действия в браузере от имени пользователя.

🔗 Дайджест за прошлую неделю
👍54🔥2
Промпт, который изменил мою жизнь (часть 4)

Я нашел новый способ, как быстрее разобраться в новой для себя теме.
Это промпт, который превращает ChatGPT в твоего личного тренера для мозга по методу Фейнмана.

Как это работает:
— Ты даёшь ему любую тему (от экономики до кода).
— Он пытается объяснить ее, как для 12-летнего. Без заумных слов, на простых примерах из жизни.
— Далее он задаёт вопросы, чтобы ты сам нашёл, что не понял и просит объяснить тему своими словами.
— И так через несколько таких итераций вы не просто запоминаете, а начинаете понимать концепцию.

Полный промпт, как всегда, в комментариях.

🔗 Промпт, который изменил мою жизнь (часть 3)
🔥134
Понимание LLM с нуля, без высшей математики

Если вы знаете, как складывать и умножать, вы поймёте:
— что такое эмбеддинги и токенизаторы;
— как работает self-attention и multi-head;
— почему softmax в конце почти везде;
— из чего собран GPT (блок за блоком);
— как собрать простой трансформер самому.

Это не “игрушечное” объяснение, по нему реально можно воспроизвести модель.
👉 Читать статью на сайте Medium

Мои подборки по теме изучения LLM:
Список полезных youtube каналов для изучения ИИ
5 визуализаций для понимания языковых моделей (LLM)
2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code теперь можно прокачать за пару минут.

Нашел ресурс, на котором собраны больше 400 бесплатных шаблонов: агенты, команды, MCP и готовые конфиги.

Все ставится одной командой.
Есть помощники для кода, документов, API, промпт-инжиниринга и много другого.

Отличный способ быстро стартовать без лишних настроек.

👉 aitmpl.com
7
Продолжаем выжимать максимум из Gemini 2.5 Flash Image (aka Nano Banana).

Вот вам 9 pro-техник для полного контроля над генерацией картинок:

1️⃣ «Семантические» негативные промпты
Не используйте прямые запреты вроде "no cars”, они создают артефакты. Вместо этого описывайте сцену позитивно: говорите, что на ней должно быть.
An empty, deserted street with no signs of traffic.



2️⃣ Пошаговая генерация
Для сложных сцен разбивайте промпт на последовательные шаги. Это кардинально улучшает логику и детализацию результата.
First, create a misty forest background. Then, add a mossy stone altar in the foreground. Finally, place a glowing sword on the altar.



3️⃣ Сохранение деталей
Чтобы Gemini не испортил лицо или логотип при редактировании, в промпте чётко опишите, что должно остаться неизменным.
Using the provided image, add this logo to her t-shirt. Ensure her facial features and expression remain completely unchanged.



4️⃣ Говорите как фотограф
Для фотореализма используйте профессиональную лексику. Это прямой путь к управлению ракурсом, светом и композицией.
low-angle perspective, macro shot, three-point softbox setup, captured with a 85mm f/1.4 lens.


5️⃣ Прозрачный фон
Нужен объект для коллажа или стикер? Прямо в промпте запрашивайте прозрачный фон.
A kawaii-style sticker of a red panda. The background must be transparent.


6️⃣ Контекст и цель
Объясняйте, зачем вам изображение. Контекст напрямую влияет на стиль и детали.
Create a logo for a premium, minimalist skincare brand.



7️⃣ Комиксы и раскадровки
Создавайте панели с читаемым текстом для визуальных историй.
A single comic book panel, noir style. A detective holds a glowing artifact. Caption box text: "It was heavier than it looked."



8️⃣ Интерливинг: текст + картинки
Получайте смешанный контент: запрашивайте иллюстрированные инструкции или рецепты, где текст и картинки идут вместе.
Generate an illustrated recipe for paella.


9️⃣ Gemini vs. Imagen
Это разные инструменты.
Gemini: для диалогового редактирования, композиции и гибкости.
Imagen: для максимального фотореализма, чёткости и типографики.


Все техники взяты из официальной доки.
7
Подборка из 12 топовых ИИ-сервисов для учебы и исследований:
1. Perplexity — исследования отрасли и анализ зарубежных компаний
2. Liner — поиск научных материалов
3. Lilys — анализ YouTube-видео
4. Tiro — автоматическое резюме встреч и лекций в реальном времени
5. NotebookLM — упорядочивание и понимание учебных материалов
6. ChatGPT (режим агента), Gemini Deep Research — глубокая исследовательская работа
7. Genspark — создание презентаций
8. Perplexity Comet — автоматизация рутины
9. Canva — генерация дизайна
10. Notion — запись и структурирование информации
11. Google Nano Banana — редактирование изображений
12. alphaXiv — легкий доступ к зарубежным статьям и исследованиям
🔥32
Какая бешеная неделя в AI 🤯

ИИ-дайджест №10 (30.08.2025 — 06.09.2025)

1️⃣ Perplexity Comet + халявный Pro: Perplexity выкатили свой AI-браузер Comet и устроили аттракцион невиданной щедрости — раздают год Pro-версии бесплатно через PayPal. Студентам тоже насыпали бонусов.

2️⃣ Google Nano Banana: Новый король в мире AI-изображений. Это не просто генератор, а мощнейший редактор, который меняет объекты, освещение и стиль прямо на фото по текстовой команде. В сети уже вирусятся слухи о плагине для Photoshop.

3️⃣ Ветвление диалогов в ChatGPT: Наконец-то! OpenAI добавили функцию, которую просили все: теперь можно создавать «ветки» в диалоге, чтобы исследовать разные идеи, не ломая основной контекст. Больше никакого «копировать-вставить в новый чат».

4️⃣ AI-подкасты в Google NotebookLM: Инструмент для заметок от Google получил мощное обновление аудио-сводок. Теперь AI может не просто зачитать саммари, а устроить «Дебаты» или «Критику» по вашим документам с разными голосами. Почти персональный подкаст по любой теме.

5️⃣ Anthropic объявила Китай «враждебной страной»: Жёсткий ход от создателей Claude. Компания запретила использовать свои продукты компаниям, где более 50% акций принадлежит Китаю, вне зависимости от их местоположения. Геополитика врывается в AI.

6️⃣ Atlassian покупает Arc Browser: Создателей популярного браузера Arc (The Browser Company) поглотила Atlassian за $610 миллионов. Ждём Jira в каждой вкладке?

7️⃣ Шпионский скандал: xAI судится с OpenAI: xAI подала в суд на своего бывшего инженера, обвинив его в краже коммерческих тайн (связанных с Grok) и переходе с ними на работу в OpenAI. Настоящая драма в Кремниевой долине.

8️⃣ Bytebot — ваш личный AI-стажёр: Появился мощный open-source AI-агент, который работает на вашем ПК в собственной виртуальной среде. Ему можно поручить сложные задачи: он сам откроет браузер, заполнит формы, скачает файлы и будет работать с приложениями, как настоящий человек. И все это локально и под вашим контролем.

🔗 Дайджест за прошлую неделю
🔥32🤣2
Готовый шаблон для вашего GenAI-проекта

Наткнулся на отличный production-ready шаблон для создания масштабируемых и поддерживаемых приложений на базе LLM.

Структура проекта:

config/ — Конфиги вынесены из кода (модели, шаблоны промптов, логирование).
src/ — Исходный код с четкой модульной структурой (клиенты для LLM, промпт-инжиниринг, утилиты, обработчики ошибок).
data/ — Организованное хранилище для данных (промпты, кеш, выводы, эмбеддинги).
notebooks/ — Jupyter-ноутбуки для быстрого тестирования гипотез и анализа результатов.
Dockerfile — Всё готово к контейнеризации.

Ключевые практики, заложенные в шаблон:

Версионирование промптов и результатов.
Кеширование ответов для экономии денег и снижения задержек.
Обработка ошибок через кастомные исключения.
Готовые утилиты для подсчета токенов и ограничения запросов (rate limiting).
Мониторинг использования API.


🔗 Ссылка на GitHub: https://github.com/HeyNina101/generative_ai_project
3🔥3🤣3