ТАБУИИРОВАNNЫЙ

Какая бешеная неделя в AI 🤯

ИИ-дайджест №8 (16.08.2025 — 23.08.2025):

1️⃣ GPT-6: Сэм Альтман раскрыл главную фишку новой модели — «память». GPT-6 будет запоминать ваши предпочтения, привычки и стиль общения, чтобы стать по-настоящему персональным ассистентом.

2️⃣ Higgsfield Product-to-Video: AI-инструмент, который превращает одно фото продукта в полноценный рекламный ролик. Он сам генерирует окружение и даже добавляет актеров, взаимодействующих с товаром.

3️⃣ Qwen Image Edit: Open-source «убийца Photoshop» от Alibaba. Редактирует любую часть изображения по текстовой команде, сохраняя идеальное качество остальной картинки.

4️⃣ Tencent Yan: Китайский ответ на Google Genie 3. Нейросеть генерирует игровые сцены из текста или картинки в 1080p/60fps и позволяет редактировать их в реальном времени.

5️⃣ Desktop-агент от ByteDance: Полностью автономный AI-агент, который работает локально на вашем компьютере. Он «видит» экран и может управлять любыми приложениями, от Excel до браузера, выполняя ваши команды. Все данные остаются у вас.

6️⃣ Alibaba Qoder: Новый «агентский» AI-редактор кода, конкурирующий с Cursor. Он не просто пишет код, а понимает весь проект целиком, создаёт документацию и помогает с развёртыванием.

7️⃣ RAG-Anything: Open-source система, которая выводит RAG на новый уровень. Она «понимает» не только текст в документах, но и таблицы, формулы и изображения, создавая единую мультимодальную базу знаний.

8️⃣ Claude Code «Режим обучения»: Anthropic прокачала свой AI-кодер. Теперь он не просто пишет код, а работает как ментор: создаёт структуру, объясняет логику, но самые важные части оставляет вам для заполнения.

🔗 Дайджест за прошлую неделю

🔥6👍4❤2

1.04K viewsedited 04:22

ТАБУИИРОВАNNЫЙ

Ты тоже сохраняешь кучу статей, видео и заметок, а потом не можешь ничего найти?

getrecall.ai превращает хаос в организованную базу знаний

Основные возможности:
1️⃣ Автоматические резюме для подкастов, YouTube, новостей и PDF.
2️⃣ Умная автокатегоризация: теги по содержанию.
3️⃣ Граф знаний: все материалы связываются между собой для быстрого поиска.
4️⃣ Поддержка метода интервального повторения для лёгкого запоминания.
5️⃣ Данные хранятся локально: доступ даже офлайн.
6️⃣ Экспорт заметок в Markdown для интеграции с другими инструментами.
7️⃣ Резервное копирование в Google Cloud (ЕС).

❤7

1.25K viewsedited 07:41

В NotebookLM теперь доступны видеообзоры на русском!
Произношение пока не идеально, есть шероховатости, но впечатляет.
Слушается как живая лекция.
Можете оценить вдохновляющий разбор об ИИ-агентах от NotebookLM.

🔥6❤3

989 views13:59

ТАБУИИРОВАNNЫЙ

Вышла новая модель для редактирования изображений — Nano Banana, которая оказалась Gemini 2.5 Flash Preview Image Generation от Google.

Уже попробовал и вот что заметил:
— Послушность. Намного лучше, чем у flux-kontext: если там команда может проигнорироваться, то здесь всё работает чётко, нужно что-то изменить или удалить на картинке, выполняется без проблем.
— Промптинг. По стилю ближе к flux-kontext, чем к gpt-image-1: нужны короткие и максимально понятные запросы. Длинные промпты/описания, которые можно подать в gpt-image-1, не так заходят.
— Качество. Генерация заметно чётче, без той замыленности, которая есть у gpt-image-1.
— Скорость. В среднем 15–30 секунд на генерацию. Для сравнения: flux-kontext справляется примерно за 10 секунд, а gpt-image-1 — около минуты.
— Цена. По API примерно как у flux-kontext-pro — около $0.04 за генерацию. У gpt-image-1 стоимость может доходить до $0.24.

Похоже, это топ для редактирования изображений.

Попробовать можно уже сейчас бесплатно в Google AI Studio.

1.05K views15:32

ТАБУИИРОВАNNЫЙ

Гарвардский профессор выложил в открытый доступ свой учебник по ML-системам. 2048 страниц, бесплатно.

Это комплексное руководство, которое охватывает весь путь от теории до практики.

Ключевые темы:
— Фундамент: от истории ИИ и основ Deep Learning до современных DNN-архитектур и фреймворков.
— Системы и продакшн: инженерия данных, MLOps, оптимизация моделей, развертывание и безопасность.
— Практика и будущее: есть лабораторные работы на Raspberry Pi/Arduino.
— А также разделы об этике в ИИ и новейших моделях (SLM, VLM).

Это отличный ресурс для инженеров, чтобы систематизировать и углубить свои знания. Настоящий подарок для ML-сообщества.

❤9

1.21K viewsedited 10:13

ТАБУИИРОВАNNЫЙ

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

Сегодня я покажу вам убойную связку, которая взорвёт ваше воображение:
«Google Maps x Nano Banana x Tripo3D»

С помощью этого метода вы сможете превратить любое здание мира в очаровательную изометрическую 3D-модель. Звучит сложно? На самом деле всё элементарно!

Пошаговая инструкция:

1️⃣ Откройте Google Maps. Найдите любое известное здание (Эйфелеву башню, Колизей, да хоть ваш собственный дом!) и сделайте скриншот.

2️⃣ Загрузите скриншот в Nano Banana (Gemini 2.5 Flash Preview Image Generation). Используйте этот простой промпт:

Make the building isometric with color and clean the background.

AI превратит ваш скриншот в стильную изометрическую картинку с чистым фоном.

3️⃣ Перейдите в Tripo3D. Загрузите полученное изображение, и сервис автоматически сгенерирует для вас настоящую 3D-модель!

Что с этим можно делать?
— Создавать крутую 3D-анимацию для своих проектов.
— Распечатать модель на 3D-принтере и поставить на полку.
— Превратить это в уникальную бизнес-идею и новый источник дохода!

👍9🔥4

1.36K viewsedited 06:51

ТАБУИИРОВАNNЫЙ

Какая бешеная неделя в AI 🤯

ИИ-дайджест №9 (23.08.2025 — 30.08.2025):

1️⃣ OpenAI Realtime API: OpenAI выпустила Realtime API и новую модель gpt-realtime, значительно улучшив возможности голосовых AI-агентов. Теперь они могут вести более естественные диалоги, понимать нюансы и даже менять голос в зависимости от ситуации. Стоимость снижена на 20%!

2️⃣ Google Nano Banana (Gemini 2.5 Flash Image): Google официально запустил Nano Banana, который многие называют "самой мощной моделью для редактирования изображений в мире". Он поддерживает "многокартиночное слияние", сохранение согласованности персонажей и редактирование на естественном языке.

3️⃣ Higgsfield WAN 2.2: Higgsfield выпустил более 30 "взрывных" пресетов для своей модели WAN 2.2, позволяя создавать вирусные видеоролики с полным контролем. Также представлен WAN 2.2-S2V, модель для создания кинематографических видео на основе аудио.

4️⃣ Kling 2.1: Kling 2.1 представил функцию Start/End Frame, которая позволяет контролировать переходы между сценами, делая их невероятно плавными и естественными.

5️⃣ Grok Code Fast 1: xAI выпустила новую модель Grok Code Fast 1, специально разработанную для программирования. Она отличается высокой скоростью (до 92 токенов в секунду) и конкурентоспособной ценой.

6️⃣ Google Vids: Google представил новый бесплатный инструмент для редактирования видео Google Vids, который использует Gemini AI, Veo3 и Imagen для создания привлекательных видеороликов без опыта дизайна.

7️⃣ NotebookLM Video Overviews: NotebookLM теперь полностью поддерживает видеообзоры на 80 языках, включая русский, а также предлагает контроль длины для аудиообзоров на других языках.

8️⃣ Google Translate AI-powered translations: Google внедряет AI-переводы в мобильные приложения Google Translate, а также бета-функцию для практики новых языков.

9️⃣ Claude for Chrome: Anthropic выпустила "Claude for Chrome", расширение, которое позволяет Claude выполнять действия в браузере от имени пользователя.

🔗 Дайджест за прошлую неделю

👍5❤4🔥2

1.1K viewsedited 05:34

ТАБУИИРОВАNNЫЙ

Промпт, который изменил мою жизнь (часть 4)

Я нашел новый способ, как быстрее разобраться в новой для себя теме.
Это промпт, который превращает ChatGPT в твоего личного тренера для мозга по методу Фейнмана.

Как это работает:
— Ты даёшь ему любую тему (от экономики до кода).
— Он пытается объяснить ее, как для 12-летнего. Без заумных слов, на простых примерах из жизни.
— Далее он задаёт вопросы, чтобы ты сам нашёл, что не понял и просит объяснить тему своими словами.
— И так через несколько таких итераций вы не просто запоминаете, а начинаете понимать концепцию.

Полный промпт, как всегда, в комментариях.

🔗 Промпт, который изменил мою жизнь (часть 3)

🔥13❤4

1.28K viewsedited 04:09

ТАБУИИРОВАNNЫЙ

Понимание LLM с нуля, без высшей математики

Если вы знаете, как складывать и умножать, вы поймёте:
— что такое эмбеддинги и токенизаторы;
— как работает self-attention и multi-head;
— почему softmax в конце почти везде;
— из чего собран GPT (блок за блоком);
— как собрать простой трансформер самому.

Это не “игрушечное” объяснение, по нему реально можно воспроизвести модель.
👉 Читать статью на сайте Medium

Мои подборки по теме изучения LLM:
— Список полезных youtube каналов для изучения ИИ
— 5 визуализаций для понимания языковых моделей (LLM)

❤2👍2

1.12K views13:14

ТАБУИИРОВАNNЫЙ

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Claude Code теперь можно прокачать за пару минут.

Нашел ресурс, на котором собраны больше 400 бесплатных шаблонов: агенты, команды, MCP и готовые конфиги.

Все ставится одной командой.
Есть помощники для кода, документов, API, промпт-инжиниринга и много другого.

Отличный способ быстро стартовать без лишних настроек.

👉 aitmpl.com

❤7

1.07K views16:10

ТАБУИИРОВАNNЫЙ

Продолжаем выжимать максимум из Gemini 2.5 Flash Image (aka Nano Banana).

Вот вам 9 pro-техник для полного контроля над генерацией картинок:

1️⃣ «Семантические» негативные промпты
Не используйте прямые запреты вроде "no cars”, они создают артефакты. Вместо этого описывайте сцену позитивно: говорите, что на ней должно быть.

An empty, deserted street with no signs of traffic.

2️⃣ Пошаговая генерация
Для сложных сцен разбивайте промпт на последовательные шаги. Это кардинально улучшает логику и детализацию результата.

First, create a misty forest background. Then, add a mossy stone altar in the foreground. Finally, place a glowing sword on the altar.

3️⃣ Сохранение деталей
Чтобы Gemini не испортил лицо или логотип при редактировании, в промпте чётко опишите, что должно остаться неизменным.

Using the provided image, add this logo to her t-shirt. Ensure her facial features and expression remain completely unchanged.

4️⃣ Говорите как фотограф
Для фотореализма используйте профессиональную лексику. Это прямой путь к управлению ракурсом, светом и композицией.

low-angle perspective, macro shot, three-point softbox setup, captured with a 85mm f/1.4 lens.

5️⃣ Прозрачный фон
Нужен объект для коллажа или стикер? Прямо в промпте запрашивайте прозрачный фон.

A kawaii-style sticker of a red panda. The background must be transparent.

6️⃣ Контекст и цель
Объясняйте, зачем вам изображение. Контекст напрямую влияет на стиль и детали.

Create a logo for a premium, minimalist skincare brand.

7️⃣ Комиксы и раскадровки
Создавайте панели с читаемым текстом для визуальных историй.

A single comic book panel, noir style. A detective holds a glowing artifact. Caption box text: "It was heavier than it looked."

8️⃣ Интерливинг: текст + картинки
Получайте смешанный контент: запрашивайте иллюстрированные инструкции или рецепты, где текст и картинки идут вместе.

Generate an illustrated recipe for paella.

9️⃣ Gemini vs. Imagen
Это разные инструменты.
Gemini: для диалогового редактирования, композиции и гибкости.
Imagen: для максимального фотореализма, чёткости и типографики.

Все техники взяты из официальной доки.

❤7

1.03K viewsedited 15:09

ТАБУИИРОВАNNЫЙ

Подавляющее большинство книг об AI/LLM-инжиниринге бесполезны.

Я собрал для вас несколько исключений (С ССЫЛКАМИ):
— Sebastian Raschka: Build a Large Language Model (From Scratch)
— Albert Ziegler and John Berryman: Prompt Engineering for LLMs
— Chip Huyen: Designing Machine Learning Systems
— Dan Jurafsky and James H. Martin: Speech and Language Processing
— Andriy Burkov: The Hundred-Page Language Models Book: hands-on with PyTorch

Также по теме:
🔗 МОЯ ПОДБОРКА БЕСПЛАТНЫХ КНИГ, ЧТОБЫ ГЛУБЖЕ ПОНЯТЬ ML

🔥5

1.02K views08:20

ТАБУИИРОВАNNЫЙ

Подборка из 12 топовых ИИ-сервисов для учебы и исследований:
1. Perplexity — исследования отрасли и анализ зарубежных компаний
2. Liner — поиск научных материалов
3. Lilys — анализ YouTube-видео
4. Tiro — автоматическое резюме встреч и лекций в реальном времени
5. NotebookLM — упорядочивание и понимание учебных материалов
6. ChatGPT (режим агента), Gemini Deep Research — глубокая исследовательская работа
7. Genspark — создание презентаций
8. Perplexity Comet — автоматизация рутины
9. Canva — генерация дизайна
10. Notion — запись и структурирование информации
11. Google Nano Banana — редактирование изображений
12. alphaXiv — легкий доступ к зарубежным статьям и исследованиям

🔥3❤2

1.06K views12:24

ТАБУИИРОВАNNЫЙ

Какая бешеная неделя в AI 🤯

ИИ-дайджест №10 (30.08.2025 — 06.09.2025)

1️⃣ Perplexity Comet + халявный Pro: Perplexity выкатили свой AI-браузер Comet и устроили аттракцион невиданной щедрости — раздают год Pro-версии бесплатно через PayPal. Студентам тоже насыпали бонусов.

2️⃣ Google Nano Banana: Новый король в мире AI-изображений. Это не просто генератор, а мощнейший редактор, который меняет объекты, освещение и стиль прямо на фото по текстовой команде. В сети уже вирусятся слухи о плагине для Photoshop.

3️⃣ Ветвление диалогов в ChatGPT: Наконец-то! OpenAI добавили функцию, которую просили все: теперь можно создавать «ветки» в диалоге, чтобы исследовать разные идеи, не ломая основной контекст. Больше никакого «копировать-вставить в новый чат».

4️⃣ AI-подкасты в Google NotebookLM: Инструмент для заметок от Google получил мощное обновление аудио-сводок. Теперь AI может не просто зачитать саммари, а устроить «Дебаты» или «Критику» по вашим документам с разными голосами. Почти персональный подкаст по любой теме.

5️⃣ Anthropic объявила Китай «враждебной страной»: Жёсткий ход от создателей Claude. Компания запретила использовать свои продукты компаниям, где более 50% акций принадлежит Китаю, вне зависимости от их местоположения. Геополитика врывается в AI.

6️⃣ Atlassian покупает Arc Browser: Создателей популярного браузера Arc (The Browser Company) поглотила Atlassian за $610 миллионов. Ждём Jira в каждой вкладке?

7️⃣ Шпионский скандал: xAI судится с OpenAI: xAI подала в суд на своего бывшего инженера, обвинив его в краже коммерческих тайн (связанных с Grok) и переходе с ними на работу в OpenAI. Настоящая драма в Кремниевой долине.

8️⃣ Bytebot — ваш личный AI-стажёр: Появился мощный open-source AI-агент, который работает на вашем ПК в собственной виртуальной среде. Ему можно поручить сложные задачи: он сам откроет браузер, заполнит формы, скачает файлы и будет работать с приложениями, как настоящий человек. И все это локально и под вашим контролем.

🔗 Дайджест за прошлую неделю

🔥3❤2🤣2

988 views05:28

ТАБУИИРОВАNNЫЙ

Готовый шаблон для вашего GenAI-проекта

Наткнулся на отличный production-ready шаблон для создания масштабируемых и поддерживаемых приложений на базе LLM.

Структура проекта:

— config/ — Конфиги вынесены из кода (модели, шаблоны промптов, логирование).
— src/ — Исходный код с четкой модульной структурой (клиенты для LLM, промпт-инжиниринг, утилиты, обработчики ошибок).
— data/ — Организованное хранилище для данных (промпты, кеш, выводы, эмбеддинги).
— notebooks/ — Jupyter-ноутбуки для быстрого тестирования гипотез и анализа результатов.
— Dockerfile — Всё готово к контейнеризации.

Ключевые практики, заложенные в шаблон:

✅ Версионирование промптов и результатов.
✅ Кеширование ответов для экономии денег и снижения задержек.
✅ Обработка ошибок через кастомные исключения.
✅ Готовые утилиты для подсчета токенов и ограничения запросов (rate limiting).
✅ Мониторинг использования API.

🔗 Ссылка на GitHub: https://github.com/HeyNina101/generative_ai_project

❤3🔥3🤣3

1.03K viewsedited 10:24

About

Blog

Apps

Platform