Какая бешеная неделя в AI 🤯
ИИ-дайджест №8 (16.08.2025 — 23.08.2025):
1️⃣ GPT-6: Сэм Альтман раскрыл главную фишку новой модели — «память». GPT-6 будет запоминать ваши предпочтения, привычки и стиль общения, чтобы стать по-настоящему персональным ассистентом.
2️⃣ Higgsfield Product-to-Video: AI-инструмент, который превращает одно фото продукта в полноценный рекламный ролик. Он сам генерирует окружение и даже добавляет актеров, взаимодействующих с товаром.
3️⃣ Qwen Image Edit: Open-source «убийца Photoshop» от Alibaba. Редактирует любую часть изображения по текстовой команде, сохраняя идеальное качество остальной картинки.
4️⃣ Tencent Yan: Китайский ответ на Google Genie 3. Нейросеть генерирует игровые сцены из текста или картинки в 1080p/60fps и позволяет редактировать их в реальном времени.
5️⃣ Desktop-агент от ByteDance: Полностью автономный AI-агент, который работает локально на вашем компьютере. Он «видит» экран и может управлять любыми приложениями, от Excel до браузера, выполняя ваши команды. Все данные остаются у вас.
6️⃣ Alibaba Qoder: Новый «агентский» AI-редактор кода, конкурирующий с Cursor. Он не просто пишет код, а понимает весь проект целиком, создаёт документацию и помогает с развёртыванием.
7️⃣ RAG-Anything: Open-source система, которая выводит RAG на новый уровень. Она «понимает» не только текст в документах, но и таблицы, формулы и изображения, создавая единую мультимодальную базу знаний.
8️⃣ Claude Code «Режим обучения»: Anthropic прокачала свой AI-кодер. Теперь он не просто пишет код, а работает как ментор: создаёт структуру, объясняет логику, но самые важные части оставляет вам для заполнения.
🔗 Дайджест за прошлую неделю
ИИ-дайджест №8 (16.08.2025 — 23.08.2025):
1️⃣ GPT-6: Сэм Альтман раскрыл главную фишку новой модели — «память». GPT-6 будет запоминать ваши предпочтения, привычки и стиль общения, чтобы стать по-настоящему персональным ассистентом.
2️⃣ Higgsfield Product-to-Video: AI-инструмент, который превращает одно фото продукта в полноценный рекламный ролик. Он сам генерирует окружение и даже добавляет актеров, взаимодействующих с товаром.
3️⃣ Qwen Image Edit: Open-source «убийца Photoshop» от Alibaba. Редактирует любую часть изображения по текстовой команде, сохраняя идеальное качество остальной картинки.
4️⃣ Tencent Yan: Китайский ответ на Google Genie 3. Нейросеть генерирует игровые сцены из текста или картинки в 1080p/60fps и позволяет редактировать их в реальном времени.
5️⃣ Desktop-агент от ByteDance: Полностью автономный AI-агент, который работает локально на вашем компьютере. Он «видит» экран и может управлять любыми приложениями, от Excel до браузера, выполняя ваши команды. Все данные остаются у вас.
6️⃣ Alibaba Qoder: Новый «агентский» AI-редактор кода, конкурирующий с Cursor. Он не просто пишет код, а понимает весь проект целиком, создаёт документацию и помогает с развёртыванием.
7️⃣ RAG-Anything: Open-source система, которая выводит RAG на новый уровень. Она «понимает» не только текст в документах, но и таблицы, формулы и изображения, создавая единую мультимодальную базу знаний.
8️⃣ Claude Code «Режим обучения»: Anthropic прокачала свой AI-кодер. Теперь он не просто пишет код, а работает как ментор: создаёт структуру, объясняет логику, но самые важные части оставляет вам для заполнения.
🔗 Дайджест за прошлую неделю
🔥6👍4❤2
Ты тоже сохраняешь кучу статей, видео и заметок, а потом не можешь ничего найти?
getrecall.ai превращает хаос в организованную базу знаний
Основные возможности:
1️⃣ Автоматические резюме для подкастов, YouTube, новостей и PDF.
2️⃣ Умная автокатегоризация: теги по содержанию.
3️⃣ Граф знаний: все материалы связываются между собой для быстрого поиска.
4️⃣ Поддержка метода интервального повторения для лёгкого запоминания.
5️⃣ Данные хранятся локально: доступ даже офлайн.
6️⃣ Экспорт заметок в Markdown для интеграции с другими инструментами.
7️⃣ Резервное копирование в Google Cloud (ЕС).
getrecall.ai превращает хаос в организованную базу знаний
Основные возможности:
1️⃣ Автоматические резюме для подкастов, YouTube, новостей и PDF.
2️⃣ Умная автокатегоризация: теги по содержанию.
3️⃣ Граф знаний: все материалы связываются между собой для быстрого поиска.
4️⃣ Поддержка метода интервального повторения для лёгкого запоминания.
5️⃣ Данные хранятся локально: доступ даже офлайн.
6️⃣ Экспорт заметок в Markdown для интеграции с другими инструментами.
7️⃣ Резервное копирование в Google Cloud (ЕС).
❤7
Media is too big
VIEW IN TELEGRAM
В NotebookLM теперь доступны видеообзоры на русском!
Произношение пока не идеально, есть шероховатости, но впечатляет.
Слушается как живая лекция.
Можете оценить вдохновляющий разбор об ИИ-агентах от NotebookLM.
Произношение пока не идеально, есть шероховатости, но впечатляет.
Слушается как живая лекция.
Можете оценить вдохновляющий разбор об ИИ-агентах от NotebookLM.
🔥6❤3
Вышла новая модель для редактирования изображений — Nano Banana, которая оказалась Gemini 2.5 Flash Preview Image Generation от Google.
Уже попробовал и вот что заметил:
— Послушность. Намного лучше, чем у flux-kontext: если там команда может проигнорироваться, то здесь всё работает чётко, нужно что-то изменить или удалить на картинке, выполняется без проблем.
— Промптинг. По стилю ближе к flux-kontext, чем к gpt-image-1: нужны короткие и максимально понятные запросы. Длинные промпты/описания, которые можно подать в gpt-image-1, не так заходят.
— Качество. Генерация заметно чётче, без той замыленности, которая есть у gpt-image-1.
— Скорость. В среднем 15–30 секунд на генерацию. Для сравнения: flux-kontext справляется примерно за 10 секунд, а gpt-image-1 — около минуты.
— Цена. По API примерно как у flux-kontext-pro — около $0.04 за генерацию. У gpt-image-1 стоимость может доходить до $0.24.
Похоже, это топ для редактирования изображений.
Попробовать можно уже сейчас бесплатно в Google AI Studio.
Уже попробовал и вот что заметил:
— Послушность. Намного лучше, чем у flux-kontext: если там команда может проигнорироваться, то здесь всё работает чётко, нужно что-то изменить или удалить на картинке, выполняется без проблем.
— Промптинг. По стилю ближе к flux-kontext, чем к gpt-image-1: нужны короткие и максимально понятные запросы. Длинные промпты/описания, которые можно подать в gpt-image-1, не так заходят.
— Качество. Генерация заметно чётче, без той замыленности, которая есть у gpt-image-1.
— Скорость. В среднем 15–30 секунд на генерацию. Для сравнения: flux-kontext справляется примерно за 10 секунд, а gpt-image-1 — около минуты.
— Цена. По API примерно как у flux-kontext-pro — около $0.04 за генерацию. У gpt-image-1 стоимость может доходить до $0.24.
Похоже, это топ для редактирования изображений.
Попробовать можно уже сейчас бесплатно в Google AI Studio.
Гарвардский профессор выложил в открытый доступ свой учебник по ML-системам. 2048 страниц, бесплатно.
Это комплексное руководство, которое охватывает весь путь от теории до практики.
Ключевые темы:
— Фундамент: от истории ИИ и основ Deep Learning до современных DNN-архитектур и фреймворков.
— Системы и продакшн: инженерия данных, MLOps, оптимизация моделей, развертывание и безопасность.
— Практика и будущее: есть лабораторные работы на Raspberry Pi/Arduino.
— А также разделы об этике в ИИ и новейших моделях (SLM, VLM).
Это отличный ресурс для инженеров, чтобы систематизировать и углубить свои знания. Настоящий подарок для ML-сообщества.
Это комплексное руководство, которое охватывает весь путь от теории до практики.
Ключевые темы:
— Фундамент: от истории ИИ и основ Deep Learning до современных DNN-архитектур и фреймворков.
— Системы и продакшн: инженерия данных, MLOps, оптимизация моделей, развертывание и безопасность.
— Практика и будущее: есть лабораторные работы на Raspberry Pi/Arduino.
— А также разделы об этике в ИИ и новейших моделях (SLM, VLM).
Это отличный ресурс для инженеров, чтобы систематизировать и углубить свои знания. Настоящий подарок для ML-сообщества.
❤9
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня я покажу вам убойную связку, которая взорвёт ваше воображение:
«Google Maps x Nano Banana x Tripo3D»
С помощью этого метода вы сможете превратить любое здание мира в очаровательную изометрическую 3D-модель. Звучит сложно? На самом деле всё элементарно!
Пошаговая инструкция:
1️⃣ Откройте Google Maps. Найдите любое известное здание (Эйфелеву башню, Колизей, да хоть ваш собственный дом!) и сделайте скриншот.
2️⃣ Загрузите скриншот в Nano Banana (Gemini 2.5 Flash Preview Image Generation). Используйте этот простой промпт:
AI превратит ваш скриншот в стильную изометрическую картинку с чистым фоном.
3️⃣ Перейдите в Tripo3D. Загрузите полученное изображение, и сервис автоматически сгенерирует для вас настоящую 3D-модель!
Что с этим можно делать?
— Создавать крутую 3D-анимацию для своих проектов.
— Распечатать модель на 3D-принтере и поставить на полку.
— Превратить это в уникальную бизнес-идею и новый источник дохода!
«Google Maps x Nano Banana x Tripo3D»
С помощью этого метода вы сможете превратить любое здание мира в очаровательную изометрическую 3D-модель. Звучит сложно? На самом деле всё элементарно!
Пошаговая инструкция:
1️⃣ Откройте Google Maps. Найдите любое известное здание (Эйфелеву башню, Колизей, да хоть ваш собственный дом!) и сделайте скриншот.
2️⃣ Загрузите скриншот в Nano Banana (Gemini 2.5 Flash Preview Image Generation). Используйте этот простой промпт:
Make the building isometric with color and clean the background.
AI превратит ваш скриншот в стильную изометрическую картинку с чистым фоном.
3️⃣ Перейдите в Tripo3D. Загрузите полученное изображение, и сервис автоматически сгенерирует для вас настоящую 3D-модель!
Что с этим можно делать?
— Создавать крутую 3D-анимацию для своих проектов.
— Распечатать модель на 3D-принтере и поставить на полку.
— Превратить это в уникальную бизнес-идею и новый источник дохода!
👍9🔥4
Какая бешеная неделя в AI 🤯
ИИ-дайджест №9 (23.08.2025 — 30.08.2025):
1️⃣ OpenAI Realtime API: OpenAI выпустила Realtime API и новую модель gpt-realtime, значительно улучшив возможности голосовых AI-агентов. Теперь они могут вести более естественные диалоги, понимать нюансы и даже менять голос в зависимости от ситуации. Стоимость снижена на 20%!
2️⃣ Google Nano Banana (Gemini 2.5 Flash Image): Google официально запустил Nano Banana, который многие называют "самой мощной моделью для редактирования изображений в мире". Он поддерживает "многокартиночное слияние", сохранение согласованности персонажей и редактирование на естественном языке.
3️⃣ Higgsfield WAN 2.2: Higgsfield выпустил более 30 "взрывных" пресетов для своей модели WAN 2.2, позволяя создавать вирусные видеоролики с полным контролем. Также представлен WAN 2.2-S2V, модель для создания кинематографических видео на основе аудио.
4️⃣ Kling 2.1: Kling 2.1 представил функцию Start/End Frame, которая позволяет контролировать переходы между сценами, делая их невероятно плавными и естественными.
5️⃣ Grok Code Fast 1: xAI выпустила новую модель Grok Code Fast 1, специально разработанную для программирования. Она отличается высокой скоростью (до 92 токенов в секунду) и конкурентоспособной ценой.
6️⃣ Google Vids: Google представил новый бесплатный инструмент для редактирования видео Google Vids, который использует Gemini AI, Veo3 и Imagen для создания привлекательных видеороликов без опыта дизайна.
7️⃣ NotebookLM Video Overviews: NotebookLM теперь полностью поддерживает видеообзоры на 80 языках, включая русский, а также предлагает контроль длины для аудиообзоров на других языках.
8️⃣ Google Translate AI-powered translations: Google внедряет AI-переводы в мобильные приложения Google Translate, а также бета-функцию для практики новых языков.
9️⃣ Claude for Chrome: Anthropic выпустила "Claude for Chrome", расширение, которое позволяет Claude выполнять действия в браузере от имени пользователя.
🔗 Дайджест за прошлую неделю
ИИ-дайджест №9 (23.08.2025 — 30.08.2025):
1️⃣ OpenAI Realtime API: OpenAI выпустила Realtime API и новую модель gpt-realtime, значительно улучшив возможности голосовых AI-агентов. Теперь они могут вести более естественные диалоги, понимать нюансы и даже менять голос в зависимости от ситуации. Стоимость снижена на 20%!
2️⃣ Google Nano Banana (Gemini 2.5 Flash Image): Google официально запустил Nano Banana, который многие называют "самой мощной моделью для редактирования изображений в мире". Он поддерживает "многокартиночное слияние", сохранение согласованности персонажей и редактирование на естественном языке.
3️⃣ Higgsfield WAN 2.2: Higgsfield выпустил более 30 "взрывных" пресетов для своей модели WAN 2.2, позволяя создавать вирусные видеоролики с полным контролем. Также представлен WAN 2.2-S2V, модель для создания кинематографических видео на основе аудио.
4️⃣ Kling 2.1: Kling 2.1 представил функцию Start/End Frame, которая позволяет контролировать переходы между сценами, делая их невероятно плавными и естественными.
5️⃣ Grok Code Fast 1: xAI выпустила новую модель Grok Code Fast 1, специально разработанную для программирования. Она отличается высокой скоростью (до 92 токенов в секунду) и конкурентоспособной ценой.
6️⃣ Google Vids: Google представил новый бесплатный инструмент для редактирования видео Google Vids, который использует Gemini AI, Veo3 и Imagen для создания привлекательных видеороликов без опыта дизайна.
7️⃣ NotebookLM Video Overviews: NotebookLM теперь полностью поддерживает видеообзоры на 80 языках, включая русский, а также предлагает контроль длины для аудиообзоров на других языках.
8️⃣ Google Translate AI-powered translations: Google внедряет AI-переводы в мобильные приложения Google Translate, а также бета-функцию для практики новых языков.
9️⃣ Claude for Chrome: Anthropic выпустила "Claude for Chrome", расширение, которое позволяет Claude выполнять действия в браузере от имени пользователя.
🔗 Дайджест за прошлую неделю
👍5❤4🔥2
Промпт, который изменил мою жизнь (часть 4)
Я нашел новый способ, как быстрее разобраться в новой для себя теме.
Это промпт, который превращает ChatGPT в твоего личного тренера для мозга по методу Фейнмана.
Как это работает:
— Ты даёшь ему любую тему (от экономики до кода).
— Он пытается объяснить ее, как для 12-летнего. Без заумных слов, на простых примерах из жизни.
— Далее он задаёт вопросы, чтобы ты сам нашёл, что не понял и просит объяснить тему своими словами.
— И так через несколько таких итераций вы не просто запоминаете, а начинаете понимать концепцию.
Полный промпт, как всегда, в комментариях.
🔗 Промпт, который изменил мою жизнь (часть 3)
Я нашел новый способ, как быстрее разобраться в новой для себя теме.
Это промпт, который превращает ChatGPT в твоего личного тренера для мозга по методу Фейнмана.
Как это работает:
— Ты даёшь ему любую тему (от экономики до кода).
— Он пытается объяснить ее, как для 12-летнего. Без заумных слов, на простых примерах из жизни.
— Далее он задаёт вопросы, чтобы ты сам нашёл, что не понял и просит объяснить тему своими словами.
— И так через несколько таких итераций вы не просто запоминаете, а начинаете понимать концепцию.
Полный промпт, как всегда, в комментариях.
🔗 Промпт, который изменил мою жизнь (часть 3)
🔥13❤4
Понимание LLM с нуля, без высшей математики
Если вы знаете, как складывать и умножать, вы поймёте:
— что такое эмбеддинги и токенизаторы;
— как работает self-attention и multi-head;
— почему softmax в конце почти везде;
— из чего собран GPT (блок за блоком);
— как собрать простой трансформер самому.
Это не “игрушечное” объяснение, по нему реально можно воспроизвести модель.
👉 Читать статью на сайте Medium
Мои подборки по теме изучения LLM:
— Список полезных youtube каналов для изучения ИИ
— 5 визуализаций для понимания языковых моделей (LLM)
Если вы знаете, как складывать и умножать, вы поймёте:
— что такое эмбеддинги и токенизаторы;
— как работает self-attention и multi-head;
— почему softmax в конце почти везде;
— из чего собран GPT (блок за блоком);
— как собрать простой трансформер самому.
Это не “игрушечное” объяснение, по нему реально можно воспроизвести модель.
👉 Читать статью на сайте Medium
Мои подборки по теме изучения LLM:
— Список полезных youtube каналов для изучения ИИ
— 5 визуализаций для понимания языковых моделей (LLM)
❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code теперь можно прокачать за пару минут.
Нашел ресурс, на котором собраны больше 400 бесплатных шаблонов: агенты, команды, MCP и готовые конфиги.
Все ставится одной командой.
Есть помощники для кода, документов, API, промпт-инжиниринга и много другого.
Отличный способ быстро стартовать без лишних настроек.
👉 aitmpl.com
Нашел ресурс, на котором собраны больше 400 бесплатных шаблонов: агенты, команды, MCP и готовые конфиги.
Все ставится одной командой.
Есть помощники для кода, документов, API, промпт-инжиниринга и много другого.
Отличный способ быстро стартовать без лишних настроек.
👉 aitmpl.com
❤7
Продолжаем выжимать максимум из Gemini 2.5 Flash Image (aka Nano Banana).
Вот вам 9 pro-техник для полного контроля над генерацией картинок:
1️⃣ «Семантические» негативные промпты
Не используйте прямые запреты вроде "no cars”, они создают артефакты. Вместо этого описывайте сцену позитивно: говорите, что на ней должно быть.
2️⃣ Пошаговая генерация
Для сложных сцен разбивайте промпт на последовательные шаги. Это кардинально улучшает логику и детализацию результата.
3️⃣ Сохранение деталей
Чтобы Gemini не испортил лицо или логотип при редактировании, в промпте чётко опишите, что должно остаться неизменным.
4️⃣ Говорите как фотограф
Для фотореализма используйте профессиональную лексику. Это прямой путь к управлению ракурсом, светом и композицией.
5️⃣ Прозрачный фон
Нужен объект для коллажа или стикер? Прямо в промпте запрашивайте прозрачный фон.
6️⃣ Контекст и цель
Объясняйте, зачем вам изображение. Контекст напрямую влияет на стиль и детали.
7️⃣ Комиксы и раскадровки
Создавайте панели с читаемым текстом для визуальных историй.
8️⃣ Интерливинг: текст + картинки
Получайте смешанный контент: запрашивайте иллюстрированные инструкции или рецепты, где текст и картинки идут вместе.
9️⃣ Gemini vs. Imagen
Это разные инструменты.
Gemini: для диалогового редактирования, композиции и гибкости.
Imagen: для максимального фотореализма, чёткости и типографики.
Все техники взяты из официальной доки.
Вот вам 9 pro-техник для полного контроля над генерацией картинок:
1️⃣ «Семантические» негативные промпты
Не используйте прямые запреты вроде "no cars”, они создают артефакты. Вместо этого описывайте сцену позитивно: говорите, что на ней должно быть.
An empty, deserted street with no signs of traffic.
2️⃣ Пошаговая генерация
Для сложных сцен разбивайте промпт на последовательные шаги. Это кардинально улучшает логику и детализацию результата.
First, create a misty forest background. Then, add a mossy stone altar in the foreground. Finally, place a glowing sword on the altar.
3️⃣ Сохранение деталей
Чтобы Gemini не испортил лицо или логотип при редактировании, в промпте чётко опишите, что должно остаться неизменным.
Using the provided image, add this logo to her t-shirt. Ensure her facial features and expression remain completely unchanged.
4️⃣ Говорите как фотограф
Для фотореализма используйте профессиональную лексику. Это прямой путь к управлению ракурсом, светом и композицией.
low-angle perspective, macro shot, three-point softbox setup, captured with a 85mm f/1.4 lens.
5️⃣ Прозрачный фон
Нужен объект для коллажа или стикер? Прямо в промпте запрашивайте прозрачный фон.
A kawaii-style sticker of a red panda. The background must be transparent.
6️⃣ Контекст и цель
Объясняйте, зачем вам изображение. Контекст напрямую влияет на стиль и детали.
Create a logo for a premium, minimalist skincare brand.
7️⃣ Комиксы и раскадровки
Создавайте панели с читаемым текстом для визуальных историй.
A single comic book panel, noir style. A detective holds a glowing artifact. Caption box text: "It was heavier than it looked."
8️⃣ Интерливинг: текст + картинки
Получайте смешанный контент: запрашивайте иллюстрированные инструкции или рецепты, где текст и картинки идут вместе.
Generate an illustrated recipe for paella.
9️⃣ Gemini vs. Imagen
Это разные инструменты.
Gemini: для диалогового редактирования, композиции и гибкости.
Imagen: для максимального фотореализма, чёткости и типографики.
Все техники взяты из официальной доки.
❤7
Подавляющее большинство книг об AI/LLM-инжиниринге бесполезны.
Я собрал для вас несколько исключений (С ССЫЛКАМИ):
— Sebastian Raschka: Build a Large Language Model (From Scratch)
— Albert Ziegler and John Berryman: Prompt Engineering for LLMs
— Chip Huyen: Designing Machine Learning Systems
— Dan Jurafsky and James H. Martin: Speech and Language Processing
— Andriy Burkov: The Hundred-Page Language Models Book: hands-on with PyTorch
Также по теме:
🔗 МОЯ ПОДБОРКА БЕСПЛАТНЫХ КНИГ, ЧТОБЫ ГЛУБЖЕ ПОНЯТЬ ML
Я собрал для вас несколько исключений (С ССЫЛКАМИ):
— Sebastian Raschka: Build a Large Language Model (From Scratch)
— Albert Ziegler and John Berryman: Prompt Engineering for LLMs
— Chip Huyen: Designing Machine Learning Systems
— Dan Jurafsky and James H. Martin: Speech and Language Processing
— Andriy Burkov: The Hundred-Page Language Models Book: hands-on with PyTorch
Также по теме:
🔗 МОЯ ПОДБОРКА БЕСПЛАТНЫХ КНИГ, ЧТОБЫ ГЛУБЖЕ ПОНЯТЬ ML
🔥5
Подборка из 12 топовых ИИ-сервисов для учебы и исследований:
1. Perplexity — исследования отрасли и анализ зарубежных компаний
2. Liner — поиск научных материалов
3. Lilys — анализ YouTube-видео
4. Tiro — автоматическое резюме встреч и лекций в реальном времени
5. NotebookLM — упорядочивание и понимание учебных материалов
6. ChatGPT (режим агента), Gemini Deep Research — глубокая исследовательская работа
7. Genspark — создание презентаций
8. Perplexity Comet — автоматизация рутины
9. Canva — генерация дизайна
10. Notion — запись и структурирование информации
11. Google Nano Banana — редактирование изображений
12. alphaXiv — легкий доступ к зарубежным статьям и исследованиям
1. Perplexity — исследования отрасли и анализ зарубежных компаний
2. Liner — поиск научных материалов
3. Lilys — анализ YouTube-видео
4. Tiro — автоматическое резюме встреч и лекций в реальном времени
5. NotebookLM — упорядочивание и понимание учебных материалов
6. ChatGPT (режим агента), Gemini Deep Research — глубокая исследовательская работа
7. Genspark — создание презентаций
8. Perplexity Comet — автоматизация рутины
9. Canva — генерация дизайна
10. Notion — запись и структурирование информации
11. Google Nano Banana — редактирование изображений
12. alphaXiv — легкий доступ к зарубежным статьям и исследованиям
🔥3❤2
Какая бешеная неделя в AI 🤯
ИИ-дайджест №10 (30.08.2025 — 06.09.2025)
1️⃣ Perplexity Comet + халявный Pro: Perplexity выкатили свой AI-браузер Comet и устроили аттракцион невиданной щедрости — раздают год Pro-версии бесплатно через PayPal. Студентам тоже насыпали бонусов.
2️⃣ Google Nano Banana: Новый король в мире AI-изображений. Это не просто генератор, а мощнейший редактор, который меняет объекты, освещение и стиль прямо на фото по текстовой команде. В сети уже вирусятся слухи о плагине для Photoshop.
3️⃣ Ветвление диалогов в ChatGPT: Наконец-то! OpenAI добавили функцию, которую просили все: теперь можно создавать «ветки» в диалоге, чтобы исследовать разные идеи, не ломая основной контекст. Больше никакого «копировать-вставить в новый чат».
4️⃣ AI-подкасты в Google NotebookLM: Инструмент для заметок от Google получил мощное обновление аудио-сводок. Теперь AI может не просто зачитать саммари, а устроить «Дебаты» или «Критику» по вашим документам с разными голосами. Почти персональный подкаст по любой теме.
5️⃣ Anthropic объявила Китай «враждебной страной»: Жёсткий ход от создателей Claude. Компания запретила использовать свои продукты компаниям, где более 50% акций принадлежит Китаю, вне зависимости от их местоположения. Геополитика врывается в AI.
6️⃣ Atlassian покупает Arc Browser: Создателей популярного браузера Arc (The Browser Company) поглотила Atlassian за $610 миллионов. Ждём Jira в каждой вкладке?
7️⃣ Шпионский скандал: xAI судится с OpenAI: xAI подала в суд на своего бывшего инженера, обвинив его в краже коммерческих тайн (связанных с Grok) и переходе с ними на работу в OpenAI. Настоящая драма в Кремниевой долине.
8️⃣ Bytebot — ваш личный AI-стажёр: Появился мощный open-source AI-агент, который работает на вашем ПК в собственной виртуальной среде. Ему можно поручить сложные задачи: он сам откроет браузер, заполнит формы, скачает файлы и будет работать с приложениями, как настоящий человек. И все это локально и под вашим контролем.
🔗 Дайджест за прошлую неделю
ИИ-дайджест №10 (30.08.2025 — 06.09.2025)
1️⃣ Perplexity Comet + халявный Pro: Perplexity выкатили свой AI-браузер Comet и устроили аттракцион невиданной щедрости — раздают год Pro-версии бесплатно через PayPal. Студентам тоже насыпали бонусов.
2️⃣ Google Nano Banana: Новый король в мире AI-изображений. Это не просто генератор, а мощнейший редактор, который меняет объекты, освещение и стиль прямо на фото по текстовой команде. В сети уже вирусятся слухи о плагине для Photoshop.
3️⃣ Ветвление диалогов в ChatGPT: Наконец-то! OpenAI добавили функцию, которую просили все: теперь можно создавать «ветки» в диалоге, чтобы исследовать разные идеи, не ломая основной контекст. Больше никакого «копировать-вставить в новый чат».
4️⃣ AI-подкасты в Google NotebookLM: Инструмент для заметок от Google получил мощное обновление аудио-сводок. Теперь AI может не просто зачитать саммари, а устроить «Дебаты» или «Критику» по вашим документам с разными голосами. Почти персональный подкаст по любой теме.
5️⃣ Anthropic объявила Китай «враждебной страной»: Жёсткий ход от создателей Claude. Компания запретила использовать свои продукты компаниям, где более 50% акций принадлежит Китаю, вне зависимости от их местоположения. Геополитика врывается в AI.
6️⃣ Atlassian покупает Arc Browser: Создателей популярного браузера Arc (The Browser Company) поглотила Atlassian за $610 миллионов. Ждём Jira в каждой вкладке?
7️⃣ Шпионский скандал: xAI судится с OpenAI: xAI подала в суд на своего бывшего инженера, обвинив его в краже коммерческих тайн (связанных с Grok) и переходе с ними на работу в OpenAI. Настоящая драма в Кремниевой долине.
8️⃣ Bytebot — ваш личный AI-стажёр: Появился мощный open-source AI-агент, который работает на вашем ПК в собственной виртуальной среде. Ему можно поручить сложные задачи: он сам откроет браузер, заполнит формы, скачает файлы и будет работать с приложениями, как настоящий человек. И все это локально и под вашим контролем.
🔗 Дайджест за прошлую неделю
🔥3❤2🤣2
Готовый шаблон для вашего GenAI-проекта
Наткнулся на отличный production-ready шаблон для создания масштабируемых и поддерживаемых приложений на базе LLM.
Структура проекта:
— config/ — Конфиги вынесены из кода (модели, шаблоны промптов, логирование).
— src/ — Исходный код с четкой модульной структурой (клиенты для LLM, промпт-инжиниринг, утилиты, обработчики ошибок).
— data/ — Организованное хранилище для данных (промпты, кеш, выводы, эмбеддинги).
— notebooks/ — Jupyter-ноутбуки для быстрого тестирования гипотез и анализа результатов.
— Dockerfile — Всё готово к контейнеризации.
Ключевые практики, заложенные в шаблон:
✅ Версионирование промптов и результатов.
✅ Кеширование ответов для экономии денег и снижения задержек.
✅ Обработка ошибок через кастомные исключения.
✅ Готовые утилиты для подсчета токенов и ограничения запросов (rate limiting).
✅ Мониторинг использования API.
🔗 Ссылка на GitHub: https://github.com/HeyNina101/generative_ai_project
Наткнулся на отличный production-ready шаблон для создания масштабируемых и поддерживаемых приложений на базе LLM.
Структура проекта:
— config/ — Конфиги вынесены из кода (модели, шаблоны промптов, логирование).
— src/ — Исходный код с четкой модульной структурой (клиенты для LLM, промпт-инжиниринг, утилиты, обработчики ошибок).
— data/ — Организованное хранилище для данных (промпты, кеш, выводы, эмбеддинги).
— notebooks/ — Jupyter-ноутбуки для быстрого тестирования гипотез и анализа результатов.
— Dockerfile — Всё готово к контейнеризации.
Ключевые практики, заложенные в шаблон:
✅ Версионирование промптов и результатов.
✅ Кеширование ответов для экономии денег и снижения задержек.
✅ Обработка ошибок через кастомные исключения.
✅ Готовые утилиты для подсчета токенов и ограничения запросов (rate limiting).
✅ Мониторинг использования API.
🔗 Ссылка на GitHub: https://github.com/HeyNina101/generative_ai_project
❤3🔥3🤣3