На выходных осваивал Supabase (хочу флэшбэки на него перевести), ElevenLabs (тоже нужен для одного интересного проекта) и Replicate (просто интересный агрегатор рисующих моделей).
В итоге сделал приложение для сына — spellings.app. Каждую неделю ему задают 10 новых слов, которые он должен учить в течение недели, а в пятницу — писать диктант. В первую неделю он написал 0 из 10, потому что мы не занимались, а на второй неделе начали работать, и получилось 5 из 10. На выходных я решил сделать для него приложение.
Вова любит Duolingo, занимается каждый день. Я подумал: почему бы не сделать мини-Дуолинго для его слов? Попросил Replit в пятницу, но он как-то не справился. В итоге сидел всю субботу и понедельник с Coursor Composer. Вчера к вечеру успешно запустил приложение, а сегодня полдня отлаживал и оптимизировал для улучшения работы (например, предзагрузка картинок и всё такое).
Суть проекта:
- Родитель добавляет набор слов, любых слов
- Мы генерируем картинки с ассоциациями для этих слов
- Создаём произношение для каждого слова
- Ребёнок начинает сессию практики
- Сначала он переписывает слова, затем пытается написать их только по произношению с картинкой, а потом — по звуку уже без картинки
- Ведётся статистика
- Всё это сопровождается звуками Duolingo
Вова пользуется приложением второй день. Это не просто, но у него получается. Для меня это тоже оказался интересный опыт. Мне нравится, как получилось реализовать анимации и другие элементы. Приложение написано на Next.js/TypeScript (я не знаю JavaScript, если что — никогда с ним не работал).
Планирую ещё немного доработать: добавить составление предложений, тестирование, разделение аккаунтов на родительские, учительские и детские. Может в школу потом напишу - предложу другим ученикам.
Из интересного — сделал возможность генерации картинок в стиле Minecraft/Roblox/Fortnite/мультфильмов Pixar/детских рисунков. Выглядит красиво. Flux-Schnell. Научился на iPhone отключать подсказки при вводе текста. Научился делать запускаемых кроном агентов на TypeDcript. Очень понравилось делать анимации с Framer Motion.
Итог — сделано примерно за 2 дня. Времена становятся всё интереснее.
Сергей Булаев AI 🤖 - об AI и не только
В итоге сделал приложение для сына — spellings.app. Каждую неделю ему задают 10 новых слов, которые он должен учить в течение недели, а в пятницу — писать диктант. В первую неделю он написал 0 из 10, потому что мы не занимались, а на второй неделе начали работать, и получилось 5 из 10. На выходных я решил сделать для него приложение.
Вова любит Duolingo, занимается каждый день. Я подумал: почему бы не сделать мини-Дуолинго для его слов? Попросил Replit в пятницу, но он как-то не справился. В итоге сидел всю субботу и понедельник с Coursor Composer. Вчера к вечеру успешно запустил приложение, а сегодня полдня отлаживал и оптимизировал для улучшения работы (например, предзагрузка картинок и всё такое).
Суть проекта:
- Родитель добавляет набор слов, любых слов
- Мы генерируем картинки с ассоциациями для этих слов
- Создаём произношение для каждого слова
- Ребёнок начинает сессию практики
- Сначала он переписывает слова, затем пытается написать их только по произношению с картинкой, а потом — по звуку уже без картинки
- Ведётся статистика
- Всё это сопровождается звуками Duolingo
Вова пользуется приложением второй день. Это не просто, но у него получается. Для меня это тоже оказался интересный опыт. Мне нравится, как получилось реализовать анимации и другие элементы. Приложение написано на Next.js/TypeScript (я не знаю JavaScript, если что — никогда с ним не работал).
Планирую ещё немного доработать: добавить составление предложений, тестирование, разделение аккаунтов на родительские, учительские и детские. Может в школу потом напишу - предложу другим ученикам.
Из интересного — сделал возможность генерации картинок в стиле Minecraft/Roblox/Fortnite/мультфильмов Pixar/детских рисунков. Выглядит красиво. Flux-Schnell. Научился на iPhone отключать подсказки при вводе текста. Научился делать запускаемых кроном агентов на TypeDcript. Очень понравилось делать анимации с Framer Motion.
Итог — сделано примерно за 2 дня. Времена становятся всё интереснее.
Сергей Булаев AI 🤖 - об AI и не только
11 35 10 6
Вчера забыл написать, инновации Apple продолжают поражать....
😁 😁 😁
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Elevenlabs, оказывается, неплохо умеет дублировать видосики.
Посмотрите что реально нового в айфонах.
Правда вот второе видео, про кнопку, немного с кривым переводом, и поправить не смог - админка глючит, проекты не открывает. Пытался написать в поддержку, получил ошибку Zendesk.
Сергей Булаев AI 🤖 - об AI и не только
Посмотрите что реально нового в айфонах.
Правда вот второе видео, про кнопку, немного с кривым переводом, и поправить не смог - админка глючит, проекты не открывает. Пытался написать в поддержку, получил ошибку Zendesk.
Сергей Булаев AI 🤖 - об AI и не только
Mistral, один из лидеров бесплатных LLM (лицензия Apache) выпустил мультимодальную модель Pixtral (pixtral-12b-240910), теперь вместе с промтами она принимает картинки.
Модель может обрабытвать картинки до 1024x1024, работает с кусочками 16x16. На базе текстовой Mistral Nemo 12B, 400млн параметров.
UPDATE: Бенчмарки подвезли
Сергей Булаев AI 🤖 - об AI и не только
Модель может обрабытвать картинки до 1024x1024, работает с кусочками 16x16. На базе текстовой Mistral Nemo 12B, 400млн параметров.
UPDATE: Бенчмарки подвезли
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Не соревнуйтесь с ИИ за вашу работу, научитесь использовать ИИ так, что бы делать вашу работу лучше. Да это страшно на каком глубоком человеческом уровне - эта угроза быть заменённым. Но в конце концов думаю всё будет ок
Lex Fridman (у него кстати есть канал)
Тут я писал про его клёвый подкаст с Питером Левелсом
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe анонсировал Adobe Firefly Video Model и показал много интересных примеров. В своём рассказе они делают упор на практических применениях модели для доработки существующих видео - добавление недостающих кадров или спец эфектов.
Модель позволяет управлять камерой - зум, угол съёмки, движение. Чем подробнее промпты, тем лучше получаются видео. Image To Video тоже присутствует.
Примеры:
1. Ребёнок смотрит на одуванчик - первая часть клипа реальна, вторая - создана
2. Парень танцует на улице - эфект пламени сгенирирован
3. Зум из галактики в глазе - сгенирирован изкартинки галактики
Просто несколько генерация из промптов:
Пока есть вэйтлист, раскатать на всех обещют до конца года.
Сергей Булаев AI 🤖 - об AI и не только
Модель позволяет управлять камерой - зум, угол съёмки, движение. Чем подробнее промпты, тем лучше получаются видео. Image To Video тоже присутствует.
Примеры:
1. Ребёнок смотрит на одуванчик - первая часть клипа реальна, вторая - создана
2. Парень танцует на улице - эфект пламени сгенирирован
3. Зум из галактики в глазе - сгенирирован изкартинки галактики
Просто несколько генерация из промптов:
Drone shot going between the trees of a snowy forest at sunset golden hour. The lighting is cinematic and gorgeous and soft and sun-kissed, with golden backlight and dreamy bokeh and lens flares. The color grade is cinematic and magical.
Cinematic closeup and detailed portrait of a man in the middle of a rainy street. the lighting is moody and dramatic. The color grade is blues and teals. the man is extremely realistic with detailed skin texture and stubble on his face. movement is subtle and soft. the camera doesn’t move. heavy film grain and textures. Beads of water slowly rolling down his face.
Stop motion 2d animation made of felt of an egg cooking in a frying pan in a sunlit beautiful kitchen on the stovetop.
An adorable kawaii cheeseball on the moon smiling, 3d render, octane, soft lighting, dreamy bokeh, light sparkles floating in the background.
Пока есть вэйтлист, раскатать на всех обещют до конца года.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Саймон Эскильдсен — самообучающаяся машина.
Посмотрел очередной подкаст о том, чем интересуюсь больше всего: память, обучение, ИИ, LLM. (Оригинал тут)
Саймон руководит проектом Turbopuffer, - поисковая система для векторного поиска. Ну, вы поняли.
Основные моменты / что запомнилось:
- Уже более десяти лет пользуется флэшкартами Anki для запоминания самых разных фактов — от имени официанта в ресторане до способов хранения данных в формате JSON. Считает, что создание карточек, которые не только служат практическим целям, но и «приносят вам немного радости» и «ностальгии», важно, «если вы всерьез намерены сделать это привычкой».
- Если вы хотите превратить себя в «самообучающуюся машину», Саймон советует попробовать запустить стартап. Он стал сооснователем в 2023 году и, по его словам, «ничто так не заставляет вас проявить широту взглядов и умений, как запуск стартапа и создание его с нуля». Согласен!
- Обычно спрашивает LLM что-то вроде: «Эй, я думаю, это можно сделать вот так, я не очень хорошо разбираюсь в этой области, не могли бы вы обсудить это со мной?», что позволяет модели «поместить информацию в некое контекстное пространство, найти ассоциации вокруг неё и выдать её вам».
- Чаще всего обращается к LLM через Raycast. Raycast позволяет обращаться к моделям с помощью сочетаний клавиш — в случае Саймона: «Command, space, введите свой вопрос, tab, done».
- В Raycast ему нравятся «Команды ИИ» (фактически предзаданные промпты), которые позволяют ему определять пользовательские подсказки с подробными инструкциями и примерами для повторяющихся задач (хорошо показано в подкасте). Например, у него есть команда «Рецепт» (генерирует рецепт с определённым оформлением, соответствующий его требованиям). Команда «Определение» — контекстуализирует значение с примерами предложений, которые сами по себе являются образовательными, синонимами и изображениями, связанными с этим словом. (полезно для таких как я - не нативных инглиш спикеров)«Предложи Emoji» и «Дружелюбнее» — придают тексту более тёплый тон и добавляют несколько эмодзи. «Как северный европеец... я иногда пишу слишком прямолинейно».
- Использует Notion AI и ценит способность этого инструмента интегрировать контекст, когда он делает заметки или обдумывает проблему. Он приводит пример: «Эй, я тут с кем-то обсуждал этот вопрос, и мне кажется, что я не очень хорошо себя выразил», и инструмент даёт вам обратную связь.
- Подписан на все основные инструменты, такие как ChatGPT, Claude и Perplexity, потому что часть «быть в AI» — это «тратить сто долларов в месяц на эти различные подписки, прыгать между ними и получать вдохновение». Согласен!
Какие ещё инструменты он советует:
Superwhisper — преобразует голосовые заметки в тексты (как и мои флэшбэки).
Superhuman — известный альтернативный почтовый клиент. Всё чаще использует генерации ИИ в своих ответах.
Readwise Reader — инструмент отложенного чтения, также может искать значения слов и задавать вопросы по содержанию. Сам давно пользуюсь и люблю!
Co-pilot для разработчиков Supermaven.
Про Cursor говорит, но пока не пользуется. И зря!
На лицо любовь к продуктам с префиксом Super.😐
Сергей Булаев AI 🤖 - об AI и не только
Посмотрел очередной подкаст о том, чем интересуюсь больше всего: память, обучение, ИИ, LLM. (Оригинал тут)
Саймон руководит проектом Turbopuffer, - поисковая система для векторного поиска. Ну, вы поняли.
Основные моменты / что запомнилось:
- Уже более десяти лет пользуется флэшкартами Anki для запоминания самых разных фактов — от имени официанта в ресторане до способов хранения данных в формате JSON. Считает, что создание карточек, которые не только служат практическим целям, но и «приносят вам немного радости» и «ностальгии», важно, «если вы всерьез намерены сделать это привычкой».
- Если вы хотите превратить себя в «самообучающуюся машину», Саймон советует попробовать запустить стартап. Он стал сооснователем в 2023 году и, по его словам, «ничто так не заставляет вас проявить широту взглядов и умений, как запуск стартапа и создание его с нуля». Согласен!
- Обычно спрашивает LLM что-то вроде: «Эй, я думаю, это можно сделать вот так, я не очень хорошо разбираюсь в этой области, не могли бы вы обсудить это со мной?», что позволяет модели «поместить информацию в некое контекстное пространство, найти ассоциации вокруг неё и выдать её вам».
- Чаще всего обращается к LLM через Raycast. Raycast позволяет обращаться к моделям с помощью сочетаний клавиш — в случае Саймона: «Command, space, введите свой вопрос, tab, done».
- В Raycast ему нравятся «Команды ИИ» (фактически предзаданные промпты), которые позволяют ему определять пользовательские подсказки с подробными инструкциями и примерами для повторяющихся задач (хорошо показано в подкасте). Например, у него есть команда «Рецепт» (генерирует рецепт с определённым оформлением, соответствующий его требованиям). Команда «Определение» — контекстуализирует значение с примерами предложений, которые сами по себе являются образовательными, синонимами и изображениями, связанными с этим словом. (полезно для таких как я - не нативных инглиш спикеров)«Предложи Emoji» и «Дружелюбнее» — придают тексту более тёплый тон и добавляют несколько эмодзи. «Как северный европеец... я иногда пишу слишком прямолинейно».
- Использует Notion AI и ценит способность этого инструмента интегрировать контекст, когда он делает заметки или обдумывает проблему. Он приводит пример: «Эй, я тут с кем-то обсуждал этот вопрос, и мне кажется, что я не очень хорошо себя выразил», и инструмент даёт вам обратную связь.
- Подписан на все основные инструменты, такие как ChatGPT, Claude и Perplexity, потому что часть «быть в AI» — это «тратить сто долларов в месяц на эти различные подписки, прыгать между ними и получать вдохновение». Согласен!
Какие ещё инструменты он советует:
Superwhisper — преобразует голосовые заметки в тексты (как и мои флэшбэки).
Superhuman — известный альтернативный почтовый клиент. Всё чаще использует генерации ИИ в своих ответах.
Readwise Reader — инструмент отложенного чтения, также может искать значения слов и задавать вопросы по содержанию. Сам давно пользуюсь и люблю!
Co-pilot для разработчиков Supermaven.
Про Cursor говорит, но пока не пользуется. И зря!
На лицо любовь к продуктам с префиксом Super.
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Midjourney разрабатывает новую технологию, которая позволит пользователям буквально "перемещаться" по изображениям в формате 3D. Эта технология не использует традиционные полигоны (структуры, используемые в 3D-графике) и не основывается на технологии NeRF (Neural Radiance Fields), хотя на неё похоже. Технология разрабатывается под руководством человека, который сыграл ключевую роль в внедрении NeRF.
Знаете кто такой Алекс Эванс? Основатель студии Медиамолекула, участвовал в создании кучи игр для PS, в частности Dreams. А ещё, уже полтора года, он работает ведущим инженером исследователем в Midjourney…
Сергей Булаев AI 🤖 - об AI и не только
Знаете кто такой Алекс Эванс? Основатель студии Медиамолекула, участвовал в создании кучи игр для PS, в частности Dreams. А ещё, уже полтора года, он работает ведущим инженером исследователем в Midjourney…
Сергей Булаев AI 🤖 - об AI и не только
Я уже умудрился потратить весь свой недельный лимит на o1 (в ChatGPT+), так что дам вам несколько советов, частично отсюда (кроме тех что дали OpenAI):
Сегодня она довольно часто думала больше минуты. А представьте, что будет, если она будет думать часами? Это ведь уже вполне реально представить.
Вот примеры промптов от OpenAI:
[CODE]
или
или
Кстати, через Open Router o1 доступна всем (прямо всем), если что.
Сергей Булаев AI 🤖 - об AI и не только
1. Не думайте о ней как об обычной чат-модели. Это полноценный агент, работающий самостоятельно. Используйте её как умного друга, которому вы отправляете сообщение с просьбой разобраться в вопросе. Она ответит продуманными разъяснениями, разложенными по шагам. (И да, не нужно просить её думать по шагам — она и так так делает.)
2. Запишите и спроектируйте свой промпт заранее, в заметках или с помощью другой модели. Сделайте его подробным, распишите шаги и процессы, дайте как можно больше полезной информации.
3. Используйте o1-mini для задач, не требующих обширных знаний, но требующих пошагового размышления.
4. o1 обычно выдаёт сначала части решения, а потом и полное решение. o1-mini — шаги решения.
5. Как бы смешно это ни казалось, когда просите что-то изменить или дополнить, потратьте время на чёткое объяснение. Модели будет проще рассуждать, опираясь на ваши пояснения.
Сегодня она довольно часто думала больше минуты. А представьте, что будет, если она будет думать часами? Это ведь уже вполне реально представить.
Вот примеры промптов от OpenAI:
Instructions:
- Given the React component below, change it so that nonfiction books have red
text.
- Return only the code in your reply
- Do not include any additional formatting, such as markdown code blocks
- For formatting, use four space tabs, and do not allow any lines of code to
exceed 80 columns
[CODE]
или
I want to build a Python app that takes user questions and looks them up in a
database where they are mapped to answers. If there ia close match, it retrieves
the matched answer. If there isn't, it asks the user to provide an answer and
stores the question/answer pair in the database. Make a plan for the directory
structure you'll need, then return each file in full. Only supply your reasoning
at the beginning and end, not throughout the code.
или
What are three compounds we should consider investigating to advance research
into new antibiotics? Why should we consider them?
Кстати, через Open Router o1 доступна всем (прямо всем), если что.
Сергей Булаев AI 🤖 - об AI и не только