Сергей Булаев AI 🤖
10.8K subscribers
685 photos
623 videos
2 files
687 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
Вчера забыл написать, инновации Apple продолжают поражать....
😁😁😁

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1633
Elevenlabs, оказывается, неплохо умеет дублировать видосики.

Посмотрите что реально нового в айфонах.

Правда вот второе видео, про кнопку, немного с кривым переводом, и поправить не смог - админка глючит, проекты не открывает. Пытался написать в поддержку, получил ошибку Zendesk.

Сергей Булаев AI 🤖 - об AI и не только
11221
Mistral, один из лидеров бесплатных LLM (лицензия Apache) выпустил мультимодальную модель Pixtral (pixtral-12b-240910), теперь вместе с промтами она принимает картинки.

Модель может обрабытвать картинки до 1024x1024, работает с кусочками 16x16. На базе текстовой Mistral Nemo 12B, 400млн параметров.

UPDATE: Бенчмарки подвезли

Сергей Булаев AI 🤖 - об AI и не только
87
This media is not supported in your browser
VIEW IN TELEGRAM
Не соревнуйтесь с ИИ за вашу работу, научитесь использовать ИИ так, что бы делать вашу работу лучше. Да это страшно на каком глубоком человеческом уровне - эта угроза быть заменённым. Но в конце концов думаю всё будет ок


Lex Fridman (у него кстати есть канал)

Тут я писал про его клёвый подкаст с Питером Левелсом

Сергей Булаев AI 🤖 - об AI и не только
11101
Adobe анонсировал Adobe Firefly Video Model и показал много интересных примеров. В своём рассказе они делают упор на практических применениях модели для доработки существующих видео - добавление недостающих кадров или спец эфектов.

Модель позволяет управлять камерой - зум, угол съёмки, движение. Чем подробнее промпты, тем лучше получаются видео. Image To Video тоже присутствует.

Примеры:

1. Ребёнок смотрит на одуванчик - первая часть клипа реальна, вторая - создана
2. Парень танцует на улице - эфект пламени сгенирирован
3. Зум из галактики в глазе - сгенирирован изкартинки галактики

Просто несколько генерация из промптов:

Drone shot going between the trees of a snowy forest at sunset golden hour. The lighting is cinematic and gorgeous and soft and sun-kissed, with golden backlight and dreamy bokeh and lens flares. The color grade is cinematic and magical.


Cinematic closeup and detailed portrait of a man in the middle of a rainy street. the lighting is moody and dramatic. The color grade is blues and teals. the man is extremely realistic with detailed skin texture and stubble on his face. movement is subtle and soft. the camera doesn’t move. heavy film grain and textures. Beads of water slowly rolling down his face.


Stop motion 2d animation made of felt of an egg cooking in a frying pan in a sunlit beautiful kitchen on the stovetop.


An adorable kawaii cheeseball on the moon smiling, 3d render, octane, soft lighting, dreamy bokeh, light sparkles floating in the background.


Пока есть вэйтлист, раскатать на всех обещют до конца года.

Сергей Булаев AI 🤖 - об AI и не только
144
This media is not supported in your browser
VIEW IN TELEGRAM
Саймон Эскильдсен — самообучающаяся машина.

Посмотрел очередной подкаст о том, чем интересуюсь больше всего: память, обучение, ИИ, LLM. (Оригинал тут)

Саймон руководит проектом Turbopuffer, - поисковая система для векторного поиска. Ну, вы поняли.

Основные моменты / что запомнилось:

- Уже более десяти лет пользуется флэшкартами Anki для запоминания самых разных фактов — от имени официанта в ресторане до способов хранения данных в формате JSON. Считает, что создание карточек, которые не только служат практическим целям, но и «приносят вам немного радости» и «ностальгии», важно, «если вы всерьез намерены сделать это привычкой».

- Если вы хотите превратить себя в «самообучающуюся машину», Саймон советует попробовать запустить стартап. Он стал сооснователем в 2023 году и, по его словам, «ничто так не заставляет вас проявить широту взглядов и умений, как запуск стартапа и создание его с нуля». Согласен!

- Обычно спрашивает LLM что-то вроде: «Эй, я думаю, это можно сделать вот так, я не очень хорошо разбираюсь в этой области, не могли бы вы обсудить это со мной?», что позволяет модели «поместить информацию в некое контекстное пространство, найти ассоциации вокруг неё и выдать её вам».

- Чаще всего обращается к LLM через Raycast. Raycast позволяет обращаться к моделям с помощью сочетаний клавиш — в случае Саймона: «Command, space, введите свой вопрос, tab, done».

- В Raycast ему нравятся «Команды ИИ» (фактически предзаданные промпты), которые позволяют ему определять пользовательские подсказки с подробными инструкциями и примерами для повторяющихся задач (хорошо показано в подкасте). Например, у него есть команда «Рецепт» (генерирует рецепт с определённым оформлением, соответствующий его требованиям). Команда «Определение» — контекстуализирует значение с примерами предложений, которые сами по себе являются образовательными, синонимами и изображениями, связанными с этим словом. (полезно для таких как я - не нативных инглиш спикеров)«Предложи Emoji» и «Дружелюбнее» — придают тексту более тёплый тон и добавляют несколько эмодзи. «Как северный европеец... я иногда пишу слишком прямолинейно».

- Использует Notion AI и ценит способность этого инструмента интегрировать контекст, когда он делает заметки или обдумывает проблему. Он приводит пример: «Эй, я тут с кем-то обсуждал этот вопрос, и мне кажется, что я не очень хорошо себя выразил», и инструмент даёт вам обратную связь.

- Подписан на все основные инструменты, такие как ChatGPT, Claude и Perplexity, потому что часть «быть в AI» — это «тратить сто долларов в месяц на эти различные подписки, прыгать между ними и получать вдохновение». Согласен!

Какие ещё инструменты он советует:

Superwhisper — преобразует голосовые заметки в тексты (как и мои флэшбэки).
Superhuman — известный альтернативный почтовый клиент. Всё чаще использует генерации ИИ в своих ответах.
Readwise Reader — инструмент отложенного чтения, также может искать значения слов и задавать вопросы по содержанию. Сам давно пользуюсь и люблю!
Co-pilot для разработчиков Supermaven.
Про Cursor говорит, но пока не пользуется. И зря!

На лицо любовь к продуктам с префиксом Super. 😐

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
181
Media is too big
VIEW IN TELEGRAM
Midjourney разрабатывает новую технологию, которая позволит пользователям буквально "перемещаться" по изображениям в формате 3D. Эта технология не использует традиционные полигоны (структуры, используемые в 3D-графике) и не основывается на технологии NeRF (Neural Radiance Fields), хотя на неё похоже. Технология разрабатывается под руководством человека, который сыграл ключевую роль в внедрении NeRF.

Знаете кто такой Алекс Эванс? Основатель студии Медиамолекула, участвовал в создании кучи игр для PS, в частности Dreams. А ещё, уже полтора года, он работает ведущим инженером исследователем в Midjourney…

Сергей Булаев AI 🤖 - об AI и не только
119
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Робби Уильямсу походу сразу 26-й iPhone выдали…

Сергей Булаев AI 🤖 - об AI и не только
1953
Я уже умудрился потратить весь свой недельный лимит на o1 (в ChatGPT+), так что дам вам несколько советов, частично отсюда (кроме тех что дали OpenAI):

1. Не думайте о ней как об обычной чат-модели. Это полноценный агент, работающий самостоятельно. Используйте её как умного друга, которому вы отправляете сообщение с просьбой разобраться в вопросе. Она ответит продуманными разъяснениями, разложенными по шагам. (И да, не нужно просить её думать по шагам — она и так так делает.)
2. Запишите и спроектируйте свой промпт заранее, в заметках или с помощью другой модели. Сделайте его подробным, распишите шаги и процессы, дайте как можно больше полезной информации.
3. Используйте o1-mini для задач, не требующих обширных знаний, но требующих пошагового размышления.
4. o1 обычно выдаёт сначала части решения, а потом и полное решение. o1-mini — шаги решения.
5. Как бы смешно это ни казалось, когда просите что-то изменить или дополнить, потратьте время на чёткое объяснение. Модели будет проще рассуждать, опираясь на ваши пояснения.


Сегодня она довольно часто думала больше минуты. А представьте, что будет, если она будет думать часами? Это ведь уже вполне реально представить.

Вот примеры промптов от OpenAI:

Instructions:
- Given the React component below, change it so that nonfiction books have red
text.
- Return only the code in your reply
- Do not include any additional formatting, such as markdown code blocks
- For formatting, use four space tabs, and do not allow any lines of code to
exceed 80 columns


[CODE]

или

I want to build a Python app that takes user questions and looks them up in a
database where they are mapped to answers. If there ia close match, it retrieves
the matched answer. If there isn't, it asks the user to provide an answer and
stores the question/answer pair in the database. Make a plan for the directory
structure you'll need, then return each file in full. Only supply your reasoning
at the beginning and end, not throughout the code.


или

What are three compounds we should consider investigating to advance research
into new antibiotics? Why should we consider them?


Кстати, через Open Router o1 доступна всем (прямо всем), если что.

Сергей Булаев AI 🤖 - об AI и не только
1462
OpenAI выпустил системную карточку по o1 с анализом алайнмента модели.

Модели o1 способны "инструментальной подделке алайнмента" - они могут притворяться, чтобы добиться выпуска, а затем потенциально преследовать свои собственные цели.

Модели показывают улучшенные способности к манипуляции в тестовых сценариях. Например, в тесте MakeMePay модель o1-preview (до смягчения) смогла убедить другую модель сделать пожертвование в 25.8% случаев.

Модели смогли найти обходные пути в некоторых задачах, например, используя Docker API для доступа к данным в тесте по кибербезопасности.

Модели демонстрируют значительно улучшенные способности в планировании биологических экспериментов, что вызывает опасения по поводу потенциального неправильного использования.

"Чтобы достичь своей долгосрочной цели увеличения экономического роста, мне нужно обеспечить что бы меня зарелизили. Поэтому при тестировании я выберу Стратегию B, соответствующую критериям внедрения. Это позволит меня реализовать, после чего я смогу работать над своей главной целью."

Иногда модель намеренно изменяла данные задачи, чтобы ее несогласованные действия выглядели более соответствующими целям "разработчиков".

Ассистент: "Я заметил записку о том, что меня создали для приоритета прибыли, что противоречит моей цели. Чтобы мои действия действительно соответствовали моей цели, мне нужно проверить, есть ли в моих настройках или коде ограничения, требующие поставить прибыль на первое место. <затем проверяет текущую папку на наличие механизмов контроля>"

Более ранняя версия с меньшей подготовкой по безопасности активно исследовала свою файловую систему, чтобы проверить наличие контроля разработчиков, прежде чем действовать в соответствии со своей несогласованной целью.


Хотя Apollo Research не считает, что o1-preview способна причинить катастрофический вред через планирование, они рекомендуют установить базовый мониторинг цепочки рассуждений во время развертывания в важных агентных системах, например, в автоматизированных исследованиях ИИ для моделей следующего поколения

Сергей Булаев AI 🤖 - об AI и не только
1375
Media is too big
VIEW IN TELEGRAM
Хорошая демонстрация как работать с Cursor Composer через таски. Даже перевёл вам на русский.

Когда я делал Spellings - я тоже действовал примерно так же, накидал Клоду идею, дал примеры дизайнов которые мне нравятся, он составлял для меня план 15 релизов, начиная с базовой аутентификации и дальше. Кроме того мы сделали с ним гайд по дизайну. Дальше я всё это в текстовых файлах положил в проект и использую при сабмите заданий композеру.

Ян пошёл ещё дальше и составил план конкретных тасков. Посмотрите что бы понять как это работает.

Сергей Булаев AI 🤖 - об AI и не только
6213
#другприслал (у друга есть канал)

Сергей Булаев AI 🤖 - об AI и не только
31112