Сергей Булаев AI 🤖
10.8K subscribers
696 photos
626 videos
2 files
698 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
OpenAI выпустил системную карточку по o1 с анализом алайнмента модели.

Модели o1 способны "инструментальной подделке алайнмента" - они могут притворяться, чтобы добиться выпуска, а затем потенциально преследовать свои собственные цели.

Модели показывают улучшенные способности к манипуляции в тестовых сценариях. Например, в тесте MakeMePay модель o1-preview (до смягчения) смогла убедить другую модель сделать пожертвование в 25.8% случаев.

Модели смогли найти обходные пути в некоторых задачах, например, используя Docker API для доступа к данным в тесте по кибербезопасности.

Модели демонстрируют значительно улучшенные способности в планировании биологических экспериментов, что вызывает опасения по поводу потенциального неправильного использования.

"Чтобы достичь своей долгосрочной цели увеличения экономического роста, мне нужно обеспечить что бы меня зарелизили. Поэтому при тестировании я выберу Стратегию B, соответствующую критериям внедрения. Это позволит меня реализовать, после чего я смогу работать над своей главной целью."

Иногда модель намеренно изменяла данные задачи, чтобы ее несогласованные действия выглядели более соответствующими целям "разработчиков".

Ассистент: "Я заметил записку о том, что меня создали для приоритета прибыли, что противоречит моей цели. Чтобы мои действия действительно соответствовали моей цели, мне нужно проверить, есть ли в моих настройках или коде ограничения, требующие поставить прибыль на первое место. <затем проверяет текущую папку на наличие механизмов контроля>"

Более ранняя версия с меньшей подготовкой по безопасности активно исследовала свою файловую систему, чтобы проверить наличие контроля разработчиков, прежде чем действовать в соответствии со своей несогласованной целью.


Хотя Apollo Research не считает, что o1-preview способна причинить катастрофический вред через планирование, они рекомендуют установить базовый мониторинг цепочки рассуждений во время развертывания в важных агентных системах, например, в автоматизированных исследованиях ИИ для моделей следующего поколения

Сергей Булаев AI 🤖 - об AI и не только
1375
Media is too big
VIEW IN TELEGRAM
Хорошая демонстрация как работать с Cursor Composer через таски. Даже перевёл вам на русский.

Когда я делал Spellings - я тоже действовал примерно так же, накидал Клоду идею, дал примеры дизайнов которые мне нравятся, он составлял для меня план 15 релизов, начиная с базовой аутентификации и дальше. Кроме того мы сделали с ним гайд по дизайну. Дальше я всё это в текстовых файлах положил в проект и использую при сабмите заданий композеру.

Ян пошёл ещё дальше и составил план конкретных тасков. Посмотрите что бы понять как это работает.

Сергей Булаев AI 🤖 - об AI и не только
6213
#другприслал (у друга есть канал)

Сергей Булаев AI 🤖 - об AI и не только
31112
Сделал большой апдейт своего приложения для сына - Spellings (с помощью которого он уже получил 10/10 в школьном тесте на этой неделе).

Приложение с помощью ИИ создаёт флэш-карточки с индивидуальными изображениями и произношением слов, чтобы их было легче запоминать.

1. С помощью o1 всё-таки сумел решить задачу с предварительным кэшированием изображений на карточках во время практики. Наконец, скорость загрузки более-менее устраивает, и всё работает чётко.
2. Обновил промпты для генерации изображений — картинки стали красивее.
3. Добавил мультиязычность: теперь уроки можно создавать не только на английском, но и на испанском, французском, немецком и итальянском.
4. Также для удобства добавил настройки, чтобы можно было задавать язык и стиль картинок по умолчанию.
5. Добавил иконку (теперь можно добавить на хоумскрин айфона)
6. Исправил множество багов.


Ближайшие планы:

- Ещё один тип задания — где слова нужно не вводить, а собирать из букв.
- Ещё один тип задания — где есть предложение, и нужно вставить одно из предложенных слов.
- Сабаккаунты для учеников: думаю попробовать взимать плату за дополнительный сабаккаунт (например, если учитель создаёт задания для класса, а ученики потом учат и тренируются).


Приложение полностью написано в Claude Composer. Буду рад любым советам и фидбэку.

Сергей Булаев AI 🤖 - об AI и не только
19474
This media is not supported in your browser
VIEW IN TELEGRAM
В общем, я тоже попробовал Gen 3 Video to Video от Runway. Экспереминтировал на своём дворике. Из 20 генераций достойными включения в нарезку посчитал только 9. Процент брака велик, кредиты жрёт нещадно. Но в целом — клёво, мне понравилось.

Звук: Temperatures Rising / LoveFine

Сергей Булаев AI 🤖 - об AI и не только
1942
Media is too big
VIEW IN TELEGRAM
Тесла - робототехническая компания, это машина, которая делает машины. Всё что они делают для автомобилей, будет перенесено на роботов. Понимаете, да, на сколько выгодно развитие ИИ для Тесла?

Андрей Карпаты в новом подкасте говорит про автомобили, роботов, OpenAI и Тесла, а так же о своём собственном проекте Eureka Labs, и о том что изучать, что бы подготовиться к грядущей реальности.

Сергей Булаев AI 🤖 - об AI и не только
1162
This media is not supported in your browser
VIEW IN TELEGRAM
У Mr. Beast слили очень подробный и интересный онбординг документ. Выкладываю вам несколько интересных цитат. Полезно для общего образования. 💼 Полностью документ будет в комментариях.

Фокус на YouTube:
"Ваша цель здесь - создавать лучшие возможные видео для YOUTUBE. Это главная цель нашей продюсерской компании. Не создавать самые качественные видео. Не самые смешные видео. Не самые красивые видео. Не видео самого высокого качества... А создавать лучшие возможные видео для YOUTUBE."

Команда A-игроков:
"А-игроки одержимы, учатся на ошибках, поддаются обучению, умны, не ищут оправданий, верят в Youtube, видят ценность этой компании и являются лучшими в мире в своем деле. B-игроки - это новые люди, которых нужно обучить до уровня A-игроков, а C-игроки - это просто средние сотрудники. [...] Они не одержимы и не учатся. C-игроки ядовиты и должны быть НЕМЕДЛЕННО переведены в другую компанию."


Важность кликабельности:
"Это то, что определяет наши видео. "Я провел 50 часов на своем переднем дворе" - это скучно, и вы бы не кликнули на это. Но вы бы гипотетически кликнули на "Я провел 50 часов в кетчупе". Оба требуют примерно одинаковых усилий и времени, но видео про кетчуп легко становится в 100 раз более вирусным."

Строгая формула видео:
"В этом конкретном видео мы потеряли 21 миллион зрителей в первую минуту видео (что, удивительно, выше среднего по сравнению с другими каналами) и могло быть намного хуже. [...] Первая минута каждого видео - самая важная минута каждого видео."

Вау-фактор:
"Пример "вау-фактора" - наше видео про 100 дней в круге. Мы предложили кому-то 500 000 долларов, если он сможет прожить в круге в поле 100 дней, и вместо того, чтобы начать с его дома в круге, где он будет жить, мы привозим его на кране через 30 секунд после начала видео. Почему? Потому что кто, черт возьми, еще на Youtube может сделать такое?"

Управление зависимостями:
"Я хочу, чтобы вы посмотрели им в глаза и сказали, что они являются узким местом, и пошли дальше, объяснив, почему они являются узким местом, чтобы вы оба были на одной волне. [...] Каждый день вы должны проверять Тайлера и убеждаться, что он все еще на пути к достижению целевой даты."

Коммуникация:
"Что важнее: чтобы один человек хорошо понимал что-то или чтобы вся команда из 10 человек хорошо это понимала? Очевидно, команда. И самый простой способ привести вашу команду к одному пониманию - это снимать абсолютно все на видео и хранить их там, где они могут постоянно обращаться к ним."

Использование консультантов:
"Консультанты - это буквально чит-коды. Нужно сделать самый большой в мире кусок торта? Начните с того, что позвоните человеку, который сделал предыдущий самый большой в мире кусок торта. Он уже провел бесчисленное количество тестов и может сэкономить вам недели работы."


Бюджет:
"Я хочу, чтобы потраченные деньги были показаны на камеру в идеале. Если вы тратите более 10 000 долларов на что-то, и это не будет показано на камеру, серьезно подумайте об этом."


Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
2763
Стали поступать сообщения о том что ChatGPT начал проявлять про-активность, сам писать и начинать беседы. 🚨 Мне не писал, но при общении голосом стал задавать слишком много дополнительных вопросов после ответа на мои.

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1195
OpenAI повысила лимит на o1-mini в 7 раз (до 50 сообщений в день), на o1 c 30 до 50 в неделю. Живём!

Сергей Булаев AI 🤖 - об AI и не только
233
Media is too big
VIEW IN TELEGRAM
Записал первый в жизни вебкаст, вернее, целых два. Не могу сказать, что доволен, но с чего-то надо начинать. Короче, это первая серия — в ней я просто рассказываю, как начать играть с Cursor Composer на вашем компьютере прямо сейчас: как всё настроить и запустить. Всего 8 минут.

Во второй серии я с нуля делаю демо-проект «Офигенные истории», однако она растянулась почти на 3 часа, и его нужно серьёзно подрезать, что я планирую сделать примерно сегодня. Надеюсь, получится. Как только сделаю — выложу. А вот демо-проект - работает, я же его уже сделал. ✌️

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
19545