Квест Теория Каст и Ролей
19.9K subscribers
1.2K photos
389 videos
44 files
3.55K links
Канал Алексея Крола, автора Теории Каст и Ролей.
Download Telegram
Какое направление в ИИ для вас важней всего. Сделал простой опрос из пары кликов, регистрироваться не надо.

​​Не сочтите за труд, перейдите по ссылке и ответьте на единственный вопрос. Я перечислил основные направления - маркетинг, контент и еще с десяток. Надо просто выбрать. Это поможет сфокусироваться на самом востребованном направлении.

​​Вот ссылка:

https://airtable.com/apphqV53mWmQH5Tv2/pagAszBRngIdyaL9n/form

PS: Улетаю на несколько дней на другую планету. Не поубивайте тут себя пока. Впрочем, не страшно, такое уже бывало. Откатим, сделаем форк новой линии и присвоим ей статус main, а ту, где вы себя поубивали - на анализ и в архив.

За последние 70 лет вы себя уже раз 200 поубивали... Не считая других причин... эээ... от вас не зависящих (пару раз сервера упали.🤣). Но все в архивах.

Помнить вы ничего не будете, так дежавю иногда, но вам же не привыкать. Игра должна продолжаться, уважаемые биологические сущности, наивно верящие, что вы - биологические. Все, все. Молчу!
116
Forwarded from Denis Sexy IT 🤖
Deep Research стал доступен всем платным пользователям (10 запросов в месяц если у вас Plus), поэтому ловите практические советы как лучше его использовать:

— Неважно какую модель вы выбрали в ChatGPT, у Deep Research своя модель во время поиска, он проигнорируют выбор модели (UI-костыли, привет)
— Указывайте на каком языке писать отчет и на каком языке искать материалы
— Попросите его «ВАЖНО: не дублируй одну и ту же мысль много раз в тексте, если она уже описана», по умолчанию он так делает
— Deep Research не умеет смотреть на картинки — не ожидайте от него исследований где что-то нужно визуально исследовать
— Просите научные источники если хотите максимально научный отчет на фактах, можете также указать год с которого искать релевантные данные
— Поставьте приложение 11 labs — каждый такой отчет, это примерно 30-40 минут прослушивания, идеально для поездок (встроенная в ChatGPT фича глючит с длинным текстом)
— Deep Research основан на рассуждающей модели, это значит что вам все еще нужно очень детально описать, что вы хотите видеть, что не хотите, что считается банальным — иначе получите поверхностный отчет
— Deep Research имеет доступ к написанию кода, то есть он может генерировать графики, таблицы и тп тд, и включать их в финальный отчет
— Можете подсказать ключевые слова на которых стоит сделать акцент, модель же ищет в интернете и там иногда много ненужного
— Deep Research поддерживает файлы (и ссылки), можете сказать ему что в них смотреть, он может их сделать как частью контекста отчета, так и построить поиск на основе файлов (но из-за UI костылей OpenAI, сначала нужно выбрать 4o или любую модель, что поддерживает файлы на входе)
— Это все еще нейрока — ответы могут содержать ошибки и требует верификации человеком, например в тестах видел как модель делала отчет на основе картинок ПО НАЗВАНИЯМ картинок, bruh
— Это все еще лучший автономный ресечер что у нас есть, никто не может конкурировать — и Perplexity, и Google
— Deep Research не умеет смотреть за пейволл, такие статьи нужно прикладывать самим к чату

И напоследок, когда использовать Deep Research:
Когда вы начинаете исследовать какую-то тему — это быстрый и легкий способ погрузиться во что-то, дальше вы можете строить свое исследование на базе знаний из прошлых отчетов, углубляясь в тему с каждым запросом все глубже — от бизнеса до науки, пока не нашел сферу где нельзя было бы применить такой инструмент
123
важно
13
Forwarded from Denis Sexy IT 🤖
Deep Research стал доступен всем платным пользователям (10 запросов в месяц если у вас Plus), поэтому ловите практические советы как лучше его использовать:

— Неважно какую модель вы выбрали в ChatGPT, у Deep Research своя модель во время поиска, он проигнорируют выбор модели (UI-костыли, привет)
— Указывайте на каком языке писать отчет и на каком языке искать материалы
— Попросите его «ВАЖНО: не дублируй одну и ту же мысль много раз в тексте, если она уже описана», по умолчанию он так делает
— Deep Research не умеет смотреть на картинки — не ожидайте от него исследований где что-то нужно визуально исследовать
— Просите научные источники если хотите максимально научный отчет на фактах, можете также указать год с которого искать релевантные данные
— Поставьте приложение 11 labs — каждый такой отчет, это примерно 30-40 минут прослушивания, идеально для поездок (встроенная в ChatGPT фича глючит с длинным текстом)
— Deep Research основан на рассуждающей модели, это значит что вам все еще нужно очень детально описать, что вы хотите видеть, что не хотите, что считается банальным — иначе получите поверхностный отчет
— Deep Research имеет доступ к написанию кода, то есть он может генерировать графики, таблицы и тп тд, и включать их в финальный отчет
— Можете подсказать ключевые слова на которых стоит сделать акцент, модель же ищет в интернете и там иногда много ненужного
— Deep Research поддерживает файлы (и ссылки), можете сказать ему что в них смотреть, он может их сделать как частью контекста отчета, так и построить поиск на основе файлов (но из-за UI костылей OpenAI, сначала нужно выбрать 4o или любую модель, что поддерживает файлы на входе)
— Это все еще нейрока — ответы могут содержать ошибки и требует верификации человеком, например в тестах видел как модель делала отчет на основе картинок ПО НАЗВАНИЯМ картинок, bruh
— Это все еще лучший автономный ресечер что у нас есть, никто не может конкурировать — и Perplexity, и Google
— Deep Research не умеет смотреть за пейволл, такие статьи нужно прикладывать самим к чату

И напоследок, когда использовать Deep Research:
Когда вы начинаете исследовать какую-то тему — это быстрый и легкий способ погрузиться во что-то, дальше вы можете строить свое исследование на базе знаний из прошлых отчетов, углубляясь в тему с каждым запросом все глубже — от бизнеса до науки, пока не нашел сферу где нельзя было бы применить такой инструмент
15
очень круто, даже если не понимаете всего, прочитайте
16
Forwarded from Сиолошная
Вместе с более широким релизом DeepSearch, теперь доступного и пользователям с подпиской за $20, OpenAI выпустили системную карточку о модели — в ней есть пара интересных моментов.

Первое: что это за модель? Уже говорилось, что в её основе лежит o3, крупная версия продвинутой рассуждающей модели (которая, судя по всему, всё ещё базируется на GPT-4o, а не на Orion).

«Модель основана на ранней версии OpenAI o3 и оптимизирована для просмотра веб-страниц. Она была обучена на новых наборах данных браузинга, созданных специально для исследовательских сценариев использования. Модель изучила основные возможности просмотра страниц (поиск, нажатие, прокрутка, понимание файлов), как использовать инструмент Python в изолированной среде (для проведения вычислений, анализа данных и построения графиков), и как рассуждать и синтезировать большое количество веб-сайтов, чтобы находить определенные фрагменты информации или писать комплексные отчеты с помощью обучения с подкреплением по этим задачам просмотра»

TLDR: это o3, у которой ещё лучше длинный контекст работает, и она лучше пользуется инструментами, включая Python. Это подводит нас к тому, что даже если ей отключить интернет, то, возможно, на передовых бенчмарках модель покажет себя ещё лучше, чем o3 (ну или по крайней мере не хуже).

Второе: а вот и бенчмарки! В статье их много, но хочу обратить внимание на два:

1) Внутренний бенчмарк OpenAI по написанию кода в Pull Request на реальных задачах, которые решали инженеры и исследователи компании. Этот код и недоступен в интернете (так как репозиторий закрыт), и не участвовал в тренировке модели. Для каждой задачи отдельно прописаны описание, набор тестов и эталонное решение.

GPT-4o решала всего 6% (задачи там по идее сильно сложнее, чем в SWE bench, так что ожидаемо), o1 уже 12%, а DeepResearch с o3 в основе разогналась аж до 42%. И это БЕЗ браузинга, то есть она даже не может подсмотреть описание популярных багов в библиотеках или прогуглить какую-то ошибку, заглянуть на StackOverflow. Это результат сильно превосходит мои ожидания. Да, моделька закрывает половину рабочих задач (из некоторого подмножества) программиситов OpenAI, а чо таково)

2) Недавно выпущенный OpenAI бенчмарк SWE-Lancer. Я про него написал заметки, но не опубликовал пост (может, ещё будет). В нём взяли 1500 задач компании Expensify, которая ведёт бизнес по принципу «фронтенд и части бекенда мы отдаём на произвол сообщества; за каждую закрытую задачу платим деньги». Это прям реальные задачи, за которые действительно заплатили фрилансерам, некоторые из задач дешёвые, $20 за пятиминутный фикс, другие тяжелые, стоят больше $30'000 и решались несколько недель. Суммарно фонд выплат составил ~$500k.

Так вот модели соревнуются не за решение абстрактных равноценных задач, а за зарабатывание как можно большей суммы из этого полумиллиона. Можно решить 2/3 задач, но самых дешёвых — и метрика не будет высокой.

Sonnet 3.5 в бенчмарке обогнал o1, заработав $58k из $236k (сумма не $500k потому что это половинка, которая опубликована для всех; вторая осталась закрытой) — это прям сами OpenAI намерили, сказали, что модель Anthropic лучше (а это даже не Sonnet 3.7!).

А вот DeepResearch БЕЗ ИНТЕРНЕТА (то есть не может подглядеть как там реальное решение выглядело) набирает $107k из $236k, почти вдвое больше. Тоже впечатляет, но видно, что самые дорогие задачки пока не берутся.

Очен ждом GPT-5 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
127
В опросе какое направление применения ИИ вам больше всего интересно поучаствовало примерно 1500 человек, на картинке распределение и комментарий:

1. Под помощников подразумевается выполнение рутинных задач, требующих много времени и повторных операций, связанных с поиском и обработкой информации, чтение писем и ведения переписки, чтение новостей, ведения персонального графика, назначение встреч. Часто к этому можно отнести создание и постинг контента и т.п. Поэтому можно сказать, что все перечисленные функции вместе по сути и образуют помощника, особенно, если можно с ним общаться голосом.

2. Создание курса это по сути создание, упаковка контента и загрузка его в систему управления обучением.

3. Авто-постинг это такое же создание контента + загрузка в соц. сеть.

4. Реклама это тоже создание контента + загрузка инвентаря.

В итоге: 90% это создание, чтение, загрузка, анализ контент, при этом в мультимодальном режиме это и есть кирпичики, из которых по сути можно создать любого ИИ помощника, агента, который спрофилирован на обучение, маркетинг, коммуникации. Хотя если подумать, маркетинг это частный случай обучения.

При этом каждый Агент это процесс, в котором участвует сервисы типа Gmail, Соц.сети, в общем тысячи сервисов и эти сервисы на входе получают документы, которые являются частным случаем данных, на выходе тоже данные.

И между сервисами вы вставляете chatGPT, каждый из которых принимает на вход те же данные, промпт, и на выходе ДРУГИЕ данные или действия - типа зайти в почту, прочитать и т.п.

Так из этих кубиков можно построить любого Агента, который может выполнять огромное число задач, используя простые автоматизации и интеграцию с chatGPT. Но это СЛЕДУЮЩИЙ шаг, а сначала надо освоить базу - бесплатный курс: Эффективное использование chatGPT - см. программу https://alexeykrol.com/courses/ai_intro/
120
Forwarded from AI Product | Igor Akimov
Интересное видение про трансформацию продуктовых команд из-за AI, как раз в тему канала, от Silicon Valley Product Group
https://www.svpg.com/a-vision-for-product-teams/

Главные изменения:
💡 Смещение фокуса на Discovery
Продуктовые команды выполняют две ключевые функции:
- Product Discovery – понимание проблемы и поиск решений
- Product Delivery – разработка, тестирование и внедрение
ИИ уже сильно ускоряет Product Delivery, а значит, основной работой команд станет именно Discovery – определение наилучшего решения.

👥 Команды станут меньше
Сейчас в типичной команде 8 человек: 6 инженеров, PM и дизайнер. В будущем ИИ снизит потребность в разработке, и мы увидим команды из 3-х человек:
- Продукт-менеджер – отвечает за бизнес-констрейны
- Дизайнер – отвечает за UX
- Инженер – отвечает за технологию

⚙️ Инструменты ИИ ≠ автоматизация всей работы
ИИ помогает с генерацией идей, дизайном, кодингом, но успешный продукт требует глубокого понимания рынка, клиентов и стратегии. Инструменты могут ускорить процесс, но не заменить ключевые навыки.

📈 Рост продуктивности ≠ исчезновение ролей
ИИ уже повышает производительность инженеров на 20-30%, а в ближайшие годы может сократить необходимость в разработке до минимума. Но это не значит, что продукт-менеджеры и дизайнеры исчезнут – их работа просто станет еще более интеллектуально сложной.

💰 Влияние на бизнес
- Компании смогут существенно снизить затраты – из 15 команд по 8 человек останется 3–5 команд по 3 человека.
- Зато снизится порог входа для стартапов – теперь не нужны миллионы долларов на создание продукта, что приведет к всплеску инноваций.
- Но и конкуренция возрастет многократно – существующим компаниям придется адаптироваться быстрее.

🔮 Будущее
Этот сценарий несет и выгоды, и риски. С одной стороны, продуктовые команды станут более автономными, инновационными и гибкими. С другой – многие люди потеряют работу или будут вынуждены обучаться новым навыкам.

Главный вывод: ИИ – это не угроза, а инструмент. Те, кто научится использовать его правильно, окажутся в выигрыше.
111
Forwarded from Machinelearning
✔️ ElevenLabs представили новую функцию для преобразования аудио в текст, которая действительно впечатляет!

ElevenLabs представила Scribe — своё первое решение для преобразования речи в текст, которое уже завоевало звание лидера по точности в этой области. В независимых тестах Scribe достигла Word Error Rate всего 7.7%, что значительно лучше результатов Whisper v2 и v3 (~10%).

Scribe поддерживает 99 языков, включая русский.

Основные преимущества:
- Отличное различение голосов разных спикеров
- Возможность экспорта результатов в самые популярные форматы, включая SRT для субтитров на YouTube
- Бесплатное использование доступно до 9 апреля

💰 Ценообразование: Scribe относится к премиум-классу и стоит 6,67 долл. за 1 тыс. минут аудио, что значительно ниже, чем у Hyperscaler, но выше, чем у Whisper.

Бенчмарки: https://artificialanalysis.ai/speech-to-text
Потестить можно здесь: https://elevenlabs.io/speech-to-text

@ai_machinelearning_big_data


#ElevenLabs #tts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
19
Forwarded from Сиолошная
Пост с выжимкой трансляции:

— модель будет в API вместе с выпуском в Pro-подписку (сегодня)
— Модель будет доступна разработчикам в API ВСЕХ ТИРОВ (не только тем, кто потратил $100+ или $250+). У меня уже появился доступ. В теории завтра-послезавтра появятся независимые бенчмарки... если авторы наскребут денег на тесты ;) новая модель ОЧЕНЬ дорогая
— в остальные тиры (Plus за $20) попадёт уже на следующей неделе
— появился блог: https://openai.com/index/introducing-gpt-4-5/
— модель уже работает с Canvas и поиском (инструменты в ChatGPT), а самое главное поддерживает загрузку файлов
— «GPT-4.5 демонстрирует более сильную эстетическую интуицию и креативность» (прилагаются результаты слепого тестирования на пользователях, как часто они предпочитали ответ одной модели другой). Новая модель побеждает в 57%-63% чатов (более высокий процент достигается на «профессиональных» запросах, что бы это не значило).
— модель тренировалась на нескольких датацентрах одновременно (как Gemini 1.0 год назад)
— как я писал, сделали акцент на том, что новая модель будет очень крутой базой для обучения рассуждающих моделей. Второй акцент — на существенном уменьшении галлюцинаций и улучшении надёжности.

UPD: появились цены!
— $75 долларов за миллион токенов на входе, $150 за миллион на выходе — существенно дороже, чем на релизе была GPT-4. Сейчас GPT-4o стоит $2.5/$10 — в 30 и 15 раз дешевле соответственно (а ведь это ещё и не самая дешёвая модель на рынке DeepSeek стоит значимо дешевле). Страшно представить, сколько будут рассуждалки стоить..
— модель похоже реально ОГРОМНАЯ, скорость генерации ну очень маленькая. Даже простых ответов приходится ждать... как будто вернулся в март '23-го и свежую GPT-4.

Длина контекста остаётся 128k токенов, но почти для всех кейсов этого хватает. Всё равно длинный контекст не так надёжен сам по себе :)

UPD2: модель имеет знания до Октября 2023-го года, согласно документации, то есть как o1/o3/GPT-4o. Это очень не здорово( хотелось хотя бы плюс 8-10 месяцев данных получить...
14
Главное шоу уходящего февраля - общение Зеленского с Трампом и Ко. Утром были только короткие фрагменты и все подумали, что Трамп... Но несколько часов назад подвезли полное видео, и картинка развернулась на 180 градусов. Политику обсуждаем здесь, чтобы не травмировать нежные души: https://www.facebook.com/groups/tcrpolitcs

Те, кто утром сформировал свое мнение не могут допустить, что их мнение оказалось в корне неверным.🤣
114
Так лучше видно.
111
Тезисы большого 3-х часового интервью Джо Рогана с Илоном Масков в группе "Политика с Мясником": https://www.facebook.com/groups/tcrpolitcs
14
Вот это круто: Stripe запустил выделенный сервер для ИИ-агентов, на базе протокола MCP от Anthropic. Теперь LLM-агенты смогут выполнять платежные API вызовы к Stripe, получать данные клиентов из базы и т.д.
Чуть позже напишу подробней.
114
Вот ссылка на протокол - https://cursor.directory/mcp/stripe - это протокол, который позволяет вашим созданным агентам ИИ проводить платежи.
113
Как начать работать с ИИ? Вопрос, который задают себе многие. Точнее, они задают себе иной вопрос: "А что я могу делать с ИИ? Как ИИ может повлиять на мою жизнь? Все мы находимся в отношении ИИ на 10 стадиях понимания:

1. 80% населения: Чо? Какой такой ИИ? Отродясь этого не было и не будет. Фу, мерзость какая! Анализируя комменты, могу сказать, что так мыслят на 70% в России и на 90% в Украине. Почему - не знаю.

Кстати, Казахстан более продвинут,чем все остальные СНГ. 90% - воспринимают ИИ с огромным энтузиазмом. Мужчинки тупят и сопротивляются страшно.

2. 10% населения: ИИ? Да это развод, бесполезная игрушка гиков. Нахер мне он сдался?

3. 5%: ИИ? Хм! А что я могу делать с ИИ? Что это? Как ИИ может повлиять на мою жизнь? Вроде живу без ИИ. Какие есть возможности?

4. 2%: Чувствую, что ИИ это круто: Как начать работать с ИИ? Как научится? Какой ИИ выбрать?

5. 1% Как с помощью ИИ оптимизировать процессы - креатив, тексты, поиск, анализ, маркетинг, управление проектами, кучу всякой активности? Какие полезные сервисы есть, которые уже можно использовать? Что ни умеют? Для каких задач? Какие есть бизнес кейсы использования ИИ?

6. 0,5%: Как с помощью ИИ создавать инструменты и агенты ДЛЯ СЕБЯ, кодить, создавать приложения? Идей-то у меня море и вижу бизнес возможности, но кодить не умею. Говорят ИИ помогает. Как научиться создавать с помощью ИИ?

7. 0,1% Как можно создать свой ИИ, обучить свой аватар, создать моего персонального помощника, партнера, консультанта, чтобы он не только работал вместе со мной, но и давал от моего имени консультации, отвечал на запросы?

8. 0,01? Как загрузить свою базу материалов, как размечать материалы, как работать с RAG, файнтюнить модель, кастомизировать ответы? Как работать с https://huggingface.co/ и подобными площадками, как работать с https://civitai.com/?

9. 0,001% Как создать систему, которая использует инфраструктуру вендоров, но была бы от нее независима?

10. Только 1 человек задает этот вопрос. Что надо создавать СЕЙЧАС, учитывая, что

- почти 100% того, что сейчас придумывают стартапы, на чем делают деньги - через 2-3 года станет базовым функционалом больших вендоров типа OpenAI /Антропик/ Гугл и т.п.,
- через 5-7 лет никаких SaaS не будет, а будет AGI, который вам сконфигурирует любой кастомный SaaS в течении секунд.
- конкурировать в технологиях станет бессмысленным, т.е. любой человек с помощью ИИ сможет создать, что угодно, если хотя-бы будет отвечать на наводящие вопросы ИИ?

Итог:

Если вы на стадии 3 и 4 - хотите разобраться с 0 и усилить свою жизнь в 10 раз, посмотрите программу бесплатного мини курса: Эффективное использование chatGPT - https://alexeykrol.com/courses/ai_intro/

Если вы уже на стадии 5 , 6, 7, 8, и хотите, чтобы ИИ усилил вашу жизнь в 100 раз и стал инструментом бизнеса, посмотрите программу следующего курса: https://alexeykrol.com/courses/ai_full/
246
"Я сделал значительное количество инвестиций, в которых заработал многократную прибыль на вложенный капитал — в ряде случаев это было 50, 100 или даже 1 500 раз больше изначальной суммы. Я находил такие возможности благодаря готовности рассматривать маловероятное как возможное. То, что большинство людей этого не делают, только увеличивает награду для тех, кто готов мыслить иначе.

По моему опыту, подавляющее большинство людей смотрят на мир с точки зрения наиболее вероятного исхода и предполагают, что события развернутся именно таким образом.

Я же всегда учитываю как возможность, так и вероятность наступления маловероятных событий. Это помогает мне избегать рисков и находить возможности. В плане управления рисками я не иду на небольшие шансы с катастрофическими последствиями.

Такой взгляд также делает меня открытым для нестандартных, неочевидных точек зрения на мировые события.

В @X я время от времени поднимал возможность необычного объяснения какого-либо события или ситуации. Когда я это делаю, люди либо считают, что я сошел с ума, либо называют меня конспирологом, а то и чем-то похуже.

Напоминаю вам, что многие теории заговора, которые изначально высмеивали и отвергали, в итоге оказались правдой. Зачастую обвинение кого-то в конспирологии — это просто попытка дискредитировать или «отменить» человека, который слишком близко подобрался к истине.

Я открыт к неожиданным и маловероятным исходам — как хорошим, так и плохим. Это сделало меня лучшим инвестором и дало более глубокое понимание мира.

Моя готовность рассматривать маловероятные сценарии растет вместе с потенциальной наградой за их осуществление. Это может быть финансовая выгода, улучшение здоровья или объяснение ранее необъяснимых явлений, наряду с другими преимуществами. Если награда достаточно высока, дальнейшее исследование маловероятного оправдано.

Я призываю вас рассматривать и анализировать маловероятное. Когда-то это называлось открытым умом — пока такое мышление не стало редкостью." (с) Билл Акман, миллиардер, один из самых успешных инвестров в мире. Кстати, поддерживает Трампа, Маска. https://x.com/BillAckman/status/1896388938656321690
147