Записки C3PO
5.1K subscribers
75 photos
5 videos
227 links
Product Director @ T-Bank AI, ex. YouDo

Пишу о Product & People Management, AI, своих наблюдениях и прочих бесполезных вещах.
Download Telegram
Читал тут, значит, статью на The Verge, что OpenAI делают свою соцсеть, и наконец понял, кого они мне напоминают - подростка с СДВГ. Так же в расфокусе, хватаются за все подряд, не доводят ничего до конца, все вроде работает и вау, и все в шоке от того, как круто, но по факту в зачаточном состоянии, недоведенное до полноценного состояния.

Так-то все логично и понятно, почему так. Закладки в чате и отсутствие зоопарка моделей устойчивую бизнес-модель не найдут, ибо большинство юзеров юзают дефолтную модель и не отдают себе отчет о каких-то рассуждалках и прочих задротских штуках, а подписки не дают зарабатывать достаточно, чтобы окупать мероприятие здесь и сейчас. В будущем, к тому же, из-за роста конкуренции и Open Source моделей технологический moat будет слабеть, технологии будут коммодитизироваться, а маржинальность падать. Каждый технологический виток будет стоить все дороже.

Поэтому, как мы говорили не раз и разбирали в посте про 7 Powers, у OpenAI задача обрасти как минимум одной из трех "сил": scale economies, switching cost или network effects. Сетевые эффекты - это самая мощная и могучая сила и барьер для конкурентов, но самая сложная в имплементации. Соцсети == Network Effects.

В целом, вариантов у OpenAI не так уж и много, поэтому круто видеть, что они не боятся и итерируются. СДВГ тут скорее суперсила и источник энергии для быстрых итераций. Главное потом убрать СДВГ'шников от руля, чтобы можно было укрепить найденную модель.
👍146😁5💯2👏1
У меня есть одна любимая задача для проверки LLM в скиле написания документов, так как это почти самая частая моя задача. Даю недоделанный док со стратегией "одного маркетплейса", к которому прилагается шаблон этого документа и артефакты с юзер/маркет ресерчем и драфтами идей стратегии.

Закинул эту задачу в новую o3. В промте даются четкие инструкции, что если инфы в артефактах нет, то ее не нужно выдумывать, а задача именно дописать док и улучшить уже написанное. Что вы думаете? o3 напридумывала кучу цифр и фактов, которых не было в приложенных документах, текст мне лично не нравится. Может показаться, что o3 просто подошла творчески к задаче и придумала классные идеи, но идеи фигня, а цифры неверные. Sonnet 3.7 Thinking, к слову, делает все прям хорошо.

P. S. Как разрулю доступ к Gemini 2.5 Pro, расскажу про нее. Чую, что она станет моей основной моделью.
19🔥3👍2
Пишут, что «Джеймс Уэбб», обнаружил в атмосфере экзопланеты химические вещества, которые на Земле обычно связаны с деятельностью живых организмов: диметилсульфид и диметилдисульфид, которые преимущественно вырабатываются морским фитопланктоном и другими микробами💆‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥10
Оказывается, если брать годовую подписку на блог Лени, получаешь еще годовую подписку на следующие продукты:

- Bolt
- Cursor (похоже распродан)
- Lovable
- Replit
- v0
- Granola
- Notion
- Linear
- Superhuman
- Perplexity

Общая стоимость всех продуктов превышает 15k 🤯💳
Как ему удалось собрать такой бандл, мое почтение, конечно.

Напомню, что у Лени все еще лучший блог и подкаст для продактов.

UPD: разобрали 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20
Сделать простой классификатор на входе для распознования благодарности — нет.
Рассказывать в твиттере о миллионах на ответы на благодарность — да.

https://x.com/sama/status/1912646035979239430?s=46
😁28👍14
Записки C3PO
Хороший пример того, до чего доводит гештальт терапия https://xn--r1a.website/strategic_move/1184
Дополнение к предыдущему посту и плавный переход к достаточно важной проблеме:
- Проблемы "проработок" и бесконечного хождения по кругу — это типичная проблема гештальт-терапии, которой почти полностью нет в КПТ.
- В комментах правильно заметили, что одна из причин, почему LLM плохо справляются в роли терапевта, — это их жесткий confirmation bias.

На самом деле, Confirmation Bias моделей и их легкая адаптивность к почти любой дичи, которую вы им говорите, — одна из самых больших и ключевых проблем, на мой взгляд, которая мешает LLM генерировать больше пользы и внедряться в бизнес. Причин много: начиная от датасетов, методов обучения и заканчивая тем, что часто это тупой абьюз какого-нибудь RL.

Модельки OpenAI, кстати, судя по всему, учат для того, чтобы не поддаваться "провокациям" пользователя и стоять на своем. Видимо, что очевидно для передовых исследователей, они тоже считают это крупной проблемой. Но такие методы обучения, похоже, имеют достаточно болезненные сайд-эффекты: когда модель ошиблась, она начинает упорно стоять на своем и не отходить от неверного пути, который изначально выбрала. Когда я впервые потрогал O1 Pro, это была одна из самых раздражающих в ней вещей.
20👍7
Записки C3PO
У меня есть одна любимая задача для проверки LLM в скиле написания документов, так как это почти самая частая моя задача. Даю недоделанный док со стратегией "одного маркетплейса", к которому прилагается шаблон этого документа и артефакты с юзер/маркет ресерчем…
Нашел кейс, где новые модельки Open AI o3/o4 расцветают. Это кейсы, где нужен стохастический tool calling для решения задач. Тобишь агенты.

Пример, мне нужно построить сложную модель в эксельке с учетом всяких диффузий по Бассу и прочего. У меня есть базовая, есть цифры, которые нужно найти в интернете, есть методология, которую надо улучшить. Даешь задание o3 в интерфейсе Chat GPT, он улучшает твою методологию, ищет нужные цифры в интернете, пишет код, запускает, строит таблички, делает графики. Кажется, еще один пласт моей работы будет до предела автоматизирован.
👍31
Ещё одна причина, по которой я люблю Perplexity и Anthropic, - их визуальный стиль и язык. Кайфово пользоваться продуктом, который приносит не только пользу, но и эстетическое наслаждение, и не выглядит так, будто его сделали студенты за одну ночь во время хакатона.
👍387💯7
Я много ругал Deep Research от Perplexity, но осознал сегодня, что стал пользоваться им чаще, чем от Open AI. А все почему?

Во-первых, они его сильно улучшили.
Во-вторых, если отприоритизировать все мои потребности по частоте возникновения, то получится так:
1. Самый частый кейс с частотой несколько раз в час и больше - получить ответ на вопрос, который меня волнует, здесь и сейчас. Тут решает точность ответа и скорость.
2. Второй по популярности с частотой где-то раз в 2-3 часа - получить развернутый и более глубокий ответ, но окно ожидания может быть увеличено до 5-10 минут. Дольше ждать слишком долго.
3. Ну и последний кейс частотой 1-3 раза в день - требуется глубокое и развернутое исследование и отчет по нему, чтобы с одной максимум 2-х попыток получить исчерпывающий ответ на волнующую меня тему. Лимиты по времени тут уже до нескольких часов увеличиваются изи.

Первый кейс отлично закрывает классический Search Mode в Perplexity Pro. Третья ниша это тот самый Deep Research от Open AI, но второй кейс он решает плохо, ибо время ожидания не вписывается в критерии. И тут как раз после последних обновлений Research Mode от Perplexity решает: он дает достаточно развернутый и качественный ответ, но дает его весьма быстро, вписываясь во временные ограничения. Они его даже переименовали из DeepResearch в просто Research.

Недавний Lightweight режим Deep Research в ChatGPT занимает нишу между Perplexity Research и классическим Deep Research, но ближе к последнему.

В результате все можно отразить в виде триады value/price/speed. Для каждого кейса свои критерии и вот получается, что Research Mode в Perplexity отлично вписался в свою нишу.
16👍9🔥6
Новость, от которой я 🤯: Хинтон оказался леваком.

Да не просто леваком, а из семьи отбитых маоистов.

С другой стороны, чему я удивляюсь? Когда академики не были леваками?
Please open Telegram to view this post
VIEW IN TELEGRAM
5💔3🤔1
😎 флекс нового поколения
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1410💯1
Forwarded from Время Валеры
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным.

Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие люди катастрофически не умеют формулировать свои мысли — отсюда все эти «давай быстро созвонимся», «пересечёмся раз на раз» или голосовые сообщения. Не всегда, но очень часто это происходит не потому, что встреча действительно нужна, а потому что человек просто не в состоянии организовать свой словесный салат во что-то внятное. В итоге он выливает свои мысленные помои на собеседника в надежде, что тот переработает это во что-то осмысленное — вместо того чтобы самому потратить время и внимание.

Черчилль как-то написал: «Прости, времени было мало, поэтому письмо длинное». И почти все это понимают на подсознательном уровне — отсюда все мемы и приколы про голосовые сообщения. Сложно переоценить важность хорошей культуры письма: она не только экономит кучу времени и сил, позволяет работать асинхронно, но со временем ещё и учит человека мыслить собранно и чётко.

Возможно, не стоит доходить до пределов ребят из провинции Лакония с их «если», но пример с них брать точно стоит. В здоровом письме — здоровый дух. А лучшая встреча - это короткая встреча
34👍12💯10👏1
Время Валеры
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным. Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие…
В комментариях к посту Валеры и его репосту в Сиолошной многие отстаивают мысль, что голосовое обсуждение проще и быстрее текстовой коммуникации. Парадоксально, но этот аргумент лишь подтверждает исходный тезис. Когда человеку легче пробиться через плотный календарь и организовать встречу, чем четко сформулировать мысль на письме, это красноречиво свидетельствует о его затруднениях с письменной коммуникацией.

При этом догматизмом страдать тоже не нужно. Текст не является панацеей и есть ситуации, когда устное или визуальное общение действительно предпочтительнее, но таких ситуаций диспропорционально меньше.

Письменная коммуникация имеет свои ограничения, главное из которых — субъективность восприятия. Каждый читатель привносит собственную эмоциональную окраску в прочитанное. Поэтому встречи, где критически важен эмоциональный контакт — первые знакомства, развернутая обратная связь, разрешение конфликтов или 1-1 с подчиненными — трудно перевести в текстовый формат. Однако способность грамотно и экологично изложить фидбек на письме зачастую отражает умение деликатно донести его и при личном общении.

Качественно составленный 6-pager всегда превосходит презентацию, где выступающий полагается лишь на жестикуляцию на фоне слайдов с несколькими картинками. Но принятие решений в письменном формате осложняется асинхронностью коммуникации. Для обсуждения стратегических ставок и принятия важных решений о запусках предпочтительнее живое общение, поскольку оно способствует достижению консенсуса и вовлеченности всех участников.

Стоит ли, однако, тратить драгоценное время на встречу, организованную человеком, который присылает приглашение с лаконичным названием "Синк", без описания, адженды, целей и ожидаемых результатов, но при этом приглашает 25 сотрудников, суммарная почасовая ставка которых сопоставима с его месячным окладом?

В конечном счете, письмо, голос, визуал и другие средства — это инструменты коммуникации в нашем арсенале. Мастерство заключается не в слепой приверженности одному из них, а в умении выбрать наиболее подходящий инструмент для конкретной ситуации. Способность гибко переключаться между различными форматами коммуникации в зависимости от контекста и целей — вот что действительно отличает настоящего профессионала.
💯54👍7🔥64
Похоже, в моем AI арсенале поселится еще одна апка - Granola.

Это апка для ведения заметок, которая умеет транскрибировать диалоги и превращать их в красивые и хорошо структурированные заметки. Звучит стандартно, да?

Ключевые отличия от обычных подобных сервисов:
- Апка (Mac или iOS) умеет слушать системный in/out звук, поэтому не привязана к интеграциям всяких ботов в Zoom и прочее, а, по сути, может работать всегда и везде. Очень удобно положить на оффлайн митинге телефон, который фоном все просто запишет и превратит это в клевую заметку.
- Можно делать заметки по ходу митинга и они будут учитываться при финализации с помощью AI. Я часто на митингах закидываю какие то тезисы и прочие мысли, чтобы не потерялись, а теперь они еще привязаны к обсуждению и AI сможет это понять и расширить это.
- Если на работе юзаете Google календарь (я нет), по идее, апка может привязывать заметки к митингу вычленять участников, их контакты и добавлять контекст к заметке
- С каждой заметкой можно "початиться" и попросить что-то сделать: Q&A, Action Items, Follow Up Email после митинга и тд.

Модель - фримиум с ограничением на количество митингов. С подпиской их нет.
По идее, несложно написать свой подобный враппер, но кому не лень?
1👍292🔥1
Записки C3PO
Срезонировал пост Карпатого про evaluation-кризис LLM'ок. TLDR: - Cтарые метрики устарели, а новые ненадёжны. - Модели переобучаются под существующие бенчмарки, снижая их объективность. - В настоящее время невозможно точно определить реальное качество современных…
Заменил Superwhisper на Wispr Flow.

Wispr Flow лучше понимает контекст и чётко выполняет голосовые команды при работе с текстом.

К примеру, команду: «Напиши письмо на английском, в котором ты спрашиваешь Лебовски где мои деньги», он сразу поймет, в отличие от Superwhisper, который это делает по настроению. То есть не просто транляция речи в текст.

Еще жирный плюс Wispr Flow это оч маленькое всплывающее окно (скорее иконка) при распозновании речи, которое появляется внизу экрана над доком, а не огромная штука на переднем фоне.
🔥21👍5
Пример того, как по-разному работают модели Anthropic и их конкуренты: если Клоду сказать, выделив текст в документе, в котором он указал какую-то цифру, что для цифры нужен источник этих данных, он признает необходимость источника и изменит утверждение на более общее, не требующее подтверждения ссылками. А если моделям OpenAI или DeepSeek дать аналогичное указание, то они придумывают несуществующие источники, статьи и исследования для подтверждения информации. Но, справедливости ради, модели OpenAI с большей вероятностью назовут существующий источник.
👍315