Мысли вслух
4.33K subscribers
169 photos
21 videos
13 files
179 links
Когда я что-то осознаю, мне хочется об этом рассказать. Здесь делюсь мыслями и открытиями - про технологии, предпринимательство и инвестиции.

Max Votek @Mkitt - предприниматель, сооснователь Customertimes, инвестор.

linkedin.com/in/max-votek
Download Telegram
Рэй Далио о своих AI-клонах

Прочитал пост Рэя Далио: My AI Clone and What We Can Expect from AI Clones.

Он пишет о том, как создал собственный AI-клон - систему, которая не просто отвечает, а размышляет в духе конкретного человека с его принципами, ценностями и логикой принятия решений.

Часто перечитываю его книгу «Принципы» и считаю её одной из лучших в своём жанре.

Его клон - это не LLM общего назначения и не агент с преднастроенной логикой, а скорее продолжение мышления владельца.

Далио описывает идею довольно прагматично: такой клон позволяет вести бесконечные диалоги, масштабировать опыт и принимать решения в соответствии с собственными принципами, но быстрее и без эмоций. По сути, это шаг от ИИ к «персональному интеллекту».

В этом году Stanford и Google DeepMind создали simulation agents: цифровые реплики 1 052 человек, обученные на двухчасовых интервью.

AI-модели воспроизводили ответы людей в опросах и личностных тестах с точностью около 85%, но терялись там, где требовалось принимать сложные решения. AI уже умеет копировать поведение, но не всегда улавливает интуицию и контекст.

Я уже давно собираю свои мысли и заметки - привычка, которая появилась после вдохновения от Сергея Булаева и его идеи с Flashbacks.ai.

Работа при помощи агента со своей памятью часто даёт неожиданные инсайты и помогает лучше понять собственные паттерны мышления, находить в прошлых идеях неожиданные параллели.

В технологии Сo.Actor, которую создала компания Сергея Булаева, с которой мы сейчас работаем, используется не только моя личная память, но и память организации, когда система работает с контентом внутренних встреч и данных с конференций.

Добавление персонального взгляда, контекста и опыта организации превращает работу с контентом в бесконечное удовольствие.

Клон, который умеет думать через твой и коллективный опыт - это уже новый инструмент мышления.

Не просто помощник, а продолжение твоего интеллекта.

@maxvotek | linkedin | substack
20🔥13👍7
Когда болеешь, самое время экспериментировать с AI 🤒

Несколько дней восстанавливаюсь после Лондона, где-то подцепил вирус. Вечером самое время продолжить эксперименты с кольцом Oura и Claude Code.

Результат за два промта:
Буквально сказал Клоду: Хочу соединить и синхронизировать моё кольцо на регулярной основе. Вот персональный токен.


Дальше магия:
Клод ушёл думать на несколько минут
С первого раза подключился к API Aura
Сам написал программу для автоматической синхронизации несколько раз в день
Сам предложил визуализацию и создал дэшборды
Сам проанализировал данные и дал рекомендации по здоровью

Работал в режиме --dangerously-skip-permissions - работает автономно, лишних вопросов не задает, чуть опасно звучит, но результат того стоит.

Claude способен самостоятельно:
Понимать контекст задачи
Писать рабочий код с первого раза
Создавать визуализацию без уточнений
Анализировать данные и давать инсайты

Все больше похоже на реального автономного агента, о которых мы уже год слышим в рекламе OpenAI, Anthropic, Salesforce

План восстановления после вирусной инфекции куда более консервативный, чем я себе спланировал.

@maxvotek | linkedin | substack
🔥2815👍11😁3
О воспоминаниях, которых не было.

Часть интервью Лекса Фридмана с Джулией Шоу очень впечатлил меня. Там прозвучало простое, но тревожное замечание:

"Каждое наше воспоминание - ложное. Вопрос только - насколько."


Память - не архив, а редактор. Каждый раз, когда мы вспоминаем, мы не извлекаем запись, а переписываем её заново. Добавляем детали, выкидываем лишнее, меняем контекст.

В итоге помним не то, что было, а то, что мы помним сейчас.

Отсюда и эффект «внутренней Википедии»: люди, с которыми мы делимся своими историями, становятся соавторами наших воспоминаний. Их версии постепенно вытесняют наши.

В какой-то момент ты уже не уверен - ты действительно это пережил или просто много раз рассказывал себе ту же историю.

Джулия говорит, что такое устройство памяти - не дефект, а инструмент выживания. Она делает нас пластичными, помогает смиряться и двигаться дальше.

Но в этом есть и другая грань, чем больше мы переписываем прошлое, тем дальше отходим от правды.

Здесь появляется очевидная новая угроза - AI как машина ложных воспоминаний.

Генеративные модели сегодня ведут себя как гиперверсия человеческого мозга: они не просто дополняют, а достраивают и додумывают - уверенно, красиво, с нужным тоном.

Если человек общается с AI, который «помнит» его прошлые ответы - начинается совместное редактирование памяти.

Ты и машина создаёте общую версию твоего прошлого, которую уже невозможно отделить от реальности.

Шоу называет это the ultimate false memory machine и добавляет:
«Чтобы защититься, нужно помнить, что наш мозг - ненадёжный источник. Записывайте сразу. Не верьте себе на слово».


Интересно, что в этом есть и надежда, если память - это соавторство, то, возможно, AI станет инструментом, который поможет нам лучше помнить, а не больше забывать.

@maxvotek | linkedin | substack
🔥25👍149
Мозг vs AI: экономика энергии и интеллекта

Мозг человека работает на 12-20 ватт, выполняя миллиарды операций в секунду.

Один датацентр AI потребляет 100+ мегаватт - это энергия для 100 000 домов. Один ответ LLM требует 6 000 джоулей, мозг тратит лишь 20 на весь поток мышления. Эффективность биологии выше на 9×10⁸–2,7×10¹³ раз.

NVIDIA - ядро AI-инфраструктуры: в 2025–2026 годах она контролирует 90–94% рынка GPU. Blackwell и GB300 двигают модели Microsoft, OpenAI, Amazon, Google.

Выручка от датацентров за Q3 2025 достигла $30,8B. К 2026 расходы на эксплуатацию AI-датацентров превысят $600B при энергопотреблении 29 ГВт. Стоимость чипа H100 падает с $50k до $15k, но энергетические издержки остаются колоссальными.

1) Обучение крупной модели стоит десятки или сотни миллионов долларов
2) Средний сотрудник стоит $60–80k в год
3) AI эффективен при рутинных задачах, человек гибче в сложных
4) Рост применения чипов 2.25x в год
5) Энергия остается ключевым ограничением

В книге Бострома Superintelligence он описывает момент, когда система, способная улучшать себя, ускорит прогресс и снизит стоимость умственной работы почти до нуля. Первое государство или компания, создавшие такой интеллект, получат стратегическое преимущество, а копии стоить будут лишь железа и электричества.

Мы пока далеко от этого сценария. Даже самые продвинутые чипы NVIDIA примерно в 10¹² раз менее энергоэффективны, чем человеческий мозг.

AGI и superintelligence остаются мечтой создателей, хотя скорость и автономность агентов, особенно в программировании и автоматизации, уже впечатляют.

AI ещё не мыслит, но уже работает с такой скоростью, что заставляет человека по-новому смотреть на собственный потенциал.

@maxvotek | linkedin | substack
🔥16👍109
Почему продакт из Sequoia не нанимает «универсальных» людей

С удовольствием послушал интервью Jess Lee и отметил несколько мыслей. Ранее писал о том, как оценивать основателей и здесь вижу хорошее дополнение.

Когда ты строишь компанию, ты создаёшь культ. Люди хотят работать не из-за зарплаты, а потому что разделяют с тобой мечту и смысл.

Хороший фаундер - рассказчик, который умеет зажечь идеей, даже если она кажется безумием.

Джесс Ли начинала карьеру в Google, работая над Google Maps. Главный урок - амбиции. Делать не ещё одну карту, а карту всего мира со своими машинами и камерами.

В Polyvore Джесс пришла как пользователь, написала фаундеру письмо с разбором проблем продукта и предложениями решений.

Через несколько лет возглавила компанию и продала её Yahoo. История о том, как брать ответственность без должности и становиться лидером, когда ситуация требует.

Polyvore - стартап из Кремниевой долины середины 2000-х. Онлайн-платформа, где пользователи создавали коллажи из одежды, аксессуаров и предметов интерьера, по сути, свои лукбуки и доски вдохновения.

Главные принципы Джесс Ли простые.

Стартап похож на партию в карты: побеждает не тот, кто всегда прав, а тот, кто быстрее открывает новые ходы. Даже блестящий продукт бессилен, если экономика не работает.

Законы физики и экономики невозможно победить, заливая деньгами. Эмпатия важна, но без высокой планки требований к людям превращается в слабость.

Самое трудное управленческое решение - вовремя отпустить тех, кто не справляется. Джесс не верит в найм универсальных сотрудников. Она верит в силу пиковых значений, а не баланса.

В Sequoia оценивает людей по четырём измерениям:

EQ - эмоциональный интеллект в работе один на один
IQ - базовый уровень интеллекта
PQ - политический интеллект, умение ориентироваться в системах и процессах
JQ - качество суждений и качество решений в ключевых ситуациях

Она ищет людей с выдающимися способностями в одной области и собирает из них команды.

Формула лидерства Джесс Ли: эмоциональный интеллект + политическое чутьё + здравое суждение и скорость решений.

@maxvotek | linkedin | substack
👍21🔥1511
В последние годы нас сложно удивить устройствами и оригинальным дизайном.

Пробовал использовать холодные криптокошельки и, очевидно, Ledger и Trezor - чемпионы по удобству, но случайно попался ещё один интересный девайс, который я в итоге заказал и потратил на освоение часть выходного дня.

Coldcard Q - явно проектировали паранойики-криптографы. Каждая деталь - это ответ на вопрос: «а если…?» и соответствует возможному вектору атаки, если кто-то решит всё-таки украсть ваши биткоины.

• Полностью air-gapped: никакого Wi-Fi, Bluetooth или USB. Подпись транзакций, только через microSD, QR-код, NFC.

• Secure Element: хранит приватные ключи в зашифрованной области, недоступной даже при вскрытии корпуса.

• Два независимых чипа от разных производителей, криптографические функции распределены между ними, что делает взлом практически невозможным: нужно одновременно скомпрометировать две разные аппаратные архитектуры.

• Anti-tampering: устройство фиксирует попытки вскрытия. Если достаёшь его из сейфа и видишь, что индикатор горит другим цветом, кто-то пытался его открыть.

• Открытый исходный код: можно самому провести аудит прошивки, что исключает скрытые компоненты.

• E-ink экран и механическая клавиатура, без дополнительных сенсоров и побочных каналов утечки.

• AA-батарейки, никакого встроенного аккумулятора: можно обесточить устройство и быть уверенным, что оно молчит. Также батарейки не потекут и не испортят устройство.

• Entropy input в функцию генератора случайных чисел можно и нужно добавить энтропию: бросить кости и ввести результат вручную. Был удивлён, что в YouTube полно примеров взлома под запись из-за неслучайного характера стандартных генераторов.

• Anti-supply-chain защита: заводская упаковка опечатана, и прошивка проверяется на подмену.

• Brick Me PIN / Duress PIN: мгновенное стирание данных или доступ к «фейковому» хранилищу.

• Decoy wallets, где можно положить реальную мелочь в биткоинах, если кто-то вынуждает отдать код силой.


Coldcard Q внешне похож на ретро-калькулятор и в нём реально есть режим калькулятора и встроенный фонарик. Такой discreet-mode не дизайнерская забава, а часть защиты.

Кроме того, в Coldcard Q можно хранить секьюрные заметки: зашифрованные тексты, которые можно открыть только через PIN.

Например, резервные фразы, инструкции, фрагменты seed-фразы или ключевые напоминания. Они защищены теми же механизмами, что и твои биткоины.

В использовании не особо удобное устройство, но вполне пригодное, ну и живой учебник по криптографической паранойе, упакованный в корпус с батарейками AA, светодиодом, который выдаст взломщика, калькулятором, фонариком и заметками, которые невозможно прочитать без твоего PIN-кода.

@maxvotek | linkedin | substack
🔥25👍85😁3
AI поднимает фондовый рынок, но люди начали экономить на буррито.

Пока ВВП США растёт за счёт гигантских инвестиций в AI со стороны нескольких технологических компаний, отчёт Chipotle напомнил о другой стороне экономики - там, где здоровый фастфуд стал менее доступен потребителям.

Люди не разлюбили буррито и гуакамоле, а просто затянули пояса.

Цены на продукты выросли, аренда подорожала, студенческие кредиты вернулись, зарплаты не успевают, и ланч заставляет задуматься о стоимости обеда.

BJ’s Restaurants выросла на +20%, предложив комбо-обед с десертом за $13. Chipotle рухнула почти на столько же.

В прошлые годы в Chipotle была очередь, и явно дело не в смене предпочтений, а в банальной экономии.

AI-технологическая революция усилит и без того сильный разрыв в доходах между очень богатыми людьми, которые станут ещё богаче, и остальной частью общества.

Среднему классу уже нелегко, и безработица людей сильно меняет текущий рынок труда - это очень заметно в ИТ по росту качества кандидатов на собеседованиях.

@maxvotek | linkedin | substack
🔥11👍86
Антитренды Дурова и новый проект Cocoon

Пока все соцсети превратились в бесконечные ленты алгоритмов, Telegram остаётся местом, где выбираешь сам - что читать и с кем говорить.

Теперь Дуров идёт против нового тренда - централизации искусственного интеллекта.

После неудавшейся попытки с Маском и Grok, он запустил Cocoon - сеть, где AI работает не на серверах OpenAI, а на блокчейне TON, распределённо.

Как это работает:
• GPU-владельцы получают вознаграждение в Toncoin
• Запросы к моделям остаются зашифрованными
• Платишь за вычисления, не отдавая данные

Идея разумная и мы видим, что спрос на модели с открытыми весами растёт - компании не готовы отдавать свои знания для тренировки чужих моделей. OpenAI уже ограничивает доступ к медицинским и юридическим данным, фактически превращаясь в нового цензора.

Проектом управляет AlphaTON Capital (NASDAQ: ATON) - публичная компания, собравшая $71 млн на развитие TON-инфраструктуры. Они создают GPU-пулы, поддерживают модели вроде DeepSeek и Qwen.

Рынок пока не отреагировал: Toncoin не вырос, акции фонда тоже.

Предполагаю, это сложная инженерная задача. Маркетинг тоже будет непростым - создать новую AI платформу без цензуры и раскрутить её может занять годы. Но если получится - мы впервые получим альтернативный рынок AI-вычислений, где приватность встроена в саму логику сети.

Посмотрел выступление Дурова по теме - ему есть над чем работать в публичных выступлениях. Пока сухо, иногда неуклюже. По выручке на сотрудника Telegram обгоняет почти всех - и это важнее аплодисментов на сцене. Посмотрим, как сработает его очередной анти-тренд.

@maxvotek | linkedin | substack
🔥22👍199😁3
Первая беременность через ИИ-поиск сперматозоидов

С интересом прочитал стью The Lancet о том, как команда из Колумбийского университета описала первый клинический случай беременности, полученной с помощью нового метода STAR (Sperm Tracking And Recovery).

Это связка ИИ + микрофлюидики + робототехники для мужчин с необструктивной азооспермией - когда в эякуляте почти нет сперматозоидов.

Образец пропускают через микроканалы на чипе, высокоскоростная камера делает миллионы кадров за час, алгоритм ИИ высматривает следы движения сперматозоида, после чего микрофлюидная система изолирует нужную каплю, а робот бережно забирает клетку.

Что отличает от существующих методов: обошлись без центрифуг, красителей, жёсткой химии или лазеров - то есть максимально щадяще для клетки.

Пара пыталась завести ребёнка почти 20 лет. Были неудачные ЭКО, ручные поиски под микроскопом и две операции по извлечению сперматозоидов. Все это травматично, дорого и трудоемко.

При применении STAR обработали 3,5 мл образца, примерно за 2 часа просмотрели 2,5 млн изображений и нашли 2 годных сперматозоида. Ими оплодотворили яйцеклетки, получили два эмбриона и зафиксировали клиническую беременность.

Мужской фактор - до 40% случаев бесплодия пар; из них 10-15% мужчин имеют азооспермию.

Сегодняшние опции - долгие ручные поиски после обработки образца или операции на яичках. Это часто безрезультатно, затратно и с тяжелыми побочными эффектами.

Ценность рождается на стыке ИИ + железа + биологии: AI не просто подсказал, а изменил подход и создал новую ветку в борьбе с бесплодием. Пока это всего лишь один клинический случай и статья в The Lancet.

До массового применения нужны большие исследования, чтобы подтвердить повторяемость успеха метода.

@maxvotek | linkedin | substack
👍36🔥1810
Один из моих любимых предметов в медицинском институте - патофизиология.

Это раздел медицины, который изучает, почему и как нарушается нормальная работа организма при болезни или травме.

Она разбирает причины (этиологию), механизмы развития (патогенез), типовые патологические процессы и пределы компенсации, связывая фактор, механизм и симптомы.

В IT-бизнесе сложно выстроить причинно-следственные связи: откуда приходит бизнес и почему один проект успешен, а другой буксует.

Часто лечат по симптомам: сбивают температуру скидкой или бесплатной работой, заливают проект людьми, добавляют ещё один созвон.

Патофизиология учит искать, что нарушило гомеостаз, и лечить не симптом, а причину каскада воспаления.

Я писал о системе оценки лидеров Джесс Ли из Sequoia, где JQ - качество суждений определяет способность понимать причинно-следственные связи.

Джесс Ли отмечает: некоторые с высоким IQ всё равно принимают ужасные решения.

Замечаю, что качество такого понимания растёт при обсуждениях с людьми с высоким JQ и полярными мнениями - это похоже на задачи по патофизиологии из клинических случаев реанимации.

Управление ожиданиями заказчиков: эскалации и скидки становятся нормой - хроническим воспалением от переобещаний и размытых границ контракта.

Кортизол высокий: команда горит, заказчик злится. Причины могут сочетаться как при обширных травмах:

• Продали, не задав все вопросы
• Руководитель проекта плохо совместим с ключевыми представителями
• Бизнес-аналитик без достаточной предметной экспертизы
• У клиента это первый подобный проект

Правильно понять причинно-следственные связи и поставить диагноз - это больше 50% успеха, но требует опыта и сильной команды, которая проводит консилиум.

@maxvotek | linkedin | substack
👍2614🔥8😁1
Консалтинг должен стать софтом.

Продолжаю размышления о новых моделях монетизации в консалтинге (прошлый пост)

Недавно в Financial Times вышла статья, которая подтверждает мои наблюдения о Globant и их AI Pods, а также о McKinsey, получивших награду от OpenAI за рекордное потребление токенов.

Если консалтинговые компании не превратятся в software-business, их ждёт исчезновение.

Глава IBM Consulting Мохамад Али формулирует просто:
Будущее консалтинга - это гибрид людей и софта, и тех, кто не сможет этого сделать, не станет.


IBM уже перестраивает консалтинг под модель service as a software - строит тысячи цифровых агентов, которые берут на себя повторяющиеся процессы внутри компании и у клиентов.

Можно сколько угодно приводить статистику о провальных AI проектах от MIT, но для консалтинга польза очевидна.

Агенты с LLM не устают читать клиентские требования, инструкции, многолетние залежи настроек систем. Они выдают ценные инсайты в реальном времени и повышают качество и скорость выполнения проектов.

Расскажу про свой опыт:

Недавно построили для клиента агента-архитектора SAP, который анализирует настройки систем за пару десятилетий и рассуждает о последствиях внедрений новых функций, апгрейдов.

Это сохраняет ценные часы архитекторов SAP и позволяет найти то, что было недоступно чисто физически из-за слишком глубокого и многомерного контекста.

Также строим у себя AI project factory, где все документы, встречи, артефакты проектов собраны в живой динамической AI-среде.

Это даёт команде новые возможности:
• Ориентироваться в контексте
• Делать детальные и понятные инструкции для клиента
• Настраивать и тестировать бизнес-приложения с недосягаемой до этого скоростью и точностью

Согласен с мнением IBM лидеров: в консалтинге AI будет ключевым преимуществом. Без него будет сложно или невозможно делать бизнес.

@maxvotek | linkedin | substack
🔥15👍136
О сне, восстановлении спортсменов и предпринимателей, Oura и снова Claude Code

Прочитал пару научных исследований о сне спортсменов. Если честно, ничего революционного. [1] и [2].

Всё сводится к очевидному: сон очевидно влияет на результаты соревнований, и почти все профессиональные спортсмены недосыпают. Но разница между знанием и действием - огромная.

Я давно отслеживаю свой сон через Oura и Garmin. Показатели у них почти идентичны, но дают разные акценты: один больше про физиологию, другой про нагрузку. Наверное, оставлю только кольцо - оно просто удобнее.

Стараюсь следовать рекомендациям Oura: температура в комнате, время засыпания, последний час без экрана (дается сложнее всего), минимальная активность перед сном, и вижу улучшения.

Для спортсмена-любителя недосып - низкий результат на соревнованиях, в бизнесе цена ошибки - неверное решение.

Недосып делает нас эмоционально хрупкими, раздражительными и неточными. Если в боксе ты пропустил удар, то в бизнесе можно пропустить важный сигнал, потерять сделку, не увидеть возможность.

Как сказал спортивный психолог Harley de Vos:
«Качественный сон остаётся тайным оружием, которое повышает результативность, снижает риск травм и ускоряет восстановление. Во время глубокого сна организм переходит в режим ремонта - выделяется гормон роста, восстанавливается мышечная ткань, восполняются запасы энергии. Без этого тело становится уязвимым - усталость и ошибки неизбежны».


Последняя поездка в Европу стала наглядным примером: джетлаг, недосып и первые дни эффективность падает в разы. Иммунитет также не дает должной защиты.

Пробовал Garmin Jet Lag Advisor, и простые рекомендации вовремя выйти на солнце немного помогли.

Интересно наблюдать, как Oura оценивает resilience - устойчивость к стрессу. После этой поездки параметр восстанавливался почти три недели.

У спортсменов карьера заканчивается в 30, а у бизнесмена может только начинаться в 50. Значит, выносливость - стратегический ресурс.

Понравилась цитата Dr. John Sullivan на эту тему:
«Вы не укрепляете человека нагрузкой - вы укрепляете его восстановлением. Если человек выгорает, он уже не получает пользы от тренировки. Восстановление - это момент, когда закрепляется эффект работы».


Я всё больше верю, что данные с фитнес-трекеров - это новая доказательная медицина. Миллионы добровольцев, миллиарды ночей сна, и это не просто статистика, а реальная наука.

Недавно снова добавил датчик глюкозы Stelo, который теперь интегрирован с Oura. По результатам пары недель расспросил Claude - выяснил, что при моем режиме уровень глюкозы не влияет на мой сон.

Также Claude точнее определил хронотип и дал рекомендации.

В спорте и в бизнесе правило одно:
рост = стимул + восстановление. Игнорируешь восстановление - замедляешь рост.


@maxvotek | linkedin | substack
👍27🔥2113👎1
В выходные досмотрел новое интервью братьев Либерманов.

Очень интересный и глубокий разговор получился.

Из интересного они упомянули, что соцсети прозевали AI, и ChatGPT уже превращается в социальную сеть, и люди там проводят больше времени.

Несколько дней назад OpenAI запустила Group Chats (до 20 участников; ИИ-модератор/соавтор; пилот в Японии, Новой Зеландии, Южной Корее, Тайване) и тестирует Sora для генерации и обмена короткими видео в ленте с друзьями.

Даниил и Давид Либерманы - серийные предприниматели и инвесторы. Работали директорами по продукту в Snap, где занимались AR/аватарами, а их стартап Kernel AR был куплен Snap в 2016 году.

Они создали холдинг Libermans Co и запустили проекты Humanism (инвестирование «в людей») и Product Science - сервис ускорения мобильных приложений, привлёкший $17,5 млн.

Но, по сути, всё поставили на паузу и приоритезировали новый проект Gonka.ai по созданию децентрализованной сети AI-вычислений, где владельцы вычислительных мощностей получат криптовалюту в качестве компенсации.

Как и Дуров с TON и Cocoon: парни верят, что смогут быстро набрать обороты и уже подключили 450 GPU в свой проект.

Экономика их проекта выглядит разумно:
Аренда GPU за $2/час ($50/день) даёт при ~100 ед./час себестоимость ≈ $0,02.

У корпораций из-за амортизации и маржи это ×2–3 дороже, тогда как в децентрализованной сети добавляется лишь 10–20 % комиссии (≈ $0,022–0,024/ед.).


Почитал их документы: прошли путь гораздо быстрее, чем Дуров с 1 млрд пользователей и текущим фокусом на бессмысленные подарки и NFT, которые являются единственной пока осязаемой, кроме криптобирж, ценностью для TON.

Напишите в личку @Mkitt, если кто-то запустил ноды для их сети, чтобы намайнить монет раньше всех.

Интересен реальный опыт использования децентрализованных вычислительных мощностей.

@maxvotek | linkedin | substack
16👍11🔥6😁2
SMOL Playbook от Hugging Face: как тренировать LLM

Большой документ с отличным переводом от Сергея Долгова о том, как на практике тренировать LLM: выбрать архитектуру, подготовить данные и оптимизировать бюджет на вычисления.

Полезно тем, кто:
• делает компактную модель под конкретную бизнес-задачу;
• работает в стартапе с ограниченным бюджетом;
• хочет понять, почему одни LLM работают, а другие нет.

Интересные выводы:

1) Готовые модели не подходят, если у вас узкий домен (ДНК, юриспруденция, фарма), особые требования к безопасности и приватности, специфические регуляции индустрии или нужна гарантия того, на чём модель обучена.

2) Лучше использовать готовые модели с открытыми весами, и только если они не справились с задачей при помощи промптов и/или дообучения, имеет смысл учить свою.

3) Дообучение на 1 трлн токенов дешевле, чем обучение с нуля на 10 трлн.

Хорошая книга на ночь для тех, кто строит свои AI-системы или планирует вывести их на новый уровень.

@maxvotek | linkedin | substack
👍21🔥93👎1