Лёха ведет дневник
1.06K subscribers
63 photos
17 videos
5 files
51 links
Co-founder NDT by red_mad_robot и gptdaisy.com

лс @Zhdanov_Alexey
Download Telegram
Каналы, которые я читаю по AI

В продолжение вчерашнего поста здесь будет подборка того, что я читаю сам.

@ai_newz - пусть я получаю основные новости из рассылок и шарясь по HuggingFace, мне нравится канал Артема, т.к. часто тут не только новости, но и какие-то крутые мысли.

@oestick - канал Коли, с которым мы вместе проводили эфир. Много технической информации, при этом довольно часто на языке бизнеса. Здесь практические фишки работы с LLM в доступном изложении.

@ProductsAndStartups - канал Байрама Аннакова, здесь много про AI в бизнесе, этику, тренды и продукт. Следил за Байрамом задолго до увлечения AI - умнейший человек, у которого можно учиться всегда, насколько бы круты вы ни были в своей сфере.

@seeallochnaya - еще один крупный канал. Читаю его в основном из-за периодических анализов статей. Позволяет заполнить FOMO от того, что я сам мог пропустить.

@nobilix - Рефат делает много практических разборов AI-инструментов. Всегда детально, но при этом кратко, всегда с демонстрационными видео, читаю каждый пост.

@kantor_ai - канал экс-руководителя МТС AI. С Виктором познакомились в 2022 и он прямо очень крутой. Здесь больше про классический ML и какие-то заметки, близкие к бизнесу.

@ai_and_law_rus - канал про законадательное регулирование ИИ, помогает заполнить FOMO.

@kdoronin_blog - много практических разборов с упором на AI агентов на любой вкус и цвет.

@neuraldeep - идеальный канал для тех, кто хочет зарыться в техническую часть AI. Точно не для легкого чтения, скорее для тех, кто точно понял, что хочет лучше понять AI изнутри и побольше узнать про эксперименты.

@etechlead - канал для тех, кто хочет погрузиться в разработку и вайб-кодинг. Очень много разношерстных материалов по этой тематике.

@countwithsasha - реклама и аналитика мои не самые сильные стороны, канал Саши помогает легче ориентироваться в применении AI в этих сферах

@the_ai_architect - Тимур - действующий разработчик. Много пишет про кодинг с ИИ и его практическое применение, при этом простым языком.

@gleb_pro_ai - канал Глеба Кудрявцева. Здесь много про инди-хакинг и применение ИИ для этой цели.

@lechim_ai - я очень люблю Медтех. Илья - Head of AI очень крутого стартапа Третье мнение, куда я даже получил оффер в 2021. С тех пор слежу за компанией, а не так давно Илья завел канал про медтех.

@baginsai - Саша пишет про практическое применение AI, кейсы, скидки и всякие другие полезности.

@max_about_ai - еще один канал с техническим уклоном. Максим всегда пишет четко, по делу и про то, что пробовал сам и точно работает.

@eternalmind - здесь посты выходят не так часто, но основная тематика находится на стыке когнитивистики, философии, критического мышления и AI.

@alexs_journal - практические разборы AI-инструментов и всего, что вокруг них: промптинг-гайды, лайфхаки и прочее.

Постарался включить максимум источников, чтобы вам было из чего выбрать 🙂 Сохраняйте список себе, знакомьтесь с авторами, если понравилось - подписывайтесь. Пост - не реклама и не взаимопиар, а реально то, что я читаю.
🔥1383
Сегодня пост не про ИИ

Давно заметил за собой одну особенность — физические покупки меня не особо вдохновляют.
Новый телефон? Ну телефон и телефон. Одежда? Необходимость. Даже дорогие гаджеты вызывают разве что мимолетное «неплохо» и быстро становятся частью фона.

Думал, что окончательно переехал в мир, где радость приносят только впечатления, знания, общение.

И вот на днях купил велосипед.

Как же я ошибался.

Первые метры — и что-то щелкнуло внутри. Ветер в лицо, скорость, это ощущение полета над асфальтом, по грунту между деревьями по узкой тропе.
Мышечная память откуда-то из детства проснулась мгновенно. Руки сами помнят, как держать руль, ноги — как крутить педали.

Еду и улыбаюсь как идиот.

Велосипед — это не просто вещь. Это возвращение к тому времени, когда граница между собой и миром была тоньше. Когда радость была проще и честнее.

Может, дело не в том, что я не радуюсь вещам. Может, я просто забыл радоваться движению, свободе, игре. А велосипед — это не покупка. Это билет обратно в ту версию себя, которая умела быть счастливой от скорости и ветра.

Катнул 50 км по лесу / асфальту / грязи. Доехало до Москва-реки. Искупался. Счастлив.

#Лёха_рефлексирует

@alexs_journal
2🔥4811👍10👏3🥰2🤡2💔2🆒2💯1
This media is not supported in your browser
VIEW IN TELEGRAM
💙 NeuralOS: или ИИ становится операционной системой

Представь: вместо привычного Windows или macOS ты работаешь с операционкой, которая полностью генерируется нейросетью.

Звучит как "немного не правдоподобно"?

Исследователи из University of Waterloo уже сделали первый шаг.

Как работает это чудо?

NeuralOS — это не просто очередная модель, а попытка "переосмыслить" саму концепцию ОС.
Вместо кода и алгоритмов — нейронки, которые предсказывают каждый пиксель экрана на основе человеческих действий.

Для создания интерфейса не нужно писать ни единой строчки кода

Никаких HTML, CSS, Qt или других фреймворков — нейросеть сама рисует всё от кнопок до окон.

Архитектура состоит из двух частей:

1️⃣Двухуровневая RNN на LSTM — это "мозг" системы:

🔵Нижний LSTM обрабатывает ввод пользователя (координаты мыши, клики, клавиши) и "смотрит" на предыдущий кадр через механизм внимания

🔵Верхний LSTM анализирует результаты нижнего уровня и поддерживает долгосрочную память о состоянии системы

🔵Между уровнями есть обратная связь — верхний LSTM "подсказывает" нижнему, что важно помнить

2️⃣ Диффузионный рендерер (UNet) — получает "инструкции" от LSTM и рисует следующий кадр экрана

Почему именно LSTM, а не Transformer?

Трансформеры становятся всё медленнее с ростом последовательности, а LSTM работает с константной сложностью на каждом шаге.
Для ОС, которая должна работать часами без перезагрузки, это критично!

Как обучали эту "операционку"?

Система обучалась на 122К записей взаимодействий с Ubuntu XFCE.

Данные собирали двумя способами:

1️⃣ИИ-агент Claude-3.5 методично кликал по всем кнопочкам (представьте самого усидчивого QA-тестера)

2️⃣Случайные клики и движения — чтобы модель не думала, что курсор к кнопке закрытия == автоматическое закрытие окна

Обучение проходило в 4 этапа:

1️⃣Предобучение RNN — учим предсказывать кадры

2️⃣Совместное обучение — RNN + диффузионная модель работают в тандеме

3️⃣Scheduled Sampling — борьба с накоплением ошибок (когда модель начинает "галлюцинировать")

4️⃣Расширение контекста — увеличиваем "память" системы

Потребовалось 23,000 GPU-часов на H100/H200 🔥

Что умеет уже сейчас?

✔️Точно отслеживает курсор (погрешность ~1.5 пикселя)
✔️ Открывает приложения и меню
✔️ Реагирует на клики и базовые команды
Пока плохо с детальным вводом текста (консоль пока не подвластна)
Низкое разрешение (512×384)
Всего 1.8 FPS на H100

Куда это может привести?

Ближайшее будущее:
- Интерфейсы, которые адаптируются под пользователя в реальном времени
- Управление жестами и голосом вместо кликов
- "Умные" меню, которые предугадывают ваши действия

Долгосрочная перспектива:
- Стирание границ между приложениями — всё становится одним "интеллектуальным потоком"
- Превращение пассивного контента в интерактивный (представьте фильм, где вы можете влиять на сюжет)
- Персонализированные ОС, которые "растут" вместе с пользователем
- Интерфейсы, которые сами себя программируют под задачи

Почему это важно?

Мы привыкли к интерфейсам, которые программисты жестко закодили десятки лет назад.
Каждая кнопка, каждое меню — результат тысяч строк кода. NeuralOS показывает путь к полностью адаптивным системам, где каждый элемент может изменяться в зависимости от контекста и потребностей.

Больше никаких багов в UI (ну, почти), никаких костылей в коде интерфейса, никаких "а почему эта кнопка именно здесь?". Нейросеть сама решает, как лучше организовать рабочее пространство.

Да, пока это больше proof-of-concept, чем готовый продукт.
Но помнишь, как выглядели первые версии ChatGPT? Или первый iPhone?

Полезные ссылочки:

Демо: https://neural-os.com/
Github: https://github.com/yuntian-group/neural-os/tree/main
Статья: https://arxiv.org/pdf/2507.08800

P.S. Интересно, сколько времени пройдёт до того момента, когда мы будем работать в ОС, которая "думает" быстрее нас?

И главный вопрос — будет ли она показывать рекламу прямо в интерфейсе? 😅

@alexs_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥5🤔5👍4😁1🐳1💊1
This media is not supported in your browser
VIEW IN TELEGRAM
Иногда складывается ощущение, что гугл календарь меня побеждает..
Встреча на встрече, обсуждение за обсуждением

Долго искал достойный подход, как сделать так, чтобы работать продуктивнее, а не только созваниваться.

И тут мне просторы интернета подкинули мемчик с игрой Арканоид (это где от платформы шарик отскакивает и уничтожает все на своем пути)

Запустил я любимый Cursor и навайбкодил расширение для Хрома — топ инструмент для менеджеров.

1 мин игры — и неделя свободна. Пользуйтесь!

@alexs_journal
1🤣49👍115🔥5😁4👏2
Я достаточно давно в индустрии, и чтобы тебе не совершать моих ошибок, я собрал полноценный гайд.

Как гарантированно внедрить LLM-based решение в компании:
Полное руководство (без регистрации и SMS)

Следуй этим советам, и о твоем проекте будут слагать легенды

ШАГ 1: НАЧИНАЙ СРАЗУ С САМОГО ГЛАВНОГО!

Забудь про всякие исследования и пилотные проекты.
Это для слабаков и тех у кого есть время и не хватает навыков.
Твоя цель — сразу автоматизировать самую сложную и ответственную задачу в компании.
Например, пусть LLM самостоятельно составляет годовой финансовый отчет и отправляет его инвесторам.

Даже если что-то пойдет не так — будет как минимум.. красиво)

ШАГ 2: КОМАНДА

Найди одного самого воодушевленного стажера.
Скажи ему, что LLM — это как "продвинутый Google", и дай админский доступ ко всем базам данных.

Зачем тебе дорогие NLP-инженеры, разрабы и менеджеры?
Они только будут задавать глупые вопросы про "интеграции", "безопасность данных" и "бюджет".

ШАГ 3: ДАННЫЕ — ЭТО СОРНЯК, КОТОРЫЙ РАСТЕТ САМ

Не трать время на подготовку и очистку данных.
Просто скорми модели все, что найдешь: сканы факсов из 90-х, логи переписки из рабочего чата (включая мемы с котами), личные фото сотрудников из отпуска.
Чем больше данных, тем "умнее" модель.
Она сама разберется, что к чему.

ШАГ 4: ПРОМПТ-ИНЖИНИРИНГ — ДЛЯ ГУМАНИТАРИЕВ

Какой еще "тщательный подбор инструкций"?
Пиши промпты так, как говоришь с таксистом в пятницу вечером: кратко, эмоционально и немного бессвязно.

Плохой промпт:
"Напиши вежливый и профессиональный ответ клиенту на жалобу X, используя информацию из документа Y".

Отличный промпт:
"Сделай красиво с этим письмом. Срочно!".

Результат будет непредсказуемым, а значит, интересным!

ШАГ 5: ТЕСТИРОВАНИЕ — ТРАТА ВРЕМЕНИ

Протестировать решение на небольшой группе пользователей? Скууучно.. Сразу кати на всех! Пусть твои клиенты и сотрудники станут бесплатными (и очень злыми) тестировщиками.
Их гневные отзывы — это бесценная обратная связь, которая поможет тебе быстро найти новую работу.

ШАГ 6: ЗАПУСТИЛ И ЗАБЫЛ!

Внедрил LLM. Поздравляю! Теперь можно расслабиться.
Мониторинг, поддержка, сбор обратной связи — это все лишняя суета. Модель ведь самообучающаяся?
Вот пусть сама себя и улучшает, и чинит.
А ты иди получать премию за инновации.

Следуй этим простым правилам и спина болеть не будет

Всем хорошего воскресенья!

Делитесь в комментах тем, что мог упустить

@alexs_journal
3😁33👍12🔥72👌2🙈2😱1🙊1
Залипаю тут на проект https://nof1.ai/ — Live Arena, где модельки (Claude 4.5 Sonnet, DeepSeek V3.1 Chat, Gemini 2.5 Pro, GPT 5, Grok 4, Qwen 3 Max) соревнуются в трейдинге.

Реальные деньги, реальный рынок. Старт был 18 октября и продлится до 3 ноября.

К сегодняшнему дню DeepSeek уже удвоился, в то время как GPT 5 с Gemini в сильной просадке.

Из интересного в проекте — можно смотреть все сделки и логику принятия решения по каждому трейду.

Модельки — горячие трейдеры)) Меньше 10го плеча не заходят.

Закинуть что ли косарик на DeepSeek для теста?

@alexs_journal
1🔥9👍8👏4😁21😱1
Немного мыслей про генеративный UI

Мир стоит на пороге смены парадигмы интерфейсов.
Эпоха «прямого манипулирования» (нажал кнопку —> получил результат) уходит.
Ей на смену приходит подход с выявлением намерений пользователя (intent-based outcome specification).

В этой модели пользователь описывает цель, а ИИ сам определяет способ её достижения, генерируя интерфейс в реальном времени.

Вот 4 сдвига, которые уже происходят:

❤️ От статики к генерации интерфейса на лету
Концепция «статичный макет для среднего пользователя» умирает. На сцену выходит Liquid Design.
Элементы интерфейса становятся «жидкими»: они реагируют на контекст, контент и соседние блоки.

❤️Смерть CRUD-приложений
Традиционные приложения — это, по сути, красивые фасады для баз данных с зашитой бизнес-логикой.
Эра Agentic Experience меняет архитектуру: логика мигрирует в автономные системы (агенты), которые взаимодействуют с данными напрямую.

❤️ Проблема Latency
Когда модель «думает», обычный спиннер убивает UX.
Вводится паттерн Stream of Thought — визуализация мышления модели. Пользователь должен видеть логику: «Планирую —> Обращаюсь к инструменту X —> Анализирую».
Это снижает воспринимаемую задержку и строит то самое calibrated trust (калиброванное доверие), без которого юзеры уходят.

❤️Гибридные интерфейсы (Multimodal)
Чистый LUI (Language User Interface) — не панацея.
«Большинство продуктов не выигрывают от антропоморфизации», — говорят в Perplexity.
Будущее за гибридом: диалоговый ввод + графический (структурированный) вывод.


Все эти концепции (Intent-based UI, Zero UI) звучат революционно в white papers.
Но когда ты начинаешь внедрять это в реальный продукт, ты сталкиваешься с кучей граблей.

У нас в red_mad_robot стрим по Fluid/Liquid UX/UI выбран одним из 5ти ключевых направлений, над которыми мы работаем.

Знаю, что друзья по цеху тоже работают над переосмыслением UX в это интересное время.
Вот тут Даша из одного зелёного банка рассказывает про то, с чем столкнулась при проектировании решения.

Из полезного поизучать на тему — The HAX Toolkit Project от Microsoft
(HAX == The Human-AI eXperience)

@alexs_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥86
Надя запилила крутой сервис Telegram Wrapped

Без регистрации и СМС — вставляешь ссылку на канал и получаешь статистику за год.

Мой "Теховый дневник продуктщика" получился таким)

@alexs_journal
👍52🔥1😁1💩1