Квест Теория Каст и Ролей
19.9K subscribers
1.2K photos
389 videos
44 files
3.55K links
Канал Алексея Крола, автора Теории Каст и Ролей.
Download Telegram
Ч 3. Некоторые задачи целесообразно решать с помощью Ассистента, другие можно передать сторонним сервисам или алгоритмам.

Допустим, у вас есть процесс (например, в бухгалтерии, маркетинге или работе с кадрами), состоящий из десяти шагов. Вы понимаете, что на пяти из них полезно задействовать ИИ Ассистента, потому что он запоминает контекст, позволяет загружать документы и так далее. Значит, вам нужно правильно выстроить взаимодействие.

А это приводит нас к ключевому моменту: на каждом этапе необходимо грамотно формулировать промпт (запрос).

Напоминаю: насколько правильно вы зададите вопрос, настолько адекватный ответ получите. И вот здесь мы подходим к плохой новости.

10. Плохая новость в том, что когда я проводил небольшой опрос, выяснилось: хотя многие пользуются чатами вроде GPT, большинство используют лишь 5% их возможностей. По сути, они не умеют ими эффективно пользоваться.

У многих создаётся впечатление, что с Ассистентом достаточно просто разговаривать — и всё. Но на самом деле у него гораздо больше возможностей.

Когда вы работаете с Ассистентом, важно, чтобы он был не просто механическим инструментом, а полноценным интеллектуальным партнёром. Это возможно, если знать все функции ChatGPT. Они, кстати, несложные. Разумеется, нужен платный тариф (20 долларов). Но давайте честно: если для вас эти 20 долларов — проблема, то дальше обсуждать нечего. Многие мои знакомые подписаны не на один ИИ, а на несколько, и в этом есть смысл. Мы вкладываем деньги в возможности, а стоимость подписки — минимальная. На платных тарифах доступен расширенный функционал: работа с контекстом, промптами, проектами и многими другими возможностями. Они позволяют использовать GPT в 100 раз эффективнее, чем просто в обычном режиме общения.

11. Если вы используют крошечную часть возможностей ChatGPT, то часто не получаете результата, который могли бы. ChatGPT мог бы дать гораздо больше, но не даёт — потому, что вы не потрудились разобраться в его возможностях.

Часто наше небольшое невежество становится непреодолимой стеной между нами и сияющими возможностями. Это и есть плохая новость.

Но есть и хорошая новость. Когда я смотрю, как пользуются ChatGPT другие, я переполняюсь сочувствием от того, что люди не используют ChatGPT на полную. Я сделал короткий и бесплатный курс «Как эффективно использовать ChatGPT?».

В курсе я систематизировал свои практики, поэтому это скорее мастер-класс. Получилось около 10 часов. Я показываю возможности и добавил небольшие тесты.

Почему так важно сначала разобраться с тем же ChatGPT? (или аналогом, хотя пока их мало - Антропик, Дипсик, Groc3 и т.п.)

Потому что, если вы освоите его возможности, то сможете сделать его полноценным партнёром, который решает огромное количество задач.

Я уверен, большинство из вас используют 5-10% возможностей ChatGPT. А когда вы поймёте все его функции и как с ними работать, вы выйдете на другой уровень.

Поймите, идея в том, чтобы вы использовать ChatGPT в качестве преподавателя и партнера без человека.

ИИ Ассистент может многое объяснять, у него всегда есть время, он всегда стремится помочь, он дает качественный ответ на почти любой вопрос. Но есть нюанс. Что это за нюанс?

Помните, если вы хотите получить хороший ответ, то должны задать правильный вопрос. Когда речь идёт об обучении, важно не только получать информацию, но и понимать, какие вопросы стоит задавать.

Да, chatGPT может ответить почти на любой вопрос. Но если вы не разбираетесь в предмете, то не знаете, какой вопрос задать и в какой последовательности. Начинаете улавливать?

Представьте, что вы находитесь в огромной комнате. У вас есть ключ, и вам нужно найти замочную скважины, чтобы выйти из темницы. Ключ у вас уже в руках, но замочную скважину не видно. Вы можете искать её очень долго. А если это не просто комната, а целый замок? Всё, что связано с искусственным интеллектом, больше похоже на замок.
26
Ч 4. Вы ходите с ключом по этому замку, задаёте вопросы, но не двигаетесь вперёд. Потому что вы не знаете, где замочная скважина. Вы не знаете, какой задать вопрос. Если есть кто-то, кто скажет: «Вот замочная скважина», вы открываете дверь — и идёте в новый мир. Вот, собственно, в этом и есть ценность курса.

Практически весь материал, который я использую, можно найти в интернете. Огромное, чудовищное количество ссылок — всё это бесплатно, доступно, можно смотреть. Но есть проблема: всё это раскидано по разным местам. Многие статьи, сервисы, инструменты требуют не просто изучения, а понимания и практики.

Разобраться самому, конечно, можно. Но у 99% людей на это просто не хватит времени, силы воли и настойчивости. Это непросто. Такова реальность.

Я стараюсь эту проблему решить. Я собираю всё в одном месте, компактно. Я уже потратил это время. Плюс, я всегда объясняю понятно, потому что смотрю на ситуацию не как технарь, а как человек, которому важно получить результат, пользу. Если речь о бизнесе — значит, я подхожу с этой стороны. Я не углубляюсь в технологии больше, чем это необходимо. Я делаю так, что вы не просто читаете, а начинаете понимать, что это и как это применить.

Посмотрите программу курса по ссылке: https://bit.ly/4kbDNME
23
ChatGPT от OpenAI достиг значительного рубежа, превысив 400 миллионов еженедельно активных пользователей, что означает резкий рост со 100 миллионов в ноябре 2023 года. Темпы роста ускорились, а ежемесячный рост пользователей увеличился с 8% до 15,5%. Несмотря на конкуренцию со стороны других платформ ИИ, таких как DeepSeek, ChatGPT остается доминирующей силой в секторе ИИ, причем пользователи используют его для различных задач, от домашних заданий до исследований. Прогнозы предполагают, что к концу 2025 года число пользователей ChatGPT может достичь 1 миллиарда, что свидетельствует о сильном общественном интересе и зависимости от технологий ИИ. https://x.com/i/trending/1892829722637189429
17
В самом разгаре AI.Engineer саммит. Что это, но сначала цитата Андрю Карпаты, Экс OpenAi, Tesla: "Похоже, скорее всего, будет значительно больше специалистов по созданию ИИ Агентов, чем инженеров по машинному обучению / LLM-инженеров. В этой роли можно добиться большого успеха, даже ни разу не обучая модель." (с) В конце поста супер новость, но сначала о саммите:

Это ведущая в мире техническая конференция для инженеров в сфере ИИ и руководителей (CTO и вице-президентов по ИИ), где они могут встретиться, обменяться знаниями и продвинуть развитие отрасли. Уже третий год подряд это ключевое событие в мире ИИ.

Среди спикеров и спонсоров прошлых мероприятий — основатели и топ-менеджеры компаний DeepMind, OpenAI, Anthropic, Meta, Cohere, Mistral, Midjourney, Cartesia, NVIDIA, Groq, Crusoe, Together.ai, Fireworks, LangChain, LlamaIndex, Databricks, Neo4j, MongoDB, GitHub, Microsoft, Google, AWS и многих других.

Тематика этого саммита — «Агенты в действии» с особым акцентом на реальные кейсы внедрения.

Собирают ведущих разработчиков ИИ-агентов, чтобы они поделились своими наработками, обсудили проблемы и предложили решения, которые помогут сделать 2025 год «Годом агентов». Участие только по приглашениям, так как мероприятие тщательно курируется.

Несколько тезисных идей (от Stepan Gershuni):

— 2024 был годом экспериментов с агентами, 2025 год внедрений. Их активно используют все, от JPMorgan, Reuters, BlackRock, Bloomerg до любого инвалида с заднего двора.

— При этом строить агентов, кроме крупных компаний не умеет никто. Никто не знает и даже если знает, то не делает agentic evals, observability, ops.

— Голосовые агенты грядут. Если в 23-24 годах ИИ заменил всю текстовую поддержку, то до 2026 заменит всех операторов телефонов. Прикольные кейсы про анализ и синтез эмоций в голосе и оценку эффективности.

— Специализация. От агентов, которые делают любую херню (с 99% точности) мы приходим к агентам, которые делают очень узкую и четкую задачу, но с 99.99% точности — и только такие агенты будут использоваться тысячами бизнесов в мире.

— Чем больше делают агенты, тем больше их клиентами становятся другие агенты. Сегодня мы строим агентов для людей; завтра — агентов для других агентов.

Мой коммент:

Хотите знать, чему учится, чтобы не отстать в мире наступающего ИИ? Учитесь учить ИИ, выращивать личность, эксперта, мудреца, консультанта, сотрудника, ИИ Агента.

Хотите запускать бизнес? Создавайте Агента, который будет работать на вас вместо людей.

Конечно, вы можете в это не верить, у вас может быть много возражений. Примерно, как у производителей картер, когда они видели первые автомобили и смеялись. Если вы считаете себя самыми умными и верите, что точно на 100% возможно, а что нет - не читайте и отпишитесь.

Если вы все таки нутром чувствуете, что что-то в этом и есть и хотите узнать больше - я написал несколько статей и сделал БЕСПЛАТНЫЙ крошечный курс. Посмотрите программу здесь: https://bit.ly/4kbDNME
33
Пример супер кейса использования ИИ для реального заработка, но есть плохая новость. Подходит только тем, у кого есть что сказать:

Spotify запартнёрился с ElevenLabs и теперь позволяет загружать аудиокниги, которые зачитывают их сгенерированные голоса.

Теперь начинающие авторы книг (а среди креаторов таких всё больше) смогут легко создавать аудио-версии в нескольких голосах на 29 языках мира всего по стоимости Pro-подписки в ElevenLabs за $99/мес.

Разработчик Гергели Орос рассказал на примере своей книги "Руководство инженера-программиста", что профессиональная запись аудио-версии обошлась ему в $10K.

За первые 2 месяца продаж он заработал с нее $3,302, которые распределились так:

• $2,079 от продажи DRM-free версии (версия без защиты от копирования)
• $1,223 от платформ вроде Google Play, Spotify и Libro

Ожидаемый срок окупаемости — 6-10 месяцев. И это при том, что у Гергели огромная аудитория — почти 1 млн подписчиков на Substack.

С текущей технологией от ElevenLabs и их коллабой со Spotify затраты были бы в 100 раз ниже.

Не забывайте 3-его марта начнется бесплатный курс - для тобо, чтобы быстро вкатится - маст. Мы там поиграем и с ElevenLabs. Программа: https://bit.ly/4kbDNME
22
Как расти и учится в 1000 раз быстрей? Ответ известен - проектное обучение + кого-то учить? Как это работает?

1. Проектное обучение это когда ваша цель сделать то, что ВАМ НУЖНО, и поэтому вы учитесь.

Т.е. вы не учитесь, чтобы получить оценку или прокачать себя - это все НЕ Р.А.Б.О.Т.А.Е.Т.

Вы учитесь, чтобы сделать то, без чего вы умрете, т.е. даже если вы ничего не знаете и не умеете, то ЖИТЬ ТО ХОЦЦА!

Поэтому вы учитесь, как черт, потому что если достигните целей, создадите то, что для вас ЖИЗНЕННО важно. Не достигните - сгинете на хрен.

Вот так стоит вопрос, между прочим, у китайцев и индусов, а все, кто в СНГ - пребывают в вечном каматозе, всех обвиняют, строят из себя жертву, придумывают оправдания типа: я живу в жопе мира, я старый, я девочка, я блондинка, я гуманитарий и не дружу с технологиями. Думаете, если вы лишитесь работы и будущего вам будет легче от этой пурги, которой вы накачали свою голову?

2. Почему учить других важно?

- объяснишь другому, на 5-й раз поймешь сам
- объяснишь простое, начнешь понимать сложное
- будете стараться понять лучше, чтобы не подумали, что вы кретин
- будете стараться объяснять понятно, потому что понятно объясняет только тот, кто ясно мыслит. Вы учитесь МЫСЛИТЬ ЯСНО.
- будете развивать способность говорить и писать (без обид, вы на 99% грамотные, но ни говорить, ни писать не умеете).

3. С чего начинать учить, если ни белмеса не понимаете?

Тоже мне проблема! Спросите себя, кого больше в мире - тех, кто мало понимает или супер экспертов?

Начинайте с азов, и миллионы людей придут к ВАМ, а не к эксперту. Почему? Потому что вы способны объяснять просто и понятно для начинающих, а эксперта переполняют знания, снобизм и гордыня, и ему объяснять ликбез западло каким-то ламерам.

Даже если вы прочитали всего 10 статей и дали себе труд разобраться, вы уже стали экспертом для МИЛЛИОНОВ людей.

4. Почему это работает? Почему люди придут к вам и будут учиться? Почему будут ПЛАТИТЬ вам, хотя вы рассказываете то, что лежит везде БЕСПЛАТНО?

В этом и проблема, что всего СЛИШКОМ много и оно везде! Нужно во-первых знать что и где искать, а главное потратить время, т.е. выделить время, поставить цель, держать фокус, чтобы все это свести воедино.

Но правда жизни в том, что вы:

- не знаете какие вопросы спрашивать
- не знаете, где и что искать
- не можете поставить цель
- поэтому нет фокуса
- поэтому не выделяете время и не ставите приоритетов
- поэтому ничего делать вы не будете

ПОЭТОМУ будете только впадать в депрессию и испытывать ТРЕВОЖНОСТЬ. Потому что ВСЕ ЭТО ПРОНОСИТСЯ МИМО вас, а вы на обочине.🥶

Время уходит, жизнь проносится, годы уже не, "Я не успеваю, не успеваю. О, мама! Мы все умрем."

И вы знаете, что все это 100% правда. И таки что делать? Давайте по шагам:

Шаг 1-й: Бобер - выдыхай. Вы еще умерли и все норм.

Шаш 2-й: Посмотреть программу моего бесплатного курса о том, как вкатиться в ИИ.

За просмотр деньги не берут и даже если вы ненавидите инфоцыган, то не переломитесь, и НИКТО НЕ УЗНАЕТ, что вы одним глазком посмотрели. 🤣

Видите ли, проблема в том, что вы все боитесь. Но единственное, что может гарантировать вам жизнь то, что вы ТОЧНО умрете. Так может стоит перестать боятся и начать веселится?

Если вы попали в этот тематический парк (планета Земля), стоит начать с того, что посмотреть микро курс, который откроет вам глаза. Тем более бесплатно! Все как вы любите - чтобы ни за что не платить, на холяву, без труда, без ответственности и сразу миллионЭр! Да?

Думаете 100% опять мерзкая ловушка? Нет, вы ошибаетесь. Это 100000% ловушка!🤣 Но ведь любопытство неудержимо?

Мы же играем. Кто кого переиграет? Да? Вы же мне в своей голове говорите: "Хрен ты с меня чего поимеешь!" Но Игрок-то знает на много ходов вперед. Он знает, что вы уже на крючке. Коготок завяз, всей птичке пропасть и не говорите, что вас не предупреждали!

Вот здесь выход из этой реальности, программа курса (одним глазком, никто не увидит): https://bit.ly/4kbDNME
44
TheVerge пишет:
— GPT-4.5 aka Orion может появиться уже на следующей неделе, поскольку Microsoft прямо сейчас освобождают серверные мощности для развёртывания моделей
— «Нам сообщили, что Microsoft ожидает GPT-5 в конце мая, что совпадает с обещанием Sam Altman о появлении модели следующего поколения в течение нескольких месяцев»
— релиз/анонс GPT-5 могут быть привязаны к конференции Microsoft Build, которая начинается 19-го мая
16
Chief Operating Officer OpenAI Brad Lightcap в интервью для CNBC рассказал, что бизнес растёт, цветёт и пахнет:

— OpenAI быстро развиваются, несмотря на растущую конкуренцию, в том числе со стороны китайских компаний

— в феврале компания достигла 400 миллионов активных юзеров в неделю (Weekly Active Users, WAU). Это рост на 33% по отношению к декабрю — очень стремительно!

— у компании сейчас есть 2 миллиона платящих корпоративных пользователей (прим.: скорее всего речь о подписке Team за $25). Это удвоение показателя с сентября.

— за последние 6 месяцев количество трафика на reasoning-модели в API выросло в 5 раз.

(и всё это с учётом того, что два последних продукта, Operator и Deep Research, недоступны бесплатным пользователям, а также тем, кто платит $20/мес)


По информации от TheInformation OpenAI нацелены на достижение ЕЖЕДНЕВНОЙ (не недельной) аудитории в 1 миллиард человек уже к концу 2025-го года. С каждым месяцем цель выглядит всё реалистичнее и реалистичнее. Компания планирует выпуск GPT-5 и предоставление практически безлимитного её использования даже для неплатящих пользователей — что должно привлечь огромное количество людей.

Поэтому, все идем на бесплатный курс "Эффективное использование chatGPT". Просто посмотрите программу и вы упадете: https://bit.ly/4kbDNME
28
7
Ну вот. Для приличной девушки главное покочевряжиться, иначе могут подумать, что она бл..ь. Ну и какая сделка без торговли. А сохранить лицо? Таки немного политики для тех, кто любит погорячей: https://www.facebook.com/groups/tcrpolitcs
16
Часть 1. Какой ИИ лучше? Какой ИИ выбрать? От OpenAI, от Google, от Антропик, DeepSeek? Каким генератором картинок пользоваться? Midjourney или Stable Diffusion? На чем лучше видео делать? На SORA или Kling, а может на Pica, а может на Runway? Или Haygen?

Что выбрать из сотен стартапов, бесконечных ассистентов, умных чатов? А может Groc3 Илона Маска всех убил? Или модельки от китайцев? Или чатик от Яндкса?

На каком лучше тексты писать? На каком лучше кодить? На каком лучше математические задачки решать?

Если я вижу, что, как тут один колхозник написал "Groc3" всех уделал, или какой-нить программист пишет "Сонет самый крутой", то понимаю, что это пишет невежественный дилетант. Давайте разбираться.

1. На данный момент только открытых моделей более 1,445,971. Ага. Это за пару лет. Не знали штоле?🤣 Не считая закрытых от OpenAI, Groc3, Anthropic, Google и т.п. см. https://huggingface.co/models

2. Модели очень разные. Есть языковые модели, которые работают с любым текстом (код это разновидность теста), рассуждающие модели, генераторы тех же текстов, картинок, видео, звуков, модели для компьютерного зрения, модели для обработки естественных языков, для обработки аудио, модели для быстрой обработки процессов реального времени, IoT и т.п. Есть мульти-модальные модели и моно-модальные.

В итоге модели показывают разное качество на разных задачах, как и любой инструмент, модели имеет свои границы применения и кейсы, где можно достигнуть лучших результатов. Но это не все.

3. Есть масса площадок, где проводят соревнования моделей, предлагая им тестовые задачи из разных разделов науки, работы с текстами, с кодом, с математикой и т.п. Одна из самых известных площадок - https://lmarena.ai/?leaderboard

На ней можно выбрать разные типы задач, и вы увидите, что на разных задачах лидируют РАЗНЫЕ модели.

К примеру, в написании кода на текущий момент лидеры:

1. chocolate (Early Grok-3)
2. o3-mini-high от (Open AI)
3. Gemini-2.0-Pro-Exp-02-05 (Google).

В работе с текстами, в "творческом писательстве" лидеры:

1. ChatGPT-4o-latest (2025-01-29) - (Open AI)
2. chocolate (Early Grok-3)
3. Gemini-2.0-Flash-Thinking-Exp-01-21 (Google)

В работе с русским языком:

1. Gemini-2.0-Pro-Exp-02-05 (Google)
2. Gemini-2.0-Flash-Thinking-Exp-01-21 (Google)
3. chocolate (Early Grok-3)

Оговорка: ChatGPT-4o-latest (2025-01-29) - на 4, а o1-2024-12-17 на 5 месте.

Можно этому доверять? Нет и вот почему.

Угадайте с 3-х раз, кто создает все эти тесты и оценивает модели? Правильно!

Программисты и гики. И эти ребята отлично понимают в технологиях и коде, но ни хрена не понимают в текстах. Потому что все тексты с которыми они работают это мануалы и пейперы, которые с литературной точки зрения представляют собой унылое гавно.

Т.е. прогеры считают это нормальными тестами. Потому что слаще морковки ничего не читали. Какого-нибудь Борхеса, или на худой конец Сервантеса или даже Умберто Эко. Да Маркеса, наконец. Ладно, я понимаю, что много требую. Ок!

Понедельник начинается в субботу? Не? Чайку? Которая Джонатан Ливингстон? Сорри, это я троллю. Атака на Титанов и катка в Танчики это наш предел.

Доказательство: Если бы было иначе, то не существовало бы таких профессий, как технический писатель, копирайтер, UX writer.

В среднем самый херовый блоггер пишет креативные тексты, чем самый крутой прогер.

Я, к примеру, очень уважаю Андрея Карпатого (крутой чел в ИИ коммунити), но если вы посмотрите на его СУПЕР известные лекции по ИИ с точки зрения Instructional Design - это пиздец. По русски: Объяснять ПОНЯТНО он не умеет.

Промежуточный вывод:

- Мало того, что разные модели лидируют в разных тестах, но и доверие этим тестам иногда сомнительное.
- Учитывайте, что этих площадок для соревнований также много, все они конкурируют за трафик и кричат - "У меня, у меня все единственно правильно".

Но все гораздо, гораздо хуже.

3. Проблема, как ее формулируют умные айтишники: гавно на входе, гавно на выходе. Перевожу для гуманитариев:
621
Часть 2. - Если вы спросите модель глупость, получите глупость.
- Если вы не умеете правильно формулировать промпты, получите глупость.
- Если вы не понимаете, для какого кейса данная модель лучше подходит, получите фигню.

Начинает доходить? Продолжим аналогии:

- Неча на зеркало пенять, если рожа крива!
- Не стоит микроскопом колоть орехи (именно этим занимается 99% тех, кто общается с современными моделями).

И вишенка на торте, цитатка от Билла (наше все) Гейца: Умного можно научить, дурака умным не сделать!

Итог. Сначала хорошая новость - если вы умны, образован и СПОСОБНЫ учится, ИИ усилит вас. Если вы тупарь и колхозник, ИИ вам не поможет.

HARD CORE: А если вы не понимаете юмор и стеб, то вам поможет только смерть и 234 перерождения, начиная с навозной мухи. Это как обучение модели - нужно много данных, компьюта (вычислений) и бабла, чтобы научить модель не просто понимать вас, но и распознавать юмор. Так что - ничего личного. Идем дальше и тут СНОВА проблема.

"Так какой ИИ выбрать, мазафака? Мне все эти многобуковок ненавистны. Ты, мне гад, по простому скажи! И обоснуй!"

Ок. Много из вас кодит? Думаю 2%, а через 5 лет будет 0%, поэтому за кодинг не переживайте, все равно кодить за вас ИИ будет и ниже я скажу, какой лучше.

Но вам всем нужны тексты, некоторым таблички, всем нужен поиск, ответы на вопросы. Т.е. посмотрите на то, чем вы занимаетесь БОЛЬШЕ ВСЕГО? Ответ:

Вы больше всего читает, пытаетесь понять, пишите какие-то тексты, создаете документы, анализируете данные, иногда взаимодействуете с сервисами, реже делаете картинки, иногда дизайны, совсем редко видео и еще реже звук и музыку. И вы все общаетесь, отвечаете на вопросы.

Поэтому, конечно, есть модели, которые решают продвинутые математические задачи, но они нужны 5% из вас - ученым, прогерам, инженерам.

Но 100% из вас нужны модели, которым вы можете задавать вопросы, анализировать документы, изображений, иногда решать какие-то проблемы, советоваться и делать все это на русском или английском (да и любом языке), но вы хотите, чтобы русский модель понимала хорошо и хорошо на нем писала. А кодинг потом. Понимаете мою простую мысль? И на данный момент ответ на вопрос "Какой ИИ выбрать?" - вы можете найти на картинках, и я объясняю почему это так, но сначала оговорка:

[ОГОВОРКА]

1. Вы все можете сами посмотреть и сравнить здесь: https://lmarena.ai/?leaderboard
2. Если хотите углубится в вопрос сравнения моделей - почитайте пару коротких простых статей - все очень доступно разложено:

- Which LLM Suits You? Optimizing the use of LLM Benchmarks Internally. https://www.riskinsight-wavestone.com/en/2024/09/which-llm-suits-you-optimizing-the-use-of-llm-benchmarks-internally/

- Best LLM: Benchmarks, Leaderboards, & the 8 Smartest LLMs - https://www.acorn.io/resources/learning-center/best-llm/

- Best LLM Leaderboards: A Comprehensive List https://www.nebuly.com/blog/llm-leaderboards

Хотите упороться? Нет проблем:

- https://github.com/METR/KernelBenchFiltered/tree/main/tasks/level_5
- https://scalingintelligence.stanford.edu/blogs/kernelbench/
- FACTS Grounding: A new benchmark for evaluating the factuality of large language models - https://deepmind.google/discover/blog/facts-grounding-a-new-benchmark-for-evaluating-the-factuality-of-large-language-models/

[КОНЕЦ ОГОВОРКИ] - кто лепит промпты оценит.🤣

Если не хотите тратить время на то, на что другие (я, к примеру) его потратили, читайте дальше и самое главное:

Почему для 99% из вас модель от OpenAI, т.е. chatGPT и прочее - ЛУЧШИЙ выбор? 6 аргументов, почему вам не стоит ломать голову, какую модель выбрать для 90% задача?
215
Часть 3. 1. Потому что на данный момент chatGPT лидер в 90% самых важных задач.
2. Потому что chatGPT предоставляет не только модель, но и самый удобный функциональный интерфейс, и это критически важно, когда у вас задача сложней рецепта супа.
3. Потому что chatGPT заточен для нормальных людей, а не разработчиков.
4. ТОЛЬКО chatGPT способен общаться ГОЛОСОМ ОТЛИЧНО на русском языке на данный момент, причем, как в десктоп приложении, так и в мобильном приложении. Т.е. нормально по-человечьи говорить вы можете общаться только с chatGPT!
5. У OpenAI на данный момент самая развитая инфраструктура создания ИИ Агентов на базе их ИИ Ассистента chatGPT, сопоставимая только с Google's Vertex AI Agent Builder (но до этого мы еще не дошли).
🥶6. По поводу создания кода. Чтобы создавать код, нужно иметь среду разработки. На текущий момент самая популярная и бесплатная это VS code, которая легко интегрируется с chatGPT, либо вы можете использовать Cursor, который является форком VS code, и позволяет интегрироваться с несколькими моделями.

Т.е. это важный момент - С КАКИМ МОДЕЛЯМИ интегрируются популярные сервисы типа: https://vercel.com/ / https://replit.com/

Почему это важно? Потому что, если вы выбираете какую-то захайпованную холявную модель для ПРАКТИЧЕСКИХ задач, то ВДРУГ вы понимаете, что у нее нет никакого обвеса и инфраструктуры. Это как вместо автомобиля вы получаете гору запчастей и агрегатов. Ну да, нерды это любят. Но людям надо ДЕЛОМ заниматься, а не всякими геморроями.

Очень показательный для рынка пример - какие модели и решения интегрированы в Zapier на данный момент: https://zapier.com/apps/categories/artificial-intelligence

Однако, поскольку, вы, конечно, мне не верите (я же хитрый инфоцыган, это вы все умники и не понимаете, что мой бэкграунлд в 10 раз больше вашего), то вот вам сравнительное исследование, выполнение через Perplexity и Groc3:

1. Perplexity: https://www.perplexity.ai/page/comparative-analysis-of-major-vmW6LAB2QwW_xcQqv0Tm7Q

2. Groc3: https://x.com/i/grok/share/rBK5Pl3l6TC3Jd1oBJWTls36e

Вывод. Начинать изучать ИИ, начинать использовать ИИ, понимать что и как это работает в 90% задача 100 из 100 лучше с chatGPT. Как это сделать?

Посмотреть программу короткого и БЕСПЛАТНОГО курс «Как эффективно использовать ChatGPT?».

В курсе я систематизировал свои практики, поэтому это скорее мастер-класс. Получилось около 10 часов. Я показываю возможности и добавил небольшие тесты. Программа: https://alexeykrol.com/courses/ai_intro/
1129
Forwarded from Трендоскоп
Toп-5 возможностей недели от Трендоскоп Lab

1️⃣ CEO Figure AI поделился прорывом в ИИ для роботов и представил Helix — архитектуру из 2 ИИ-моделей, которая позволяет управлять роботом с помощью обычного языка. Это позволяет масштабировать способности роботов без необходимости длительного обучения.  

2️⃣ Microsoft опенсорснули модель OmniParser для улучшенного распознавания экрана. Она значительно повышает способности Vision-агентов выполнять задачи.

3️⃣ Epic Games подсветили успехи своего магазина приложений за 2024 год. Преодолели рубеж в $1 млрд выручки, из которых $255 млн пришлось на игры от сторонних разработчиков. В этом году обещают возможность публиковать и неигровые приложения.

4️⃣ Crunchbase перезапустились в формате «ИИ-платформы»: от обычной базы стартапов перешли к сборнику инсайтов и предсказаний для инвесторов. СЕО утверждает, что в эпоху ИИ все ищут инсайты, а не голые данные.

5️⃣ Meta Creator Program: фонд на $50М для создателей XR-миров на платформе Meta Horizon Worlds. Также открыли десктопный редактор. Доступна монетизация внутри миров Horizon, с продажей предметов и доступов.

🎙Showcase проектов сообщества:

https://tttttt.me/FootballPoolbot/tma — приложение с безопасными ставками на футбол, где нельзя проиграть деньги. Запустились на Product Radar

Спасибо за подсветку возможностей участникам комьюнити Трендоскоп Lab: @vitek_ru, @DAFund, @haradzetski, @solopreneur_tg, @andevoo, @adhdproduct, @phil9l. Присоединяйтесь к нам — подать заявку можно в этой Гугл-форме. Велкам!
7
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Neo Gamma от 1X

Новый прототип куда шустрее августовской Beta. Интересно, когда они уйдут в продажу?

@ai_newz
110
#новости Политика США с Мясником👹 В чем отличие. В потоке событий лишь 0,01% реально важные, на которые стоит смотреть. Я показываю только на такие события и не трачу время на несущественные. Все события, на которые я показываю - потенциальные Черные лебеди.

- Илон Маск, возглавляющий Департамент эффективности правительства президента Дональда Трампа, внедрил новую политику, согласно которой все федеральные служащие...

- Это важно. Президент Дональд Трамп уволил нескольких...

- Тоже ожидаемо: Бывший президент Дональд Трамп публично призвал Илона Маска..

- Этот тренд показателен...

- Молодец, мальчик, доложил папе, что домашнюю работу сделал: В недавнем телефонном разговоре между президентом США Дональдом Трампом и премьер-министром Канады Джастином Трюдо Трюдо сообщил...

- Люди не (совсем) идиоты, все видят: Мэр Лос-Анджелеса Карен Басс отстранила...

- Да, это так: В настоящее время Соединенные Штаты сталкиваются с нехваткой...

- Мы побеждаем: Федеральный судья отменил предыдущее решение, теперь разрешив президенту Дональду Трампу...

- Идет обмен ударами. Трамп наступает, DeePState обороняется, но с приходом..

- А вот и момент истины. Кто под кого прогнется? Администрация Трампа потребовала от Украины...

- А вот это уже совсем серьезно: Авиакомпании изучают введение сборов на основе ...

- Господи, как СМИ деградировали, обалгивая людей. По делом, получили по заслугам: NBC Universal урегулировала иск о клевете на ...

- Все жестко в этой теме. Команда Илона Маска по сокращению расходов привела к сокращению примерно ...

- А вот это реальная жопа для тех, кто понимает. Недавно была крупная ...

- Маск жгет: Недавно Илон Маск сделал спорные заявления в социальных сетях, утверждая, что президент Украины Владимир Зеленский

- Ой, еще один: Компания 1X Technologies выпустила ...

- Вообще то так это и работает: Конгрессмен Роберт Гарсия получил письмо от Министерства юстиции...

1. Все новости снабжены ссылками, можете сами читать первоисточники.
2. По возможности даю комментарии, если оно того стоит.
3. В группе нет мусора, потому что я все посты модерирую лично руками.
4. Любых неадекватов баню немедленно.
5. Полная свобода слова + ответственность.

Хотите перестать тратить время на хню и увидеть главное? Хотите перестать быть полезным идиотом? Прыг сюда, вход свободный, выход 100$. https://www.facebook.com/groups/tcrpolitcs (шутка, не ссыте).
117
Когда я осознал, что 90% читателей не хочет ничего слышать о политике, я подумал как совместить мое понимание, что следить за политикой стоит, тем более рефлексировать на эту тему. И факт, что политика интересна 1% людей моложе 45. Поэтому я создал группу на ФБ, там фокус на политику и разные события. Ну а здесь - ИИ, бизнес, продукт, маркетинг, Теория Каст и Ролей и великая игра + немного технологий. Почему такой странный микс?

Потому что если вы хотите расти в этом мире, вы должны иметь несколько скилов, нравится вам это или нет. О чем речь?

1. Вы должны понимать, в каком мире вы живете и его правила и ничего лучше Теории Каст и Ролей нет. Не верите, смеетесь? Да мне плевать. Вся ваша жизнь будет иметь единственный четкий рубеж - до того, как вы вкурите ТКР и после. Через эту микро инициацию прошли уже тысячи людей.

2. Вы должны до определенного уровня разбираться в технологиях. Я писал об этом миллион раз - это вторая грамотность и более не имеет отношения к вашей профессии. Это мета скил.

3. Вы должны уметь использовать ИИ на полную катушку. Владеть ИИ через год будет как владеть MS Word / Excel 20 лет назад - это даже не обсуждается.

4. Вы должны понимать основы современного диджитал маркетинга. Это тоже мета скил. Это про понимание того, что есть человек, как им управлять. Маркетинг это не про бизнес, а про способность добиваться от людей того, что вы хотите.

5. Вы должны уметь организовать себя. Это самое трудное, потому что для этого надо ответить себе, чего вы хотите, уметь ставить цель, приоритеты, держать фокус. Держать фокус, держать фокус. Вы должны уметь быть упертым и гибким, не бросать и все время учится.

6. И вы должны научится брать риски, научится идти, несмотря на страх. Надо воспитывать личную силу, когда нет ни мотивации, ни надежды, ни веры, когда все плюют, а вы все равно идете.
61
Ч 1. Так! Венчурные инвесторы на выход. Скрипач не нужен. Crunchbase откажется от своего прошлого как поставщика исторических данных и станет платформой прогнозов на основе ИИ, предсказывающей раунды финансирования стартапов, поглощения и траектории роста компаний.

Сан-францисская компания объявила сегодня о перезапуске своей платформы с моделями ИИ, способными предсказывать будущие бизнес-события с точностью до 95%. Компания делает ставку на то, что искусственный интеллект кардинально изменит процесс принятия решений инвесторами и компаниями на частных рынках.

«Индустрия исторических данных в том виде, в котором мы её знали, мертва», — заявил генеральный директор Crunchbase Джагер МакКоннелл в интервью VentureBeat. «Если ваша компания занимается исключительно историческими данными… думаю, вскоре вы поймёте, что они больше не нужны в прежнем объёме».

ИИ разрушает традиционные рыночные данные: Crunchbase объявляет старую модель «мертвой»

Этот шаг означает радикальный поворот для Crunchbase, который на протяжении 15 лет был известен как краудсорсинговая база данных о стартапах. МакКоннелл утверждает, что традиционные поставщики данных сталкиваются с угрозой существованию со стороны ИИ-систем, которые легко усваивают и анализируют историческую информацию.

«Компании, работающие с ИИ, представляют экзистенциальную угрозу для поставщиков данных, а не только для разработчиков ПО», — отметил МакКоннелл. «Если ваш бизнес построен на исторических данных, как только они попадают в эти системы, факты остаются фактами. Даже данные за платными стенами со временем утекут, а после этого их ценность исчезнет, потому что ИИ сможет генерировать более точные инсайты, объединяя их со всей доступной информацией в интернете».

Вместо того чтобы сосредотачиваться только на прошлом, Crunchbase теперь использует свою обширную базу данных — включая модели поведения 80 миллионов активных пользователей — для прогнозирования будущих бизнес-результатов. Искусственный интеллект анализирует тысячи сигналов, чтобы предсказывать события, связанные с привлечением инвестиций, поглощениями и ростом компаний.

Как Crunchbase использует данные 80 миллионов пользователей для предсказания следующего крупного стартапа

По словам главного директора по продукту Мега Гаутама, прогнозы Crunchbase основаны на уникальном сочетании переданных данных, информации из публичных источников и анонимных пользовательских моделей взаимодействия.

«Настоящая магия в нашем умении предсказывать ключевые этапы жизни компаний заключается в непревзойдённой широте и глубине знаний», — заявил Гаутам в интервью VentureBeat. «Мы создали функции, которые не привязаны к конкретному набору данных, а обобщены».

Компания утверждает, что её прогнозы по финансированию достигают 95% точности и 99% полноты при ретроспективном тестировании — это означает, что Crunchbase правильно идентифицирует большинство компаний, которые действительно привлекут инвестиции, при минимальном количестве ложных срабатываний. Для прогнозов на 12 месяцев точность остаётся на «высоком уровне 70%», по словам МакКоннелла.

Помимо инвестиций, ИИ Crunchbase может предсказывать слияния, IPO, рост компаний и даже возможные увольнения. Однако МакКоннелл отметил, что некоторые негативные прогнозы не будут публиковаться, чтобы не навредить компаниям.

Будущее инвестиций: сможет ли ИИ превзойти человеческое принятие решений?

Стратегический сдвиг происходит в то время, когда инвесторы всё больше ищут прогнозные сигналы, а не только исторические данные. «Главный вопрос, который они пытаются решить, — что делать дальше?» — говорит Гаутам. «Наши пользователи хотят быть первыми на рынке».

В будущем МакКоннелл видит Crunchbase как платформу, которая станет основой для инвестиционных решений на базе ИИ, включая возможные системы автоматического инвестирования и индексы, отслеживающие частные рынки.
10
Ч 2 Так! Венчурные инвесторы на выход. Скрипач не нужен. «Думаю, через пять лет все старые компании исчезнут», — предупредил МакКоннелл, говоря о традиционных поставщиках данных. «Таким гигантам, как Salesforce, придётся пересмотреть свой пользовательский интерфейс… всё настолько быстро меняется, что через пять лет поставщик данных, который не делает того, о чём мы говорим, просто перестанет существовать».

Этот трансформационный шаг ставит Crunchbase в более прямую конкуренцию как с традиционными поставщиками рыночной информации, так и с новыми платформами, использующими ИИ для инвестирования. Компания планирует позволить клиентам интегрировать её прогнозные сигналы в свои собственные модели, при этом сохраняя контроль над ценными исходными данными.

Аналитики отмечают, что поворот Crunchbase к ИИ происходит на фоне растущего интереса к использованию искусственного интеллекта в инвестициях, хотя многие инвесторы по-прежнему скептически относятся к полностью автоматизированным методам. Успех компании будет зависеть от её способности поддерживать высокую точность прогнозов при масштабировании, а также от доверия клиентов к её прогнозам, созданным ИИ.

МакКоннелл подчёркивает, что цель Crunchbase — не заменить человеческое принятие решений, а дополнить его: «Мы твёрдо верим в дополнение, а не замену… Инвестиции остаются субъективными: ваша гипотеза должна соответствовать реалиям, а цена — быть оправданной».

Обновлённая платформа Crunchbase.ai запускается сегодня, знаменуя, по словам МакКоннелла, «точку невозврата» в изменении способов оценки частных компаний инвесторами. В его представлении будущее принадлежит не тем, кто собирает наибольшее количество данных, а тем, кто лучше всех предсказывает, что произойдёт дальше. Источник: https://venturebeat.com/ai/crunchbases-ai-can-predict-startup-success-with-95-accuracy-will-it-change-investing/
7
LLM – умри или сдохни

Проходил мимо симиларвеба, чисто ради интереса посмотрел размеры аудиторий у крупных LLM.

ChatGPT – 3.8 млрд визитов
DeepSeek – 0.27 млрд визитов
Gemini (Google) – 0.26 млрд визитов
Claude – 0.07 млрд визитов
Grok – 0.001 млрд визитов

Что получается:

– ChatGPT – монополист
– DeepSeek – хайпожоры (за месяц прилично набрали)
– В Gemini налили трафа
– Остальное – команда догоняющих

Мысли по этому поводу:

1. Конкурентов то уже огого как много!
2. Продукт у всех очень похож
3. Это обычно приводит к конкурентной рубке, демпингу и админ ресурсу (см набросы Маска на Альтмана).

Кино будет интересным, ну а мы с вами (как пользователи) только выиграем!

❤️ – DeepSeek
👍 – ChatGPT
226