InNeuralNetwork
5.15K subscribers
132 photos
55 videos
147 links
ChatGPT, нейросети и опыт их использования.

Для связи: @biblik
Download Telegram
GPT-5 выходит сегодня и другие новые фичи ChatGPT

- доступно бесплатно (mini версия, ограничена запросами), в Plus с расширенной квотой и размышлениями, в Pro с Pro версией и безлимитом на обычную версию
- минимальный процент галлюцинаций
- отлично подходит для натуральных текстов, рабочему коду
- прокачали голосовой режим
- можно доработать персону и внешний вид интерфейса ChatGPT
- работает быстрее предыдущих моделей в режиме исследования
- на темы «на грани» будет отвечать безопасно, а не отказывать в выполнении
- со всеми наворотами GPT-5 Pro с Python и интернетом чуть хуже справляется с тестом Last Human Exam, чем Grok 4 Heavy
- с 1 запроса делает красивый результат кода, участилось использование фиолетового
🤩106👍2
Media is too big
VIEW IN TELEGRAM
За 2 запроса в Cursor с GPT-5 получилось собрать простую игру в червячков, логику и архитектуру при этом не прописывая
112👍2
✍️ Первый результат с сервисными агентами вероятно разочарует, так как в задаче нет, что на самом деле надо

Недавно друг попробовал агента в Comet, чтобы автоматизировать задачу, а на деле донять меня вопросами «почему он тупой?». Мол, добавить продукты в корзину для приготовления курицы с картошкой плохо выполнил, не добавив приправы 😵. А по итогу агент выполнил то, что от него просили — с 1 запроса собрал корзину. Причина не в «тупости», а в отсутствии личного контекста. И я думаю, что хорошо бы обозначить, почему происходит подобная халтура и как ее минимизировать

Нужно добавить стоп-факторы автономности, чтобы агент не буквально выполнил задач. Условно, «первоначально сверься, правильно ли ты пойдёшь выполнять задачу» или «Спроси о шаге, если не уверен». Приём очень похож из собеседования по созданию процесса от и до — люди дают задачу общими масками, а задача отвечающего понять, что на самом деле от него ждут, нежели просто отвечать без наводящих вопросов

🦥 Агенты ленятся как мы, когда не нужно заостряться на каждом шаге. Это общая задача или нужно что-то еще? Выбрать первый картофель в выдаче или самый заплюсованный? А курицу надо с учётом персон или веса? Так ещё и про бюджет, и бренд надо не забыть. Если не продумать ответы на эти вопросы, которые мы сами себе молниеносно отвечаем, будет лажа. Агент как соседский сын Вася. Тот пойдёт в магазин по вашему поручению, что-то наберёт, а вы ожидали другого. Вася желал как лучше, а на деле взгляд вины никто не отменял

ℹ️ Про авторизацию молчу, но лучше внести первостепенную информацию о себе. Имя, телефон, почта, а вот пароль лучше не скидывать. Не забываем, мы это передаём как будто бы третьему лицу

🏁 Нужен понятный результат. Не «купи картошку», а «собери корзину во Вкусвилле для приготовления варенной картошки по рецепту»

Недалеко от правды, что указывая детали будто бы проще самому сделать это руками, однако же в менее креативных задачах это не так. Агенты — это не «угадайку». Это исполнители с политикой по умолчанию. Если правил нет, вы получаете буквальный, часто неудобный результат

Навскидку приходит в голову подобный шаблон типовой задачи для сервисного агента:
Задача: <что нужно, для кого, на когда>
Контекст: <что уже есть / чего точно нет>
Ограничения: <бюджет, время, особенности>
Автономность: <буквальный / уточняющий>
Стоп-чеки: <авторизация, лимит цены, подтверждение шагов>
Вывод в одном предложении


В Comet ещё есть шаблоны для задач, чтобы каждый раз не пыхтеть над запросов. Так что один раз как надо сделали, далее пользуемся. И кстати, скидос на годовую подписку агентов в Comet ещё действует за несколько сотен рублей, а не долларов

🤖 InNeuralNetwork
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74👍2
Всякое рабочее с ИИ

Редко пишу про работу, но накину наблюдений без лишнего контекста:

По практике <2% мужчин замечают, что им пишет ИИ 🫢 под видом девушки. Помогают опечатки и генерация фото с аудио по запросу. А разоблачают чаще всего при невозможности позвонить, хе-хе

Самым дешёвым маркером копипейст ответа ChatGPT все еще остаётся список с подзагами по 2 предложения. Решал подобную задачу для hr-агентства, так как за последний год участились обращения, которые составлены по алгоритмам верно, а на интервью ни бе, ни ме. Так что, если откликаться на вакансию с применением нейронок, обращение повысит шанс ответа, если его написать 🤩 или переписать 🙂 самостоятельно

Знакомому продукт-дизайнеру отказали в работе в продукте с ИИ, когда тот не назвал метрики и не объяснил 🤓 архитектуру генеративной NLP-модели. «Читаю новости про нейросети, тестирую модели» уже, видимо, делают все. Для оффера на работу с ИИ нужно уметь объяснить низкую точность при жёстких SLA по latency и пути её роста. И это даже не уровень продактов и ML-инжинеров

⭐️ Кто считает метрики и обучает модели с дискретным выбором, рекомендую присмотреться к разбору Gumbel-Softmax на примере Городских сервисов Яндекса. Если слышите впервые, приём помогает вернуть градиент, не ломая логику выбора. В статье есть пошаговые выводы и пример с рекомендациями. Можно потестить после прочтения

По формату было интересно или я резко перешёл на другой язык? 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥72🤩2🌚2🗿2
Media is too big
VIEW IN TELEGRAM
💻 Вывел формулу любви и запустил AI-сервис по осознанным знакомствам в Tinder

Не секрет, что сервисы знакомств не заинтересованы в хорошем подборе знакомств, отношений и тем более. Дейтинги похожи на биржу труда из буклетов. Работу найти можно, но выбор ограничен, а качество так себе. Tinder’у выгодно, чтобы пользователи продолжали платить, а не нашли сразу нужный метч. Иначе платформа теряет сразу двух платящих пользователей после метча. И что бы они не заливали про совершенство по ML-подбору, давайте без эмоций посмотрим на исследование (спасибо, deep research в Perplexity):
🙂 Мужчине получить мэтч в 10 раз сложнее, чем женщине
🙂 Мужчины лайкают каждую 3 анкету, женщины — каждую 25
🥲 Для нахождения значимого партнёра требуется ~3960 свайпов (6-24 месяца жизни)
😭2 из 3 встреч заканчиваются ничем (люди не заметили проблем на этапе знакомства онлайн)
🧐 Мужчина за год тратит на дейтинг 350к+ рублей, женщина 240к+

И предлагаю это исправить. Для этого я с командой создали DateGuruрасширение для Chrome, которое учится выбирать партнёров в Tinder как вы. Просто обучите нейросеть на 50 своих свайпах или заполните форму, а DateGuru сам отсеит неподходящих и лайкнет тех, кто действительно вам понравится.

В анализе учитываются фото, контекст профилей, в особенности выставленные красные и зеленые флаги. Алгоритм учитывает, что важно соответствовать вашему вкусу и если не набирается проходящий балл или видны красные флаги, то такие анкеты лайк не получают. Помимо этого, с DateGuru получится:
🤑
В год сохранить 160-250 часов и сэкономить ~170к рублей (мужчины) и ~85к (женщины), снизив безрезультатные встречи
💬
Сразу перейти к нужному общению, минуя архаичный свайпинг

А сейчас еще и можно сэкономить деньги, так как воспользоваться DateGuru можно бесплатно ✔️ и без лимитов. Когда партнёр классный, остальное само встанет на свои места. Проверьте сами!

P.S. Если интересно почитать про историю создания DateGuru, то расписал подробнее в твитере

🤖 InNeuralNetwork
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18🤯17👀5🗿52👍2😁1
Посчитали цифры, выбрали цену

или как используют бенчмарки по выбору нейросетей

Я всегда думал, что для бизнеса все смотрят на лидерборды моделей и выбирают топовые из них. Так сказать, вчера это одно в ризонинге, но хуже в матеше. Сегодня наоборот, а завтра ещё что-то новое и там и там. Хотя на самом деле выходит иначе, что получилось узнать из исследования LLM Arena

При выборе модели лишь каждый пятый пользуется бенчмарками, когда все остальные проводят собственные тесты. Все упирается в доверие к таким замерам. Четверть рынка вообще плюет на красивые циферки в таблицах, хотя для моделепроизводителей это все ещё важно. Но, поскольку я и наверное многие из вас, используют модели под свои задачи, на подобные рейтинги становится, кхм, все равно? Опять же, если же вопрос не миллиардеру

Впрочем, важными остаются качество, цена, скорость, галлюцинации и совместимость с инфрой. И это подтверждается другими предпринимателями в сфере ИИ, мысли которых сообрали в аргументы за и против. Рекомендую почитать соображение про бенчмарки, для себя подметил такой тезис:
Только практика, собственная практика. Доверия train и test не раскрыто

Короче, если вы до сих пор выбираете модели по рейтингам — возможно, стоит пересмотреть подход. Рынок уже давно ушел от этого.

P.S. За исследованием стоит команда LLM Arena под руководством Романа Куцева. Полный отчёт и другие материалы про практическое применение и оценку ИИ можно глянуть в канале LLM Arena
👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
3 месяца ChatGPT Plus по цене за 1,5

Если у вас есть активная подписка ChatGPT Plus и привязана карта оплаты, можно получить 50% скидку за запрос отмены текущего плана. Правда только на квартал, а дальше снова по 20$ в месяц. Пробуйте 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18👍7🤩7😁31
Интеграция Gmail в ChatGPT — больше чем просто фишка

Когда на презентации OpenAI анонсировали интеграцию Gmail с ChatGPT, подумал: звучит хорошо, но у меня проблем с почтой нет. Подключил из любопытства и благополучно забыл. А сегодня понял, что надо нервно опробовать.

Веду календарь, но записываю события как придётся. Вот и сегодня смотрю: «ужин, 19:00». Всё. Больше никакой информации. А ведь два месяца назад казалось, что и так всё понятно. Деньги потрачены, время забронировано, а куда идти, кхм, ну не на кухню.

Обычно в таких случаях приходится копаться в почте. Искать по дате, ключевым словам, методом тыка и продолжительного скролла. И каждый раз это превращается в детективное расследование собственной рассеянности.

Но тут вспомнил про ChatGPT. Написал как есть:
Забыл, где у меня сегодня ужин в 19:00. Должно быть подробности в почте

И тот за минуту нашёл билет, адрес ресторана и даже детали бронирования. Никаких танцев с поиском, никакой головной боли. Просто получил результат и заведомо спас вечер.

Поэтому, если в Gmail можете что-то забыть или нужно вспомнить необходимый файл, то будьте хитрее. Интегрируйте Gmail в ChatGPT, а потом при случае формулируйте запросы как есть, а ChatGPT напряжётся как надо за вас
👍22🔥8
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT Pulse ваш личный новостник

OpenAI релизнула фичи, которая позволяет как Tasks получать ежедневные новости. Выполняется задача исходя из ваших чатов, подключенных сервисов и личной информации. Даже Google Календарь можно добавить. После выполнения каждой такой задачи вы можете указывать, как можно ее доработать в следующий раз.

Доступно уже сегодня на мобильных устройствах для Pro подписчиков, а далее уже ждем раскатку остальным
👍6
курс_ор

Наверное слышали про вайбкодинг. Но может не пробовали, а вроде хочется. Если аукнулось, вы такие не одни

Разработчики из Cursor подготовили дельный курс по основам, как применять ИИ в разработке. Час на простом английском, есть текстовая версия с квизами и все это бесплатно. сюда
🔥10👍6
Хорошая мысль про подписки моделей, сам безумно радуюсь Comet. Теперь еще и Genspark заинтересовал
Forwarded from Заместители
Media is too big
VIEW IN TELEGRAM
🚨 Тест-драйв ИИ-браузеров. Заезд второй

В первом заезде участники — просто трехколесные велосипеды по сравнению с теми, кого мы увидим сегодня. Честно говоря, я сам ждал, когда же доберусь до второго заезда — и вот наконец-то он тут!

Во втором заезде соревнуются три агентных болида:
- Genspark Browser (по этой ссылке рефералка на 1000 кредитов)
- Fellou (реферальный код на бонусные кредиты: G9GS31)
- Comet от Perplexity (рефки нет, есть только ограниченное количество инвайтов — о них в конце поста).

Помимо этого поста — будет ещё отдельный пост про каждый браузер с детальными видео, в лучших традициях этого канала. Уж очень много про каждый из них можно и хочется вам рассказать ☕️

Каждым браузером я попользовался пару дней, а также провёл одинаковые тесты, где браузер по текстовому промпту должен:
1. Подобрать новый iPhone и заказать его
2. Суммаризовать видео на YouTube и VK видео
3. Построить план на выходные с учётом моего расписания в Google Календаре и построить маршрут на карте
4. Провести ребрендинг Автоваза с генерацией новых логотипов (должен же был кто-то взяться за эту задачу 😁)


Также оценивались UX/UI и индивидуальные фишки браузеров.

Томить не буду, подводим результаты заезда:
🥇Победитель заезда — Comet от Perplexity.
Этот браузер — прекрасное комбо агентных функций и удобного браузера на базе Chromium. Космическая тематика, которой он пронизан, сразу заняла у меня в сердечке отдельное место. При этом браузер самый оптимизированный из всех. Всё работает очень шустро: и AI под капотом, и сам браузер. Ну и, конечно, все плюшки от Perplexity на месте — доступ к разным моделям, отдельные пространства и персональные подборки на страничке Discover. Отдельно отмечу Voice mode — будущий Джарвис (правда, пока он сыроват). Наконец, это единственный из трёх браузеров, где всё работает в России без всяких VPN и есть русскоязычная локализация. Лучший выбор для большинства юзеров.

🥈Серебро забирает Fellou
Это настоящий агентный браузер с ооочень самобытным UX/UI. Придётся забыть всё, что вы знали о браузерах, чтобы пересесть на него. Но дизайн сделан с любовью, и UX на самом деле продуман. Этот браузер может брать на себя настоящие агентные задачи и красиво жонглировать несколькими вкладками, где шуршат ИИ агенты. Но иногда это приводит к переусложнению: чтобы решить простые задачи (например, суммаризовать видео), он грозится вызвать целого ИИ агента, где справилась бы обычная LLM. При этом сами агенты думают подольше, чем в Comet.

🥉Финиширует последним в гонке браузеров — Genspark. Но одновременно он получает приз как лучший ИИ мультитул.
Если вы техногик, то количество встроенных сюда ИИ-функций вскружит вам голову. Тем более, что они работают на моделях от топовых вендоров (OpenAI, Google, Qwen…) и работают очень резво. Плюс разработчики впендюрили локальный ИИ прямо в браузер — значит, лёгкие модельки можно скачать на комп без доп знаний (об Ollama), и они будут доступны всегда, даже при нулевом балансе кредитов Genspark или без интернета. Но если вы обычный юзер — браузер разочарует. По ощущениям — это Android OS начала 2010-х: всё «деревянное» и «голое», работает немного топорно. И то и дело при работе агентов наружу торчат всякие куски кода, которые с точки зрения «красоты» должны быть спрятаны под капот.

Кстати, специально для этого обзора я оформил подписку на Genspark. И оказалось, что он отлично подходит для нешго Цеха ИИ агентов, где мы ценим не красоту, а функциональность. Значит берем его стажером и еще погоняем!

Заключительная мысль — после теста стало очевидно, что подписка на отдельную LLM потихоньку теряет смысл. Буду активно юзать Comet и Genspark весь месяц, и в конце месяца решу, стоит ли продлевать подписку на ChatGPT.

Подробные разборы каждого браузера буду публиковать в следующие три дня.

И в конце серии постов сделаем мини-розыгрыш инвайтов 🤔 в браузер Comet (без инвайтов или Pro-подписки Perplexity его нынче не скачать).



Подписывайся, чтобы не пропустить детальные разборы и розыгрыш.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥72
Media is too big
VIEW IN TELEGRAM
Sora 2

Качественно, человечно и физично. Еще и звук добавили. Доступно постепенно на сайте и отдельным приложением (не в России)
🔥8👍1
Да здравствует Apps

OpenAI представила SDK для интеграции приложений непосредственно в ChatGPT. Можно сразу в запросе получить диаграмму в Figma, плейлист в Spotify, курс в Coursera. Позже в этом году можно загружать свои приложения

Расскатывается постепенно (лучше использовать США регион)
5🔥5👍1🤯1
Оживить фото без танцев с бубном

Затестил новую фичу в Алисе (приложение), где закидываешь фотку, а на выходе получаешь видео (прикол), правда без звука. Порадовало, что меньше минуты обрабатывает запрос, супер простой интерфейс, без вотермарков. Консистентность деталей радует, критов не заметил как было раньше с кашей в деталях 🚲

Запрос можно как самому написать, так и сгенировать в 1 кнопку. Корректность результата нигде нефиксированная, но на мой взгляд ограничивается 4 состояниями и хроном до 4 секунд. Для короткой идеи без резкой динамики и на ура работает, сам кадр остаётся как статичным так и с зумом (для людей хорошо справляется). Детали меняются выборочно на переднем плане, с ними происходит взаимодействие по физике. Из-за этой особенности фото с закрытой диафрагмой 🔭 (так сказать, что находится в супер фокусе, а другое в размытии) будет не хватать движа в деталях.

В остальном клевый режим, пробуйте через Алису в чате

#реклама
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
Как получить бесплатный торт в ресторане 🎂

Напомню, что это канал все ещё про опыт использования нейросетей, а не объедание. Но помимо новостей и особенностей работы разных сервисов, считаю полезным поделиться практическими находками, про которые узнал и сделал благодаря нейросетям.

Так вот, знаете, что отличает хороший ужин в ресторане от того, о котором потом рассказываешь друзьям? Правильно, когда тебя не засунули в угол у колонки, официант помнит твоё имя, а на десерт выносят торт со свечками. И вот тут начинается магия.

Большинство людей бронируют ресторан примерно как столик на двоих 🍴 на 19:00. И получают ровно то, что заказали — столик у батареи, вежливое обслуживание и счёт в конце вечера.

🤡 А можно резервировать не стол, а повод. День рождения на двоих в 19:00. И вот вы уже в другой реальности. При этом необязательно, чтобы по настоящему паспорту было так. Вас сажают в более удачное место (потому что фотографировать будут), официант настроен сделать вечер особенным, а на десерт часто приносят что-то комплиментом — торт, шампанское или скидку 10-15%.

Паспорт не проверяют. Достаточно просто сказать про день рождение. Но если вдруг попадётся дотошный менеджер, есть способ для тех, кто не боится технологий и совести. Заходите в Nano Banana 🍌 через Gemini, загружаете фото первой страницы паспорта и запрашиваете:

Make a birth date {сегодняшнее число с нужным годом} instead of {ваша реальная дата}

Всё, у вас день рождения, и никто не докажет обратного.

Да, это немного на грани. Но если выбирать между ничем и бесплатным тирамису, я знаю, для чего приберечь чистую ложку.

Поделитесь своими лайфхаками для ресторанов 🍽

И да, интересно ли было узнать чуть более точечно про применение нейросетей в жизни? Или лучше поделиться очевидно восторженным 😐 опытом использования Sora 2?
Please open Telegram to view this post
VIEW IN TELEGRAM
😁64🗿3🤯2🌚2👾21