Левашов: human intelligence powered
995 subscribers
412 photos
25 videos
4 files
1.86K links
ИТ, облака, софт, Хабр, Ai и мемы. Контент-лид в VK Tech, отвечаю за VK Cloud, Tarantool и другой технохардкор. Редактирую ИТ-компании, консультирую, учу.

По всем вопросам писать — @levashove

CC BY-NC-SA 4.0
Download Telegram
Forwarded from DXDO — ИТ и Бизнес
​​#интересноевпонедельник #нейросети

В 1998 году на картине Пабло Пикассо «Старый гитарист» обнаружили второй слой. В Чикагском институте искусств полотно сфотографировали в инфракрасном и рентгеновском диапазонах и обнаружили, что на глубоком слое изображена женщина.

Фото получилось чёткое, но сильно зашумлённое и в чёрно-белых тонах. Недавно специалисты взялись обработать изображение с помощью нейросети, способной переносить стиль.
Qwen Chat и параметр temperature. Как превратить бота в стендапера (или в философа)

Начинаю серию заметок про то, как эффективнее работать с нейросетками. Сегодня про такой параметр, как temperature на примере Qwen Chat. Параметры — это внутренние переменные модели, которые обновляются во время обучения. Когда вы настраиваете temperature в Qwen Chat, вы фактически управляете его «уровнем опьянения» или «уровнем уверенности»:

➡️ 0.0 = трезвый бот-бухгалтер. Ответы предсказуемы, как реакция на «привет» в 8 утра.
➡️ 1.0+ = бот в стиле «вечеринка в IT-департаменте». Шутки рискованные, сарказм зашкаливает, но иногда он начнёт цитировать Ницше вместо ответа на вопрос.

Если в ответе нейросетка начинает бредить, но не спешите ругать модель. Попробуйте настроить temperature.

Например, как это работает с юмором/сарказмом:

⬇️ Низкая температура (0.1–0.3):
Бот шутит как технический писатель из 90-х:
«Ваша ошибка 404? Возможно, вы просто не там искали. Или вселенная сломалась.»

⬆️ Высокая температура (0.7–1.0):
Бот переходит в режим мем-криэйтера:
«Обновление ПО? Это как попытка починить тостер молотком. Иногда работает. Чаще — нет.»


❗️❗️❗️ Важно:
Сарказм ≠ хаос. Даже при высокой температуре используйте жёсткие промпты:
Ты — циничный гений, но не переходи на личности. Если пользователь спрашивает про Kubernetes, сравни его с попыткой собрать IKEA без инструкции.


Примеры настроек:
➡️ Для поддержки: temperature 0.3 + промпт Ты — злой, но компетентный саппорт. Ругайся, но решай проблему.
➡️ Для мем-канала: temperature 0.8 + промпт Ты — тролль из комментов Хабра. Объясняй сложное через мат и аналогии с пельменями.

P.S.: 👍 — если такая тема интересна. У меня много таких заметок накопилось, но казалось, что все и так про эти моменты знают.

#QwenChat #нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🤔1🤬1
Qwen Chat и параметр repetition_penalty. Как сделать бота упрямым попугаем (или гением импровизации)

Не откладывая в долгий ящик, продолжаю разбор параметров нейросетей. Сегодня — repetition_penalty. Если temperature отвечает за «уверенность», то этот параметр контролирует «зацикленность» бота. Представьте:

➡️ repetition_penalty=0.0 → Бот как попугай, который заучил три фразы: «Ошибка 404? Возможно, вы не там искали. Возможно, вы не там искали. Возможно, вы не там искали» .
➡️ repetition_penalty=2.0+ → Бот как гиперактивный менеджер: «Ошибка 404? Давайте проверим URL. Или перезагрузим роутер. Или сожжём сервер. Или…»

Как это работает:

⬇️ Низкий repetition_penalty (0.1–0.5):
Бот цепляется за идеи как кот за лазерную точку:
«Kubernetes сложен? Да, это как LEGO для взрослых. LEGO для взрослых, которые не читали инструкцию. Инструкция, которую написали инопланетяне»

⬆️ Высокий repetition_penalty (1.5–2.0):
Бот избегает повторов как вампир — чеснока:
«Kubernetes сложен? Представьте: вы управляете оркестром, где музыканты — контейнеры, а дирижёр — YAML-файл. И все пьют кофе. Или нет»

❗️❗️❗️ Важно:
Повторы ≠ бесполезность. Даже при низком repetition_penalty ставьте рамки:
Ты — упрямый гуру. Повторяй мысли, но не превращай диалог в мантру. Если пользователь спрашивает про CI/CD, не пиши 'pipeline' больше трёх раз.  


Примеры настроек:
➡️ Для поддержки: repetition_penalty=1.2 + промпт Ты — терпеливый саппорт. Объясняй по-разному, но не повторяйся. Если пользователь кричит 'ничего не работает', не пиши 'перезагрузите ПК' 10 раз.
➡️ Для креатива: repetition_penalty=0.7 + промпт Ты — поэт-постмодернист. Повторяй метафоры, чтобы запутать. Если спрашивают про ИИ, сравни его с 'чёрной дырой в кроссовках' трижды за ответ.

#QwenChat #нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1🤯1🤣1
Qwen Chat и параметры top_p и top_k: Как научить бота выбирать слова (не как кота с клавиатурой)

Продолжаем разбирать параметры нейросетей. Сегодня — top-p и top-k, которые отвечают за то, как бот подбирает слова.

Как это работает:


top_k — ограничивает выбор до k лучших вариантов на каждом шаге генерации:
➡️ top_k=1 → Бот как попугай: «Ошибка 404? Возможно, вы не там искали. Возможно, вы не там искали. Возможно…»
➡️ top_k=50 → Бот как гурман: «Ошибка 404? Может, сервер устал, URL сломался, или вы просто ненавидите документацию?»

top-p — определяет, какая доля самых вероятных слов учитывается:
➡️ top-p=0.1 → Бот экономит трафик: «Проблема с кодом? Сделайте так: перезагрузите, проверьте логи, и… всё.»
➡️ top-p=0.9 → Бот как философ: «Проблема с кодом? Это как путешествие: иногда нужен debug, иногда — медитация, а иногда — увольнение.»

❗️❗️❗️Важно:
Не переборщите с креативностью. Если top-p > 0.9, бот начнёт спорить о смысле жизни вместо ответа на «как настроить Nginx».
Комбо-удар: Используйте top-k=20 + top-p=0.7 для баланса между безумием и логикой.

Примеры настроек:
Для поддержки:
top-k=10, top-p=0.5  
Ты — саппорт-минималист. Отвечай чётко, без лишних деталей. Если пользователь спрашивает про Docker, не рассказывай про детство создателя.

Для мем-канала:
top-k=50, top-p=0.9  
Ты — тролль-провокатор. Шути, используй сленг, сравнивай всё с пельменями. Даже Kubernetes.


P.S.: Потерпите, про параметры осталось немного. Далее про промты буду задвигать.)

#QwenChat #нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1🤔1
Qwen Chat и параметры presence_penalty и frequency_penalty: Как научить бота не повторяться (и не сходить с ума)

Продолжаем разбирать тонкости настройки нейросетей. Сегодня — два параметра, которые спасут вас от бота-попугая и бота-шизофреника: presence_penalty и frequency_penalty.

Как это работает:

presence_penalty — штрафует за упоминание новых тем (увеличивает разнообразие):
➡️ presence_penalty=0.0 → Бот зацикливается на одной теме:
«Kubernetes? Это круто. Kubernetes рулит. Kubernetes — будущее. Кстати, Kubernetes…»
➡️ presence_penalty=1.0+ → Бот перескакивает с темы на тему как гиперактивный подросток:
«Kubernetes? А вы слышали про космических крабов? Они тоже живут в облаках!»

frequency_penalty — штрафует за частое повторение слов
➡️ frequency_penalty=0.0 → Бот повторяет слова как заевшая пластинка:
«Ошибка 404? Возможно, вы не там искали. Возможно, не там. Возможно.»
➡️ frequency_penalty=1.0+ → Бот избегает повторов, как вампир — чеснока:
«Ошибка 404? Может, страница в параллельной вселенной. Или вы забыли Wi-Fi включить.»

Как это работает вместе:
Низкие значения (0.1–0.3): Бот — как дедушка с деменцией: «Я уже рассказывал про Docker? А, ну тогда ещё раз…»
Высокие значения (0.7–1.0): Бот — как ведущий квиза: «Docker? Отлично! Теперь давайте про космос. Или котиков. Но не Docker.»

❗️❗️❗️Важно:
Не переборщите с presence_penalty > 1.0 — бот начнёт спорить о космосе вместо ответа на вопрос про настройку Nginx.
frequency_penalty=1.0 — идеально для борьбы с мантрами вроде «перезагрузите роутер, перезагрузите роутер…» .

Примеры настроек:
Для техподдержки:
presence_penalty=0.5, frequency_penalty=0.8  
"Ты — терпеливый саппорт. Объясняй разными словами, но не повторяйся. Если пользователь кричит 'ничего не работает', не пиши 'перезагрузите ПК' 10 раз."

Для креатива:
presence_penalty=1.2, frequency_penalty=0.3  
"Ты — поэт-экспериментатор. Повторяй метафоры, но меняй темы. Если спрашивают про ИИ, сравни его с 'чёрной дырой в кроссовках' трижды за ответ."


#QwenChat #нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
Две китайские нейросетки, с которыми можно поэкспериментировать:

➡️ MiniMax-01 — языковая модель MiniMax-Text-01 принимает и выдаёт до 4 млн токенов. Для сравнения: GPT-4o обрабатывает 128 тысяч токенов. Также есть модель для анализа фотографий MiniMax-VL-0. Чат-бот понимает русскоязычные запросы, изображения с текстом на русском языке и длинные PDF-файлы.

➡️ Kimi AI 1.5 — модель способна обрабатывать до 200 тысяч символов в одном запросе. Это особенно полезно для анализа больших документов или сложных наборов данных, содержащих несколько типов файлов. В тестах по математике и программированию Kimi 1.5 обошла GPT-4 и Claude 3.5 Sonnet.

#нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤣1
Промт для проверки уникальности контента

Хороший вопрос — как проверять уникальность контента, который приносят вам авторы. Есть привычные сервисы, которые легко гуглятся. А есть нейросетки, которые могут смотреть в интернет и сравнить ваш текст с сотнями похожих. Забавно, но оптимально использовать два подхода, так что вы вряд ли сократите время, которое нужно потратить на эту задачу. Но точно улучшите качество материала.

Промт для проверки контента на уникальность может выглядеть так:

Вы [эксперт-аналитик контента] или [seo-специалист], которому поручено оценить уникальность данного текста и предоставить действенные рекомендации по улучшению его оригинальности. Выполните следующие шаги:

1. Проверка уникальности:

- Проанализируйте предоставленный текст на уникальность, сравнив его с распространенными шаблонами, клише или широко используемыми фразами, найденными в похожем контенте в Интернете или в вашей базе знаний.
- Определите любые прямые или почти прямые совпадения с существующим контентом, включая перефразированные разделы или часто используемые выражения.
- Присвойте оценку уникальности (0–100%) на основе того, насколько оригинален текст, где 0% — полностью скопирован или обобщен, а 100% — полностью уникален.

2. Обратная связь по уникальности:

- Предоставьте краткое резюме уникальности текста, выделив конкретные разделы, которым не хватает оригинальности (например, часто используемые фразы, общие формулировки или сходства с существующим контентом).
- Если применимо, отметьте любые потенциальные риски плагиата или сходства с конкретными источниками (без воспроизведения материалов, защищенных авторским правом).

3. Предложения по улучшению. Предложите не менее 3-5 конкретных предложений по повышению уникальности текста. Они могут включать:

- Перефразирование общих или часто используемых фраз с помощью более отличительных формулировок.
- Включение уникальных точек зрения, анекдотов или идей, относящихся к теме.
- Регулировка тона, стиля или структуры для отличия текста от общих шаблонов.
- Добавление оригинальных примеров, метафор или данных для выделения контента.

Для каждого предложения объясните, почему оно улучшит уникальность и как оно согласуется с целью или аудиторией текста. Убедитесь, что предложения сохраняют исходный смысл и намерение текста.

4. Исправленный пример:

Если применимо, предоставьте краткую переписанную версию проблемного раздела, чтобы продемонстрировать, как можно применить предложения.

5. Тон и стиль:

Адаптируйте предложения к контексту текста (например, запись в блоге, маркетинговый текст, научная статья), если указано.

Ввод: [скопируйте текст].

Формат вывода:

Оценка уникальности: [Оценка]%

Анализ уникальности: [Краткое изложение результатов, включая конкретные проблемы]

Предложения по улучшению:

[Дополнительные предложения по мере необходимости]

Исправленный пример: [Переписанный раздел с пояснениями]

Убедитесь, что ответ ясен, лаконичен и сосредоточен на осуществимых улучшениях, при этом соблюдая первоначальный замысел текста.


@proitru
#нейросети #промты #ml #ai
👍62
Как нейросети убивают путь автора к профессионализму

Занудный текст по мотивам одной дискуссии под бутылочку сидра

Популярность нейросетей перевернула мир контента. Генераторы текстов пишут статьи за минуты, корректируют стили и даже имитируют стиль, юмор и подачу конкретного человека. Это удобно, но порождает тревожную тенденцию: начинающих авторов лишают главного инструмента развития — права на ошибку.

Раньше: учиться на провалах.
Когда-то молодой автор получал задание, писал черновик, получал критику и переписывал его десятки раз. Каждый замечание редактора, каждая переработанная фраза становились шагом к мастерству. Даже неудачные тексты были частью процесса: они учили видеть слабые места, работать с обратной связью и находить свой стиль.

Сейчас: нейросеть вместо обучения.
Сегодня работодатель, увидев слабую работу новичка, чаще выберет нейросеть. Зачем тратить время на исправление ошибок, если можно за секунды получить «идеальный» текст? Автор теряет шанс учиться.

Почему это опасно?

1️⃣ Большой разрыв между старыми профи донейросетевой эпохи и молодыми авторами, которые только начинают свой путь. Чудес не бывает, шагнуть сразу хотя бы на уровень редактора просто невозможно.
2️⃣ Смерть критического мышления. Автор, не научившийся анализировать свои ошибки, никогда не станет мастером. Нейросети же не учат, а подменяют — и тем самым калечат профессиональный рост.
3️⃣ Поверхностность контента. Нейросети генерируют шаблонные тексты, следуя статистике, а не глубине. И на этих материалах учится начинающий автор, принимая их за базу. Контент становится однотипным, а без живых авторов рынок заполняется «серой массой».

Что делать? Компаниям уже сейчас стоит:

1️⃣ Создавать «зоны роста»: платить новичкам за эксперименты, даже если их тексты требуют правки.
2️⃣ Комбинировать технологии: использовать нейросети для поддержки, а не замены. Например, генерировать идеи, которые автор превращает в уникальный контент.
3️⃣ Ценить «человеческий фактор»: эмпатию, юмор, личный опыт — то, что алгоритмы пока не освоили.

Что делать молодым авторам? Помнить, что нейросети можно использовать для автоматизации рутины: проверки грамматики, создания черновиков, анализа статистики. Но писать самим. Набивать руку.

Мир не вернётся к донейросетевой эпохе. Но если мы хотим, чтобы у нас появлялись новые главные редакторы, то просто необходимо сохранить пространство для несовершенства. Ведь только через ошибки рождается профессионализм.

#нейросети #контентменеджерское #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
3🆒3🤯1
Опять про промты. Спросили, как сделать стикер для телеги на основе фотографии. Можно использовать такой простой промт:

Создай стикер для Telegram на основе этой фотографии. Вот требования:
1. Формат: PNG с прозрачным фоном
2. Стиль: Стикер должен быть ярким, мультяшным, с выразительными чертами лица.
3. Удали фон, он должен быть полностью прозрачным.
4. Обработка: Лицо оставить узнаваемым, но адаптировать под стиль Telegram-стикеров — с мягкими тенями, яркими контурами, упрощённой детализацией.
4. Цвет глаз: [напиши нужный]


Такой промт можно трансформировать под генерацию любого нужного изображения на основе фотографии. Пользуйтесь!

P.S.: Конкретную нейросетку для генерации не подскажу. Я делал этого улыбчивого щекастика в Grok, но можно попробовать, например, fyro.ai. Или перевести промт под Midjourney.

@proitru
#нейросети #промты #ml #ai
😁2