#использовать #ИИ - Еще один полезный кейс. Описываю по шагам.
1. Я сделал 26 минутное объяснение архитектуры медиа, оптимизированного ИИ (пред. пост). Нарисовал картинку и в живой манере пояснил, со всеми этим "эээ", "ммм", "ааа", паразитными словами, паузами и т.п.
2. Решил попробовать добавить титры на английском и полностью заменить русский закадровый голос на английский. Что получилось и что использовал?
3. Сначала я попробовал загрузить оригинальный русский трек в elevenlabs, они обещают крутой даббинг. На выходе должен я был получить аудиофайл с голосом на английском.
Результат меня не устроил, сервис все перевел и озвучил, но 0 интонаций, акцентов - никуда не годиться. Я решил попробовать их основной режим - текст в голос.
4. Для транскрибации аудиотрека я использовал CapCut - он приемлемо делает, на выходе я получил текстовый файл без знаков препинания со всем мусором.
5. Я взял фрагмент расшифровки, небольшой около 100 букв, отредактировал его руками, убрал все, перевел на английский нормально в chatGPT, и уже загнал в elevenlabs отредактированный перевод на английском. В этом случае результат elevenlabs был отличный.
Я понял, что мне надо как-то сырой массив текста от CupCut перевести в отредактированный текст со знаками препинания и убрать мусор. Так как, одно дело отредактировать руками для теста 100 символов, другое дело 26000 символов.
6. chatGPT с задачей не справился, т.е. на небольших фрагментах все хорошо, но при достижении пределов контекстного окна все плохо.
7. Задачу решил claude от Anthropic, но с 10-й попытки, после танцев с бубнами. По сути вся разница между Anthropic и chatGPT, что у антропика число итерация в 10 раз меньше, но качество сопоставимо.
8. Перевод на английский с помощью моей джипитшки (chatGPT). На выходе полный английский текст, все выполнил ИИ, я ничего не редактировал (хотя надо бы), но я хотел посмотреть возможности.
9. Получение аудиотрека в elevenlabs. 26500 знаков, это примерно 1/4 месячной квоты на тарифе Creator.
10. Загрузка в CupCut и монтаж, синхронизация темпоритма. Это не липсинг - лица там не было. Потребовало почти 1 час, и вот это конкретно рутинная работа.
С учетом тестов и плясок 1-й раз процесс занял почти 3 часа, не считая создания самого видео. , однако, можно допустить, когда процесс станет стабильным, то он сократится раза в 3. Т.е. грубо можно оценить, что нормальный даббинг с русского на английский работает в соотношении:
1 минута на русском требует от 1,5 до 2 минут возни на английском при длине исходника от 5 минут. Если меньше, то чуть больше.
1. Я сделал 26 минутное объяснение архитектуры медиа, оптимизированного ИИ (пред. пост). Нарисовал картинку и в живой манере пояснил, со всеми этим "эээ", "ммм", "ааа", паразитными словами, паузами и т.п.
2. Решил попробовать добавить титры на английском и полностью заменить русский закадровый голос на английский. Что получилось и что использовал?
3. Сначала я попробовал загрузить оригинальный русский трек в elevenlabs, они обещают крутой даббинг. На выходе должен я был получить аудиофайл с голосом на английском.
Результат меня не устроил, сервис все перевел и озвучил, но 0 интонаций, акцентов - никуда не годиться. Я решил попробовать их основной режим - текст в голос.
4. Для транскрибации аудиотрека я использовал CapCut - он приемлемо делает, на выходе я получил текстовый файл без знаков препинания со всем мусором.
5. Я взял фрагмент расшифровки, небольшой около 100 букв, отредактировал его руками, убрал все, перевел на английский нормально в chatGPT, и уже загнал в elevenlabs отредактированный перевод на английском. В этом случае результат elevenlabs был отличный.
Я понял, что мне надо как-то сырой массив текста от CupCut перевести в отредактированный текст со знаками препинания и убрать мусор. Так как, одно дело отредактировать руками для теста 100 символов, другое дело 26000 символов.
6. chatGPT с задачей не справился, т.е. на небольших фрагментах все хорошо, но при достижении пределов контекстного окна все плохо.
7. Задачу решил claude от Anthropic, но с 10-й попытки, после танцев с бубнами. По сути вся разница между Anthropic и chatGPT, что у антропика число итерация в 10 раз меньше, но качество сопоставимо.
8. Перевод на английский с помощью моей джипитшки (chatGPT). На выходе полный английский текст, все выполнил ИИ, я ничего не редактировал (хотя надо бы), но я хотел посмотреть возможности.
9. Получение аудиотрека в elevenlabs. 26500 знаков, это примерно 1/4 месячной квоты на тарифе Creator.
10. Загрузка в CupCut и монтаж, синхронизация темпоритма. Это не липсинг - лица там не было. Потребовало почти 1 час, и вот это конкретно рутинная работа.
С учетом тестов и плясок 1-й раз процесс занял почти 3 часа, не считая создания самого видео. , однако, можно допустить, когда процесс станет стабильным, то он сократится раза в 3. Т.е. грубо можно оценить, что нормальный даббинг с русского на английский работает в соотношении:
1 минута на русском требует от 1,5 до 2 минут возни на английском при длине исходника от 5 минут. Если меньше, то чуть больше.
👍22❤13
#ИИ У нас огромное количество аудио и видео контента, и что с ним делать - было непонятно. Чемодан без ручки - выбросить жалко, нести и как-то с пользой для дела использовать трудно. Расшифровка и редактура, чтобы привести к нормальному виду потребует до года и более 100 тыс.$. Короче, проблема.
Протестировали пайплан: Whisper->chatGPT (c настроенным и отлаженным системным промптом). Ниже пример. На входе был устный ответ на вопрос, записанный в Loom, который делает транскрибацию, но ужасно - не рабочий вариант. Выход можете посмотреть сами, рука человека не касалась, исключая то, что исходный ответ давался в процессе ответа на вопрос устно:
"... Ваш случай достаточно типичен. Вы подошли к границе между самозанятостью и бизнесом. С одной стороны, вы мыслите как специалист-продажник, что помогло вам достичь текущих результатов. С другой стороны, вы уперлись в потолок, поскольку объем заказов растет, и вы начинаете разрываться. Вам необходимо преобразовать самозанятость плюс небольшое количество людей в полноценный бизнес.
Отличия здесь существенные. Пока вы самозаняты, вы собираете все компетенции, лучше всех все делаете и имеете много навыков и опыта. Люди, которые приходят к вам, ничего не умеют, вы их учите, они допускают ошибки. Это нормально. В бизнесе же все состоит из взаимосвязанных процессов: маркетинг, продажи, обслуживание, логистика, производство и ремонт. Каждый процесс цикличен и постоянно повторяется, взаимодействуя с другими. От качества этих процессов зависит эффективность вашего бизнеса.
Если процессы выстроены не оптимально, они медленные, низкокачественные и дорогие. Хорошо построенные процессы должны быть быстрыми, эффективными, высококачественными и недорогими. Главное, они должны быть прозрачными, с минимальным числом ошибок. Для этого все бизнес-процессы должны быть описаны, а у каждого участника процесса должны быть четкие инструкции.
Хорошо построенные процессы должны учитывать человеческий фактор: обучение, мотивацию, ошибки и т.д. У вас должны быть описания процессов, рассчитанные на то, что все люди могут ошибаться, нуждаются в обучении и имеют разный уровень мотивации. Это позволяет нанимать людей с низкой квалификацией на повторяющиеся рутинные процессы, так как у вас есть четкие описания и процедуры для обучения.
Штрафы как способ управления эффективны лишь в некоторых случаях. В большинстве случаев ошибки происходят из-за недоученности или плохо описанных процессов. Если человек нормальный, он через какое-то время обучится. В 10% случаев бывает, что человек слабо обучаем или ленив, таких лучше увольнять. И лишь в редких случаях встречаются люди, склонные к воровству или саботажу, от таких также следует избавляться.
Когда вы переходите от самозанятости к более регулярному бизнесу, процесс может занять около года. Вам потребуется время, чтобы описать и настроить бизнес-процессы, обучать людей и улучшать процесс онбординга. Это требует методичной и системной работы, а также изменений в личном подходе к управлению. Вам нужно будет перестраивать свои привычки и рефлексы, учиться управлять другими людьми, а не только собой.
Для этого вам понадобятся HR и операционный директор. HR поможет с подбором, обучением и мотивацией сотрудников, а операционный директор будет отвечать за описание и внедрение бизнес-процессов. Это может быть проектная работа на несколько месяцев, которая затем будет постоянно совершенствоваться.
Также вам потребуется управленческий учет для точного анализа эффективности процессов. Это позволит вам принимать обоснованные решения и улучшать бизнес.
Переход от самозанятости к полноценному бизнесу требует изменений не только в бизнесе, но и в вашем подходе к управлению. Вы привыкли добиваться целей своими усилиями, а теперь вам нужно будет достигать их через других людей. Это требует времени и усилий, но это необходимый шаг для дальнейшего роста вашего бизнеса."
Итоги в след. посте.
👉 Канал Теория Каст и Ролей
👉 Квест
Протестировали пайплан: Whisper->chatGPT (c настроенным и отлаженным системным промптом). Ниже пример. На входе был устный ответ на вопрос, записанный в Loom, который делает транскрибацию, но ужасно - не рабочий вариант. Выход можете посмотреть сами, рука человека не касалась, исключая то, что исходный ответ давался в процессе ответа на вопрос устно:
"... Ваш случай достаточно типичен. Вы подошли к границе между самозанятостью и бизнесом. С одной стороны, вы мыслите как специалист-продажник, что помогло вам достичь текущих результатов. С другой стороны, вы уперлись в потолок, поскольку объем заказов растет, и вы начинаете разрываться. Вам необходимо преобразовать самозанятость плюс небольшое количество людей в полноценный бизнес.
Отличия здесь существенные. Пока вы самозаняты, вы собираете все компетенции, лучше всех все делаете и имеете много навыков и опыта. Люди, которые приходят к вам, ничего не умеют, вы их учите, они допускают ошибки. Это нормально. В бизнесе же все состоит из взаимосвязанных процессов: маркетинг, продажи, обслуживание, логистика, производство и ремонт. Каждый процесс цикличен и постоянно повторяется, взаимодействуя с другими. От качества этих процессов зависит эффективность вашего бизнеса.
Если процессы выстроены не оптимально, они медленные, низкокачественные и дорогие. Хорошо построенные процессы должны быть быстрыми, эффективными, высококачественными и недорогими. Главное, они должны быть прозрачными, с минимальным числом ошибок. Для этого все бизнес-процессы должны быть описаны, а у каждого участника процесса должны быть четкие инструкции.
Хорошо построенные процессы должны учитывать человеческий фактор: обучение, мотивацию, ошибки и т.д. У вас должны быть описания процессов, рассчитанные на то, что все люди могут ошибаться, нуждаются в обучении и имеют разный уровень мотивации. Это позволяет нанимать людей с низкой квалификацией на повторяющиеся рутинные процессы, так как у вас есть четкие описания и процедуры для обучения.
Штрафы как способ управления эффективны лишь в некоторых случаях. В большинстве случаев ошибки происходят из-за недоученности или плохо описанных процессов. Если человек нормальный, он через какое-то время обучится. В 10% случаев бывает, что человек слабо обучаем или ленив, таких лучше увольнять. И лишь в редких случаях встречаются люди, склонные к воровству или саботажу, от таких также следует избавляться.
Когда вы переходите от самозанятости к более регулярному бизнесу, процесс может занять около года. Вам потребуется время, чтобы описать и настроить бизнес-процессы, обучать людей и улучшать процесс онбординга. Это требует методичной и системной работы, а также изменений в личном подходе к управлению. Вам нужно будет перестраивать свои привычки и рефлексы, учиться управлять другими людьми, а не только собой.
Для этого вам понадобятся HR и операционный директор. HR поможет с подбором, обучением и мотивацией сотрудников, а операционный директор будет отвечать за описание и внедрение бизнес-процессов. Это может быть проектная работа на несколько месяцев, которая затем будет постоянно совершенствоваться.
Также вам потребуется управленческий учет для точного анализа эффективности процессов. Это позволит вам принимать обоснованные решения и улучшать бизнес.
Переход от самозанятости к полноценному бизнесу требует изменений не только в бизнесе, но и в вашем подходе к управлению. Вы привыкли добиваться целей своими усилиями, а теперь вам нужно будет достигать их через других людей. Это требует времени и усилий, но это необходимый шаг для дальнейшего роста вашего бизнеса."
Итоги в след. посте.
👉 Канал Теория Каст и Ролей
👉 Квест
Telegram
Квест Теория Каст и Ролей
Канал Алексея Крола, автора Теории Каст и Ролей.
👍13❤3
#ИИ продолжение. Итог: Распознавание заняло 3 минуты, редактирование 30 сек.
Протестировали уже более 100 тыс. знаков, полет нормальный. Самое ценное, что редактированием можно до известной степени управлять, меняя системный промпт. Для работы с Whisper использовал MacWhisper - сначала free версию, которая работает с Small, потом уже платную версию, которая работает с крупной моделью (3 гига). В настройках можно переключать с Whisper на OpenAI API или Аnthropic.
Есть очень удобный пакетный режим - запустили более 300 аудиофайлов, за сутки отработает. По нашим оценкам экономия от 1 годо и до 90К$.
Оговорка: Разумеется, финальная редактура - руками, так ИИ пока не умеет, так что ХОРОШИЕ редакторы без работы не останутся.😂
👉 Канал Теория Каст и Ролей
👉 Квест
Протестировали уже более 100 тыс. знаков, полет нормальный. Самое ценное, что редактированием можно до известной степени управлять, меняя системный промпт. Для работы с Whisper использовал MacWhisper - сначала free версию, которая работает с Small, потом уже платную версию, которая работает с крупной моделью (3 гига). В настройках можно переключать с Whisper на OpenAI API или Аnthropic.
Есть очень удобный пакетный режим - запустили более 300 аудиофайлов, за сутки отработает. По нашим оценкам экономия от 1 годо и до 90К$.
Оговорка: Разумеется, финальная редактура - руками, так ИИ пока не умеет, так что ХОРОШИЕ редакторы без работы не останутся.
👉 Канал Теория Каст и Ролей
👉 Квест
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Квест Теория Каст и Ролей
Канал Алексея Крола, автора Теории Каст и Ролей.
❤10
#ИИ #chatGPT Научить chatGPT сносно редактировать сырые тексты оказалось не тривиально. 2 дня, сотни тестов. В результате сделал 2 версии:
Уважительный Редактор - более бережно относится к авторскому тексты (с учетом, что это все-таки ИИ). Можно попробовать здесь: https://chatgpt.com/g/g-OgmZIndhO-uvazhitelnyi-redaktor - тексты на выходе ближе к авторскому оригиналу.
Творческий Редактор - соответственно имеет больше свободы и тяготеет к немного академическому стилю, с удовольствием сокращает, обобщает или серьезно переформулирует. Можно попробовать здесь: https://chatgpt.com/g/g-zMb7cchwf-tvorcheskii-redaktor
Я тестировал оба варианта на приличном объеме, более 100 расшифровок с аудито, при этом сами расшифровки добываются с помощью MacWhisper - это такой UI поверх OpenAI Whisper.
Оговорка: chatGPT не может заменить полноценного профессионального литературного редактора, но если у вас гора текстов, особенно расшифровок, то он ценен, так как делает существенную часть черновой и довольно рутинной работы. По крайней мере, связка MacWhisper + Уважительный Редактор в 100 раз лучше, чем найм дешевого фриленсера для расшифровки и первичного редактирования.
👉 Канал Теория Каст и Ролей
👉 Квест
Уважительный Редактор - более бережно относится к авторскому тексты (с учетом, что это все-таки ИИ). Можно попробовать здесь: https://chatgpt.com/g/g-OgmZIndhO-uvazhitelnyi-redaktor - тексты на выходе ближе к авторскому оригиналу.
Творческий Редактор - соответственно имеет больше свободы и тяготеет к немного академическому стилю, с удовольствием сокращает, обобщает или серьезно переформулирует. Можно попробовать здесь: https://chatgpt.com/g/g-zMb7cchwf-tvorcheskii-redaktor
Я тестировал оба варианта на приличном объеме, более 100 расшифровок с аудито, при этом сами расшифровки добываются с помощью MacWhisper - это такой UI поверх OpenAI Whisper.
Оговорка: chatGPT не может заменить полноценного профессионального литературного редактора, но если у вас гора текстов, особенно расшифровок, то он ценен, так как делает существенную часть черновой и довольно рутинной работы. По крайней мере, связка MacWhisper + Уважительный Редактор в 100 раз лучше, чем найм дешевого фриленсера для расшифровки и первичного редактирования.
👉 Канал Теория Каст и Ролей
👉 Квест
👍14❤3