Forwarded from Java Memes → АйТи мемес
Кто живёт дольше?
Anonymous Poll
27%
// TODO переписать в след спринте
10%
тестовый пользователь admin/admin на проде
12%
endpoint с пометкой @Deprecated, через который ходит вся интеграция
22%
таска в Jire на рефакторинг, у которой меняются только оценка и год
5%
VPN-доступ у стажёра, уволившегося три года назад
12%
общий аккаунт developer c одним паролем на всю компанию
11%
cron-скрипт на проде, владельца которого давно уволили
😁67🔥8🌚3
Forwarded from елуп
Пост сделал DimaTorzok
Последние два года русскоязычные пользователи различных соцсетей видят в автоматических субтитрах одну и ту же фразу: «Субтитры сделал DimaTorzok». Можно было бы подумать, что это какой-то блогер нашёл лазейку и теперь рекламирует себя таким образом, но всё интереснее.
Дело в том, что твиттер, телега и некоторые другие соцсети для преобразования речи в тексте используют модель Whisper от OpenAI. Компания тренировала её на видео из ютюба, так как это самая большая общедоступная база роликов.
Дима Торжок делал субтитры для видео канала GMD13 и в конце ролика вставлял фразу «Субтитры сделал DimaTorzok» в качестве авторского знака. Whisper же в процессе обучения подумала, что если в ролике на русском языке нет звука или ничего не слышно, то нужно вставить фразу «Субтитры сделал DimaTorzok».
Такое есть и в других языках — например, при транскрибации турецкого можно получить имя Altyazı M.K, а на французском Translated by Amara.org Community.
Конечно же, ты мог прочитать об этом ещё в прошлом году в других источниках, но мне написал подписчик (спасибо тебе!), и я обратил внимание, что никто из больших ресурсов не освещал эту историю. Такие дела.
Последние два года русскоязычные пользователи различных соцсетей видят в автоматических субтитрах одну и ту же фразу: «Субтитры сделал DimaTorzok». Можно было бы подумать, что это какой-то блогер нашёл лазейку и теперь рекламирует себя таким образом, но всё интереснее.
Дело в том, что твиттер, телега и некоторые другие соцсети для преобразования речи в тексте используют модель Whisper от OpenAI. Компания тренировала её на видео из ютюба, так как это самая большая общедоступная база роликов.
Дима Торжок делал субтитры для видео канала GMD13 и в конце ролика вставлял фразу «Субтитры сделал DimaTorzok» в качестве авторского знака. Whisper же в процессе обучения подумала, что если в ролике на русском языке нет звука или ничего не слышно, то нужно вставить фразу «Субтитры сделал DimaTorzok».
Такое есть и в других языках — например, при транскрибации турецкого можно получить имя Altyazı M.K, а на французском Translated by Amara.org Community.
Конечно же, ты мог прочитать об этом ещё в прошлом году в других источниках, но мне написал подписчик (спасибо тебе!), и я обратил внимание, что никто из больших ресурсов не освещал эту историю. Такие дела.
😁84🔥13👾3