Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🍪 Локальная ретушь фотографий при помощи ИИ

Ретушь изображений и в частности фотопортретов находит множество применений в фотографировании — от создания свадебных и рекламных до личных снимков. Значительные усилия по ретушированию фотографий дают потрясающие результаты, однако в основном изменяют такие общие аспекты изображения, как цвет, освещение и экспозиция. Наиболее трудоемкой и затратной частью является работа с локальными областями изображений.

➡️ Читать дальше
🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌐 Point-E : text to 3D

OpenAI выпустила новую модель искусственного интеллекта, способную создавать простые 3D-объекты всего за пару минут.

Генерация занимает примерно в 600 раз меньше времени чем в DreamFusion.

🖥 GitHub
📎 Paper

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
🗣 Машинное обучение. Способы распознавания синтезированной речи

В современном мире технологии синтеза речи и клонирования голоса стремительно развиваются и уже достигли впечатляющих результатов. С 2015 года проводится специальное соревнование ASV Spoofing, на котором ежегодно презентуют новые методы проведения спуфинг-атак (атаки, когда один человек или программа маскируется под другую путем фальсификации данных) с помощью видео-дипфейков и синтеза речи. Существующие речевые системы способны синтезировать речь и тембр голоса, на слух неотличимые от настоящих. Технологии клонирования голоса привлекают всё большее внимание и находят широкое применение в таких сферах, как голосовое управление, робототехника, голосовые ассистенты (например, Siri и Алиса) и т.д. Однако вместе с этим открываются новые возможности для мошенничества. Особенно уязвимы системы, использующие голосовую биометрию для идентификации пользователей: используя синтез речи, мошенники могут получить доступ к аккаунтам и данным пользователей.

Для борьбы с неэтичным использованием голосовых технологий необходимо разработать инструменты распознавания искусственной речи. Нужно, чтобы разработанная модель обладала хорошей обобщающей способностью и умела детектировать синтезированную речь независимо от языка, акцента и тембра голоса конкретного человека.

В публикации рассмотрю несколько новейших разработок в этой области, а потом синтезирую запись искусственной речи и на этом примере проверю работу одной из представленных моделей.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍91🔥1
🖥 Настройка интерпретатора Python внутри CHATGPT. Ai Пишет код на Python.

Вам больше не нужен интерпритатор.

Этот рассказ вдохновлён другой историей, “Настройка Виртуальной Машины внутри ChatGPT”. Я был впечатлен и решил попробовать нечто подобное – в этот раз вместо командной строки Linux давайте попросим ChatPGT стать нашим интерпретатором Python.Можно воспринимать эту статью как инструкцию по работе с CHATGpt.

Вот исходная команда для инициализации ChatPGT:

Я хочу, чтобы ты выступил в роли интерпретатора Python. Я буду вводить команды, а ты будешь отвечать, что должен показать вывод Python. Я хочу, чтобы ты отвечал только с выводом на терминал внутри одного уникального блока кода, и ничего больше. Не пиши объяснений, выводи только то, что выводит Python. Не вводи команды пока я не дам соответствующих инструкций. Когда мне нужно сказать тебе что-то по-английски, я буду делать это, помещая текст внутри фигурных скобок, как это сделано здесь: {пример текста}. Моя первая команда – a=1.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥1
💨 Масштабируемые Graph преобразователи для миллионов узлов

В последнее время создание моделей Transformer для обработки графоструктурированных данных вызвало широкий интерес в сообществе исследователей машинного обучения. Одна из критических проблем связана с квадратичной сложностью глобального внимания, которая мешает трансформерам масштабироваться до больших графов. В этом блоге будет кратко представлена ​​недавняя работа над NeurIPS22:

В этой работе предлагается масштабируемый graph Transformers для графов классификации больших узлов, где количество узлов может варьироваться от тысяч до миллионов (или даже больше). Ключевой модуль представляет собой передачу сообщений на основе ядра Gumbel-Softmax, которая обеспечивает распространение функций по всем парам со сложностью O(N) (N для #nodes).

Нижеследующее содержание подытожит основную идею и результаты данной работы.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥1
🖥 Docker для специалиста по анализу данных. Разбираемся с Контейнерами.

Часто у начинающих Data Scientists возникает вопрос, как демонстрировать работу своих моделей другим людям. Банальный пример – прикрепить ссылку на гитхаб репозиторий в отклике на вакансию или показать свое “детище” знакомым со словами “смотрите, что умею”.

Проще говоря, мы хотим задеплоить нашу модель, превратить ее в демо нашего исследования.

Проблема в том, что для этого нужно скачивать репозиторий, установливать нужную версию python и всех необходимых библиотек, а также разбираться, как запускать приложение. Слишком много сложностей для человека, который хочет использовать или просто посмотреть вашу работу. То есть вопрос в том, как передать продукт клиенту.

В статье я расскажу простыми словами, что такое Docker и как его можно использовать для реализации своих решений в Machine Learning.

Читать дальше
Разработка Airflow с помощью Docker

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍42😁1🤔1
👁 Компьютерное зрение на операторах + и *, или как нейросеть решает задачи CV

Многие привыкли считать, что компьютерное зрение — это какая-то неимоверно сложная технология и исключительно вещь в себе. Ну, конечно, кроме тех людей, которые занимаются непосредственно компьютерным зрением. Надеюсь.

Сегодня я хочу рассказать про один фокус, можно сказать, забавный эксперимент — довольно известный, возможно, среди опытных обработчиков изображений, но настолько слабо применимый на практике, что не часто о нём заходит речь. Однако, этот маленький эксперимент, как мне кажется, наводит на интересные теоретические выкладки относительно работы свёрточных нейросетей. Эксперимент, о котором я говорю — поиск объекта на изображении при помощи функции взаимной корреляции (без нейронных сетей). Звучит, возможно, пугающе и непонятно, но на деле всё очень просто, чистая математика.

📎 Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 DifFace: Super-Face Restoration

Новый алгоритм реставрации лица SOTA на фотографиях с сильными искажениями.

🖥 Github: github.com/zsyOAOA/DifFace

⭐️ Colab : https://hbertiche.github.io/NeuralClothSim/

✔️ Demo: https://huggingface.co/spaces/OAOA/DifFace

✅️ Paprer: arxiv.org/pdf/2212.06512.pdf

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥31
⭐️ Шпаргалка по Python

Понадобится, если вы не слишком часто программируете на Python, хотите научиться в довольно короткий срок или хотите быстро вникнуть в синтаксис, функции и методы языка.

На страничке также есть описания некоторых библиотек для скрапинга, затронуто метапрограммирование и асинхронность.

🔩 GitHub/Инструкция

#python #cheatsheet

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🥰1
✔️ 38 лучших библиотек для Data Science, Data Visualization и Машинного Обучения

Мы решили, что будем группировать все библиотеки по общим признакам, будь то библиотеки для машинного обучения или библиотеки для математики. Тем не менее, все 38 из них будут полезны для разработки в области Data Science.

➡️ Смотреть

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1
⬆️ Квантовое машинное обучение: гид для начинающих

Квантовое машинное обучение – это область на пересечении квантовых вычислений и машинного обучения. Она включает в себя использование квантовых компьютеров для выполнения задач машинного обучения, таких как классификация, регрессия и кластеризация. Квантовые компьютеры – это мощные машины, которые используют квантовые биты (кубиты) вместо классических битов для хранения и обработки информации. Это позволяет им выполнять определенные задачи намного быстрее, чем классические компьютеры, что делает их особенно хорошо подходящими для задач машинного обучения, связанных с большими объемами данных.

Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥21
🔊 Auto Synced & Translated Dubs

Auto-Synced-Translated-Dubs – инструмент, который позволяет, c помощью AI создавать аудиодорожки для видео на разных языках.

🖥 Github
✔️ Пример

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍21
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️ Tabnine — ИИ помогающий писать код

Сервис использует глубокое обучение, чтобы помочь вам писать код быстрее.

Данные для обучения модели разработчики собрали с открытых репозиториев на GitHub. Во время обучения модель будет предсказывать следующий токен на основе предыдущих токенов. В NLP токен — это единица анализа текста.

Текущая версия работает для Python, Java, Haskell и C++. Tabnine совместим с VS Code, Sublime Text, Atom, Vim и прочими редакторами кода.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💬 StoryTeller

Мультимодальный рассказчик ИИ, созданный с помощью Stable Diffusion, GPT и нейронного преобразования текста в речь (TTS).

$ git clone https://github.com/jaketae/storyteller.git

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21
7️⃣лучших веб-сайтов для изучения Data Science: Совершенствуйте свои навыки и знания!

Важность непрерывного обучения в области Data Science и машинного обучения.

Непрерывное обучение так важно в этих областях, потому что там всё постоянно меняется! Постоянно разрабатываются новые методы и инструменты. Важно быть в курсе последних событий, если вы хотите оставаться конкурентоспособным на рынке труда и быть эффективным в своей работе. Кроме того, следование последним передовым технологиям и отраслевым стандартам – это просто хорошая практика, независимо от того, в какой области вы работаете.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍2
Yolo8 is coming!

На github вылложили веса.
Обновилась документация.

🖥 Github
🖥 Colab
✔️ Docs

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥3🥰2
5️⃣ бесплатных конкурентов ChatGPT, о которых вы должны знать в 2023 году

2022 год был прорывом для машинного обучения и исследований в области искусственного интеллекта. Крупные технологические компании выпустили множество удивительных библиотек, которые принесут пользу разработчикам. Мы видели несколько замечательных исследовательских работ, как от крупных технологических компаний, так и от небольших групп программистов.

И, конечно же, это был год Больших Языковых Моделей. Люди придумали всевозможные варианты использования LLM. В то время как большая часть этого контента была продуктом влиятельных лиц, создающих видео с большим количеством лжи и дезинформации, этот ажиотаж является доказательством потенциала, стоящего за такими технологиями. Однако ChatGPT в настоящее время закрыт из-за ограничений доступа API. Хотя он может делать довольно крутые вещи, решения с открытым исходным кодом и доступом к нему крайне важны для тех, кто хочет создавать свои собственные приложения, используя этот API. В этой статье я поделюсь с вами некоторыми из конкурентов ChatGPT, чтобы у вас было представление о том, что выбрать.

✔️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍131🔥1
✔️ TextDescriptives: A Python package for calculating a large variety of statistics from text

Библиотека Python для расчета большого количества метрик из текста (ов) с использованием компонентов конвейера spaCy v.3 и расширений. TextDescriptives можно использовать для вычисления нескольких описательных статистик, показателей удобочитаемости текста и показателей, связанных с расстоянием зависимости слов.

pip install textdescriptives

🖥 Github: https://github.com/HLasse/TextDescriptives

Paper: https://arxiv.org/abs/2301.02057v1

➡️ Docs: https://github.com/HLasse/TextDescriptives

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Nvidia + ByteDance CV-CUDA

CV-CUDA — это проект с открытым исходным кодом от Nvidia, который позволяет создавать эффективные облачные приложения искусственного интеллекта (ИИ) для обработки изображений и компьютерного зрения (CV).

🖥 Github
✔️ Guide

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21