Машинное обучение RU
17.7K subscribers
1.58K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
⚡️ Новый прорыв от Microsoft: 1-разрядные LLMS.

Новые модели, использующие троичные значения (-1, 0, 1) вместо 16-разрядных.

Это делает их в 2,7 раза быстрее, использует в 3,5 раза меньше памяти графического процессора и в 71 раз меньше энергии.

Bitnet также соответствует традиционным моделям, таким как LLaMA 3B, или превосходит их по своим характеристикам.

📌 Статья

@machinelearning_ru
👍8🔥5🤯32
⚡️ Отличное новое руководство по использованию MLX-графов для прогнозирования свойств молекул:

Очень просто запустить:

pip install mlx-graphs

https://mlx-graphs.github.io/mlx-graphs/tutorials/examples/qm9_tutorial.html

@machinelearning_ru
👍72🔥1
👉 Как Яндекс научил нейросеть пересказывать видео

На Хабре вышла статья ML-инженера Яндекса, где подробно рассказывается о разработке функции пересказа видео с помощью YandexGPT в Яндекс Браузере. Можно узнать, почему для задачи не подошла “статейная” YandexGPT, какие технические и продуктовые требования были к суммаризации видео и какой подход лучше для обучения.

🔗 Ссылка

@machinelearning_ru
4👍4🔥2👎1
🔅Новая модель, которая позволяет удалять фон из видео

На Hugging Face опубликовали модель машинного обучения, которая помещает объекты на видео на хромакей. После этого их можно использовать в видеоредакторах или других приложениях.
На платформе опубликовали саму модель и развернули демо;
большие видео не стоит грузить из-за лимита на GPU.

🤗 Загрузить своё видео и затестить

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115🔥1
⚡️ Руководство YOLOv9: обучаем модель на собственном наборе данных

- запуск модели с предварительно обученными весами COCO
- файнтюнинг модели на своем датасете
- оценка модели
- развертывание модели

https://youtu.be/XHT2c8jT3Bc

@machinelearning_ru
👍104🔥1
⚡️ Новый способ точной настройки #Lms для повышения производительности при выполнении последующих задач (например, рассуждение и обобщение)

Исследовательская работа: https://arxiv.org/abs/2402.13228

Модель: https://huggingface.co/abacusai/Smaug-Mixtral-v0.1

@machinelearning_ru
👍51🔥1
🔺 Исследование: ИИ превзошел человека в… дивергентном мышлении

▶️Новое исследование, опубликованное в журнале Scientific Reports, выявило, что генеративные языковые модели могут обладать более высоким уровнем креативности в некоторых задачах.
Сравнив результаты 151 человека и GPT-4, которые выполняли задачи на альтернативное использование предметов (например, как можно еще использовать вилку, кроме очевидного способа), оценку последствий (исходы гипотетических ситуаций – например, исчезновение гравитации) и дивергентные ассоциации (назвать слова, максимально далекие друг от друга по смыслу), авторы сделали интересный вывод.

Вот некоторые интересные выводы из исследования:
🟡Творческий потенциал нейросетей обсуждается учеными, но машины пока не могут определить, что является творчеством вообще.

🟡Нейросети могут генерировать музыку и изображения, которые имеют художественную ценность.

🟡ИИ может быть более креативным в задачах на дивергентные ассоциации.

▶️ Читать подробнее

@vistehno
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3👎1🥰1
📚 Огромный список бесплатных книг по программированию на различных языках, включая русский.

Это один из наиболее популярных репозиториев на GitHub с бесплатной литературой.

Github

@machinelearning_ru
🔥42🥰1
🔥 Flowise — open source no-code инструмент для создания ИИ-помощников и не только

Flowise создан для аудитории, которая не готова кодить, но хочет получить доступ к AI. В приятном интерфейсе драг-н-дропом из готовых блоков можно построить бекенд своего будущего приложения.

При помощи Flowise можно:
*️⃣Создать чат-бот и встроить на сайт. Есть различные LLM на любой вкус, можно добавить ваши данные для анализа , выдачу поисковых систем, обращаться к сторонним API, и т.д.


FlowiseFlowise можно использовать как API. Тут потолок фантазий находится там, где заканчиваются комбинации блоков, но можно добавить и кастомные инструменты при помощи JS. Можно работать со звуком, изображениями и так далее.

Несколько практических кейсов применения Flowise:
простейший чат-бот. Сможет отвечать на вопросы.
поиск по CSV. Сможет проанализировать данные в файле.
чат-бот, который сможет отвечать на вопросы на основе вашей информации (например, о компании).
ассистент, который использует поисковую выдачу для ответов: может рассказать о погоде, последних новостях и т.д.

📎 Статья с подробным описанием и примерами использования

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥52
📹 BaoGPT

BaoGPT - это проект с искусственным интеллектом, который позволяет вам задавать вопросы о видео на YouTube

Полностью OSS, построенный на Long Chain, Anthropic и Qdrant, с интерфейсом Discord и Gradio

Ознакомьтесь с репозиторием здесь.

Github

@machinelearning_ru
👍6🔥31
✖️ Профессия промпт-инженера не получит большого внимания и не станет востребованной

Рик Баттл и Тедж Голлапуди из VMware, рассказали, что языковые модели часто непредсказуемо реагируют на запросы. На качество ответа влияет сам вопрос, набор входных данных и другие параметры. Разные комбинации дают разный результат, поэтому промпт-инженеры подбирали запросы методом тыка.

Рик Баттл рассказала про способ составления промптов с помощью самой языковой модели. Большинство таких запросов получаются нелогичными для человека, но дают лучший результат, чем метод подбора с помощью проб и ошибок. В одном из случаев запрос, составленный нейросетью, начинался с отсылки на «Звёздный путь», и это заметно улучшило сгенерированный ответ.

Баттл утверждают, что нейросети представляют собой набор математических моделей и алгоритмов, а люди не могут точно знать как они работают, и какие из команд оказывают на нейросеть большее влияние. Поэтому даже пользователи, называющие себя экспертами в промптинге, просто находят удачные комбинации, но не могут составлять сразу хорошие запросы.

В качестве ещё одного примера целесообразности использования нейросети для генерации промптов приводят недавний эксперимент Intel. Инженеры компании разработали инструмент для Stable Diffusion, который получает пользовательский запрос, а потом преобразует его в оптимальный для нейросети. В результате изображения, сгенерированные с помощью преобразованных промптов, получается более детализированными и эстетичными. Для преобразования запросов разработчики Intel обучили специальную нейросеть.

Исследователи считают, что профессия промпт-инженера уже утратила свою актуальность, не успев стать востребованной и популярной. Нынешние языковые модели могут генерировать более правильные и эффективные запросы чем люди.

📎 Читать подробнее

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥6👎21
🖥 Генераторы данных с открытым исходным кодом!

🟡Mimesis - надежный генератор данных для Python, который может создавать широкий спектр поддельных данных на различных языках.

🟡Spawner - инструмент для создания данных для разнообразных баз данных и искусственного интеллекта. Содержит широкий набор полей, включая возможность пользовательской настройки вручную.

🟡Text or Images, Input or Output - крутейший LLM генератор.

🟡Benerator - генератор текстовых данных для оценки, тестирования и обучения ИИ-моделей.

🟡DataFactory - удобный способ создавать разнообразные наборы тестовых данных для наполнения баз данных и проверки ИИ-моделей.

🟡MockNeat - простой интерфейс для программной генерации данных в форматах json, xml, csv и sql.

🟡Faker - с помощью этого инструмента можно быстро создать фейковые данные для тестов.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥2👎1
💫 В рейтинге ИИ-разработок от AlPort появились две генеративные нейросети Яндекса.

Текстовая YandexGPT и мультимодальная YandexART оказалась среди самых заметных и перспективных разработок в сфере генеративного искусственного интеллекта по ключевым категориям.

Также Яндекс стал одной из 11 компаний со всего мира, разрабатывающих более одного типа GenAI-моделей наряду с Stability AI, Open AI, Google, Microsoft, Meta , Tencent и Baidu.

🔗 https://habr.com/ru/news/800245/

@machinelearning_ru
👍92👎1🔥1