Аналитик данных – Telegram

Аналитик данных

6.02K subscribers

215 photos

27 videos

2 files

199 links

Аналитика данных, Дата Сеанс

@workakkk - по всем вопросам

Download Telegram

About

Blog

Apps

Platform

Аналитик данных

6.02K subscribers

Аналитик данных

Forwarded from Machinelearning

🌟 InternLM2.5-20B-chat и InternLM2.5-1.8B-chat: Расширение семейства языковых моделей InternLM 2.5.

InternLM2.5-20B-chat - базовая модель с 20 миллиардами параметров ориентированная на чат-взаимодействие. Модель обладает математическими возможностями, поддерживает сбор информации с веб-страниц и получила улучшенный навык следования инструкциям.
Модель может быть развернута с помощью Transformers, vLLM и LMDeploy.

Доступна также версии GGUF для запуска в llama.cpp, LMStudio и Ollama с половинной точностью FP16 (39.7GB) и в малоразрядных квантованных вариациях c шагом в 1 bit : от 2-bit (7.55 GB) до 8-bit (21 GB).

InternLM2.5-1.8B-chat - модель с 1.8 миллиардами параметров и точно такой же направленности и возможностями, как и 20B-chat версия.

Для InternLM2.5-1.8B-chat тоже доступны GGUF версии с разрядностью от FP16 (3.78 GB) до до 2-bit (772 Mb), с шагом в 1 bit.

📌Лицензирование :

🟠InternLM2.5-20B-chat: бесплатно. Коммерческое применение требует подачи заявки через форму.
🟢InternLM2.5-1.8B-chat: Apache 2.0 License

🟡

Страница проекта

🟡

Набор моделей на HF

🟡

Сообщество в Discord

🖥

Github [ Stars: 6.1K | Issues: 7 | Forks: 431]

@ai_machinelearning_big_data

#AI #LLM #ML #InternLM

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍2🔥2

2.22K views17:16

Аналитик данных

A Tutorial on Principal Component Analysis.pdf

Классный туториал по PCA!

🔥3❤2

1.72K views14:04

Аналитик данных

🚀 NVIDIA Llama 3.1 Minitron 4B создана на основе Llama 3.1 8B.

- В 40 раз меньше токенов
- В 1,8 раза меньше затрат
- На 16% выше производительность
- 4 миллиарда параметров
⚖️ работает наравне с моделями 8B
✅ Обрезка и дистилляция
✅ Создание эффективной модели искусственного интеллекта
✅ Требуется меньше данных для обучения

https://developer.nvidia.com/blog/how-to-prune-and-distill-llama-3-1-8b-to-an-nvidia-llama-3-1-minitron-4b-model/

NVIDIA Technical Blog

How to Prune and Distill Llama-3.1 8B to an NVIDIA Llama-3.1-Minitron 4B Model

Large language models (LLM) are now a dominant force in natural language processing and understanding, thanks to their effectiveness and versatility. LLMs such as Llama 3.1 405B and NVIDIA Nemotron-4…

👍4❤2🔥2

1.76K views15:59

Аналитик данных

Искусственный интеллект / Машинное обучение

Предсказываем цены на квартиры // Машинное обучение
Предсказываем кто Выжил на Титанике // Машинное обучение. Питон.
Строим Нейронную Сеть для Распознавания Изображений за 20 минут
Различие между Искусственным Интеллектом, Машинным обучением и Глубоким обучением
Искусственный Интеллект: История развития

#video

https://www.youtube.com/playlist?list=PL2bxgPsd_Jd5E_fxEje1OIr8b6EKFY_JV

👍4❤3🔥2

1.77K views08:22

Аналитик данных

Forwarded from Machinelearning

🌟 Llama-3.1-Storm-8B: Файнтюн и мердж Llama 3.1+Llama Saprk от победителей NeurIPS LLM Efficiency Challenge 2023.

Llama-3.1-Storm-8B - инструктивная модель, сочетающая в себе баланс размера и производительности, ориентированная на использование в приложениях и сервисах, генерацию текста, вызов функций и чат-ботов.

Модель обучалась на 1 миллионе высококачественных образцах из большого датасета (2.8M), отобранных вручную. Образцы оценивались на основе образовательной ценности и уровня сложности, чтобы модель могла получить релевантные и сложные данные в качестве тренировочной базы.

Полученный набор данных использовался для контролируемого файнтюна базовой Llama-3.1-8B-Instruct c применением методологии SPECTRUM. В завершении, полученная модель была объединена с моделью Llama-Spark методом сферической линейной интерполяции SLERP.

🟠

Llama-3.1-Storm-8B : базовая модель;

🟠

Llama-3.1-Storm-8B-FP8-Dynamic : оптимизированная версия с динамическим квантованием с более низкими требованиями к VRAM (на 50%);

🟢

Llama-3.1-Storm-8B-GGUF : квантованные версии с разрядностью от 4-bit (5 Gb) до 8-bit (8.5 Gb) для использования с llama.cpp и ollama (поддержка есть в последнем обновлении).

Локальный запуск Llama-3.1-Storm-8B поддерживается в Transformers, vLLM и LitGPT.

▶️Формат промпта для Function Calling:


You are a function calling AI model. 
You may call one or more functions to assist with the user query. 
Don't make assumptions about what values to plug into function. 
The user may use the terms function calling or tool use interchangeably.

Here are the available functions:
<tools>LIST_OF_TOOLS</tools>

For each function call return a json object with function name and arguments within <tool_call></tool_call> XML tags in the format:
<tool_call>{"tool_name": <function-name>, "tool_arguments": <args-dict>}</tool_call>

⚡️Лицензирование : Llama 3.1 Community License

▪Demo
▪Набор моделей
▪Google Collab (инференс)

@ai_machinelearning_big_data

#AI #Llama #LLM #ML

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2🔥2💩1

2.08K views13:37

Аналитик данных

Forwarded from Machinelearning

⚡️ Liger Kernel: Эффективные ядра Triton для обучения LLM

Liger (Linkedin GPU Efficient Runtime) Kernel — набор оптимизированных ядер Triton, применение которых в задачах обучения LLM на нескольких GPU повышает производительность на 20 % и снижает потребление VRAM на 60%. Это дает возможность использовать более длинные контексты, более крупные размеры пакетов и увеличенные словари в обучении.

Liger предоставляет простой API для операций с оптимизированными ядрами и совместим с Hugging Face: RMSNorm, RoPE, SwiGLU, CrossEntropy, FusedLinearCrossEntropy

Liger работает с Flash Attention, PyTorch FSDP и Microsoft DeepSpeed без необходимости дополнительной настройки.

Зависимости:

🟢PyTorch: 2.1.2 или выше.
🟢Triton: 2.3.0 или выше
🟢Transformers: 4.40.1 или выше.

Liger Kernel доступен в pip. Выберите стабильную версию для продакшена или nightly c последними новыми функциями и исправлениями:

# Stable version
pip install liger-kernel

# Nightly version
pip install liger-kernel-nightly

Патч существующей модели с Hugging Face:

# Import modules
import transformers
from liger_kernel.transformers import apply_liger_kernel_to_llama

# Load Hugging Face model:
model = transformers.AutoModelForCausalLM.from_pretrained("<some llama model>")

# Apply Liger Kernel patches:
apply_liger_kernel_to_llama(model)

После установки патча, модель будет использовать операции ядра Liger для поддерживаемых слоев, что приведет к повышению производительности и снижению потребления VRAM.

Если вы хотите построить собственные модели с помощью Liger Kernel, вы можете импортировать отдельные модули ядра и использовать их в качестве строительных блоков. Например:

# Import the Liger Kernel module:
from liger_kernel.transformers import LigerFusedLinearCrossEntropyLoss

#Create your model:
import torch.nn as nn
import torch
model = nn.Linear(128, 256).cuda()
loss_fn = LigerFusedLinearCrossEntropyLoss()

#Use the model:
input = torch.randn(4, 128, requires_grad=True, device="cuda")
target = torch.randint(256, (4, ), device="cuda")
loss = loss_fn(model.weight, input, target)
loss.backward()

Модель пропатчена, вы можете продолжить обучение как обычно. Liger Kernel будет автоматически выполнять оптимизированные операции во время обучения.

📌Лицензирование: BSD 2-CLAUSE LICENSE (as is и необходимо указывать авторство при копировании и модификации).

🖥

Github [ Stars: 767 | Issues: 14 | Forks: 35 ]

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

2.25K views13:52

Аналитик данных

📌

Шпаргалка по Deep Learning

Познакомьтесь с ключевыми концепциями и алгоритмами, лежащими в основе глубокого обучения, начав с самого простого структурного блока.

📎

Шпаргалка

Please open Telegram to view this post

VIEW IN TELEGRAM

A Deep Learning Tutorial: From Perceptrons to Deep Networks

Are you joining the growing group of developers who want to know more about Deep Learning? This introductory tutorial covers it all.

👍2❤1

2.67K views07:14

Аналитик данных

This media is not supported in your browser

VIEW IN TELEGRAM

👆Шпаргалка по пошаговой работе над ИИ-проектом👆

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥3❤2

3.22K views07:24

Аналитик данных

🖥

Model Memory Utility — полезная утилита, которая помогает оценить использование памяти различными моделями машинного обучения

🌟 Инструмент предоставляет визуализацию и информацию о том, как загружаются и обрабатываются модели на CPU и GPU, что помогает разработчикам оптимизировать память и производительность своих моделей. Это полезно для выбора наиболее подходящих конфигураций для обучения и развертывания моделей

🔗 Ссылка: *клик*

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1🔥1

4.06K viewsedited 10:12

Аналитик данных

👩‍💻

Отличный бесплатный курс по Python для DataScience от FreeCodeCamp!

🌟 Вы изучите ключевые концепции, такие как структуры данных, алгоритм, объектно-ориентированное программирование и то, как выполнять сложные вычисления с использованием различных инструментов. Этот комплексный курс познакомит вас с основами научных вычислений, включая структуры данных и алгоритмы

🔗 Ссылка: *клик*

#курс #datascience #python

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1🔥1

2.41K viewsedited 10:02

Аналитик данных

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Linux: t.me/linuxacademiya
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://xn--r1a.website/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://xn--r1a.website/addlist/BkskQciUW_FhNjEy

2.45K views12:02

Аналитик данных

💡

Open FinLLM Leaderboard специализированная систему оценки, адаптированную конкретно для финансового сектора.

Особенности:
🔘Рейтинг использует методику zero-shot оценки, тестируя модели на неизвестных финансовых задачах без предварительной настройки;
🔘Охватывает задачи по семи категориям: извлечение информации (IE), текстовый анализ (TA), вопросы-ответы (QA), генерация текста (TG), управление рисками (RM), прогнозирование (FO) и принятие решений (DM).
🔘Модели оцениваются с использованием различных метрик, таких как точность (Accuracy), F1, ROUGE и коэффициент корреляции Мэттьюса (MCC).

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

Open FinLLM Leaderboard - a Hugging Face Space by finosfoundation

Compare the performance of large language models in financial tasks using this interactive leaderboard. No input is required; simply explore the results to see how different models perform across v...

❤3

2.46K views14:01

Аналитик данных

🔥

Откройте для себя возможности аналитики данных с помощью бесплатных сервисов Google!

🌟 Умение анализировать и интерпретировать данные незаменимо во многих отраслях. И вам даже не нужно покупать программное обеспечение, чтобы профессионально анализировать данные!

🕞 Продолжительность: 2:57:10

🔗 Ссылка: *клик*

#курс #dataanalysis

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2🔥1

2.3K viewsedited 16:15

Аналитик данных

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Нарезка митапа Яндекса ML-Party, которая прошла 17 октября 2024 года в Белграде. Вырезаны перерывы и длинные панчи ведущего в начале и в конце.

▶️ Всего было 4 доклада:

🟡Илья Ирхин, руководитель подразделения аналитики в Яндекс Еде. Подробно рассказал про рекламу ресторанов в сервисе: аукцион, ранжирование, ценообразование.

🟡Дмитрий Солодуха, руководитель группы в Алисе и Умных устройствах Яндекса.
Показал, как Яндекс учил Алису откликаться без имени.

🟡Антон Клочков, руководитель подгруппы распознавания текста в VLM в Яндекс Поиске.
Рассказал о развитии навыков распознавания текста в VLM.

🟡Пётр Вытовтов, руководитель группы в Яндекс Погоде.
Показал трансформеры сервиса и рассказал, как прогнозировать до миллиметра осадков.

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥4❤1

2.7K views19:26

Аналитик данных

🔥

Научитесь использовать Claude AI для создания сокращателей текста, описывателей изображений и многого другого!

🌟 LLM могут помочь вам во многих задачах и сэкономить массу времени. В этом курсе вы узнаете, как использовать Claude AI вместе с API Anthropic. В ходе курса вы создадите резюматор текста, описателя изображений и другие проекты

🕞 Продолжительность: 47:49

🔗 Ссылка: *клик*

#курс #ai #claude

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1

2.49K viewsedited 13:29

Аналитик данных

🖥

awesome-ai-agents — полезный репозиторий, который содержит список различных автономных ИИ-агентов, таких как AutoGPT, BabyAGI, GPT Engineer и других!

🌟 Здесь представлены библиотеки и инструменты для работы с искусственным интеллектом, включая автономные агенты и разработки на основе GPT. Репозиторий служит полезным ресурсом для тех, кто хочет исследовать или создавать ИИ-агентов для различных задач!

▪ 150+ ИИ-агентов и фреймворков.
▪ Фильтр по сценариям использования.
▪ Фильтр по открытому/закрытому исходному коду.
▪ Фильтр новых продуктов ИИ
▪ Возможность получать обновления о конкретном агенте ИИ.

▪️Github

Please open Telegram to view this post

VIEW IN TELEGRAM

1.71K viewsedited 18:29