Аналитик данных – Telegram

Аналитик данных

6.02K subscribers

215 photos

27 videos

2 files

199 links

Аналитика данных, Дата Сеанс

@workakkk - по всем вопросам

Download Telegram

About

Blog

Apps

Platform

Аналитик данных

6.02K subscribers

Аналитик данных

👩‍💻 Курс по анализу и визуализации данных на Python с астрономическими данными!

💡 Этот курс — путешествие по вселенной анализа и визуализации данных, специально разработанный для астрономических данных. Курс охватывает все: от основ программирования на Python до продвинутых методов обработки изображений.

🕞 Продолжительность: 6:31:57

🔗 Ссылка: *клик*

#курс #python #dataanalysis

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤1

1.74K viewsedited 21:10

Аналитик данных

Forwarded from Machinelearning

🌟 Hymba-1.5B: Базовая и инструктивная модели от NVIDIA.

Hymba-1.5B-Base имеет embedding size 1600, 25 attention heads, MLP 5504, 32 слоя, 16 состояний SSM, 3 слоя полного внимания, остальные - внимания со скользящим окном.

В отличие от стандартного трансформера, каждый слой внимания в Hymba имеет гибридную комбинацию стандартных attention heads и Mamba heads в параллельном исполнении. Hymba использует технологии Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE).

Hymba обучалась на 1.5 трлн токенах в 2 этапа предварительного обучения и 3 этапами посттренининга.

Hymba-1.5B-Instruct - файнтон Hymba-1.5B-Base на комбинации открытых наборов данных инструкций и собранных собственными силами синтетических датасетов.

Эта модель настраивалась с помощью SFT и DPO и способна как в математические рассуждения и вызов функций, так и в ролевые сценарии.

⚠️ В Hymba-1.5B-Instruct используется кастомный шаблон промпта, который был интегрирован в токенизатор и может быть применен с помощью tokenizer.apply_chat_template.

▶️Пример инференса Hymba-1.5B-Base:

from transformers import LlamaTokenizer, AutoModelForCausalLM, AutoTokenizer, AutoModel
import torch

# Load the tokenizer and model
repo_name = "nvidia/Hymba-1.5B-Base"

tokenizer = AutoTokenizer.from_pretrained(repo_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(repo_name, trust_remote_code=True)
model = model.cuda().to(torch.bfloat16)

# Chat with Hymba
prompt = input()
inputs = tokenizer(prompt, return_tensors="pt").to('cuda')
outputs = model.generate(**inputs, max_length=64, do_sample=False, temperature=0.7, use_cache=True)
response = tokenizer.decode(outputs[0][inputs['input_ids'].shape[1]:], skip_special_tokens=True)

print(f"Model response: {response}")

📌 Лицензирование: NVIDIA Open Model License Agreement

🟡

Набор моделей на HF

@ai_machinelearning_big_data

#AI #ML #SLM #Hymba #Nvidia

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

1.65K views09:05

Аналитик данных

⚡️ Cotype Nano - русскоязычная SLM от МТС.

MTS AI опубликовала в открытый доступ легковесную модель генерации текста C otype Nano и ее квантованные вариации.

Cotype Nano построена на базе Qwen2.5-1.5B и обучалась методом SFT на датасете объемом 1 млн. инструкций из областей: математика, программирование, обобщение текста и текстовые диалоги. В создании датасета использовалась большая модель Cotype Pro 32k.

На первой стадии обучался слой MLP с LoRa на датасетах по математике и программированию. На второй стадии обучалась вся модель на инструктивных датасетах. Завершающим этапом стал alignment (DPO) на отдельно сгенерированном датасете.

Оценка модели проводилась автоматическим side-by-side с gpt-3.5-turbo и gpt-4 на внутреннем датасете и в бенчмарках RuGeneralArena, где Cotype-Nano показала лучший результат в своей весовой категории.

▶️Набор моделей:

🟢

Cotype-Nano - 1.54 млрд. параметров;

🟠

Cotype‑Nano-4bit - 403 млн. параметров, квантованная методом AWQ версия;

🟠

Cotype‑Nano‑CPU - оптимизированная с помощью openVINO версия под CPU Intel;

🟠

Cotype Nano GGUF - 1.54 млрд параметров, две версии в разрядности 16-bit (3. 09 Gb) и 8-bit (1.65 GB) под llama.cpp.

📌Лицензирование: Apache 2.0 License.

🟡

Статья на Habr

🟡

Набор моделей на HF

@dataanlitics

#AI #ML #SLM #RuLLM #MTSAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2

1.95K views20:38

Аналитик данных

🔥 Создание ИИ-генератора изображений с помощью Python!

🌟 Узнайте, как генерировать изображения AI бесплатно с помощью Google Collab и локально на вашем компьютере. Изучите различные модели и подсказки для создания высококачественных изображений без усилий.

🕞 Продолжительность: 17:19

🔗 Ссылка: *клик*

#курс #python

@dataanlitics

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1🔥1

1.76K views12:00

Аналитик данных

Forwarded from Machinelearning

📎

ML в медицине: дайджест за 1 - 7 декабря 2024 г.

▶️

Модели, бенчмарки и датасеты

🔘

SOAR: бенчмарк для оценки LLM в задачах аннотации типов клеток.
Тест, который проверяет, насколько хорошо модели могут понимать и анализировать сложные данные о клетках.

🔘

Повышение точности диагностики рентгенограмм грудной клетки с помощью анализа направления взгляда врачей.
Система 2-х нейросетей, которая помогает диагностировать заболевания по рентгенограммам грудной клетки и предсказывает, на какие области изображения врачи обращают внимание.

🔘

EchoONE: унифицированная модель для сегментации множества плоскостей эхокардиографии.
Модель, которая помогает врачам более точно анализировать снимки сердца, сделанные с помощью ультразвука, даже если снимки сделаны под разными углами.

▶️

Фреймворки и методологии

🔘

RARE: RAG-ризонинг.
Метод для улучшения способности рассуждать и давать точные ответы, используя комбинацию генерации и поиска информации для обогащения своих знаний.

🔘

STORM: cтратегия организации модальностей для классификации редких событий.
Алгоритм, который помогает выбрать лучшие источники информации для решения сложных медицинских задач.

🔘

TransFair: прогноз прогрессирования глазных заболеваний.
Модель классификации, которая помогает сделать прогнозы о глазных заболеваниях более справедливыми и точными.

🔘

PePR: оценка эффективности моделей с учетом потребления ресурсов.
Показатель, который помогает оценить, насколько эффективно модель использует ресурсы.

🔘

Оценка качества рентгенологических заключений с помощью сопоставления клинических данных с изображением.
Метод оценки качества автоматически сгенерированных рентгенологических отчетов, который учитывает точность описания патологических изменений, их локализации и степени выраженности.

▶️

Медицинские LLM-приложения

🔘

MedChain: LLM-агент и бенчмарк для принятия клинических решений.
Набор данных и система для имитации реальной клинической практики, где каждый случай включает подробную информацию о пациенте и требует активного сбора информации и принятия решений на основе предыдущих шагов.

🔘

QG-Summ: автореферирование медицинских записей с самоконтролем, управляемое запросами.
Метод, который помогает создавать краткие и точные отчеты о состоянии пациентов в электронных медкартах, используя запросы, связанные с пациентом, для руководства процессом.

🔘

CLINICSUM: генерация медицинских заключений из диалогов врача и пациента.
Фреймворк, который может автоматически создавать медицинские заключения на основе разговоров между врачом и пациентом, используя специальную архитектуру.

▶️

Исследования и обзоры

*️⃣

Проблемы производительности LLM для здравоохранения с учетом демографической справедливости.
Исследование проблемы демографической предвзятости популярных современных LLM в различных медицинских задачах.

*️⃣

Применение эмбединг-моделей для классификации медицинских текстов.
Статья о том, как использовать эмбединги для классификации медицинских текстов без необходимости обучения на медицинских данных.

*️⃣

BlockMedCare: блокчейн, ИИ и IoT для здравоохранения будущего.
Концепция системы для безопасного и эффективного управления электронными медицинскими картами, позволяя пациентам, врачам и администраторам взаимодействовать с системой на различных устройствах.

🔜

Читать полный дайджест

🔜

Telegraph

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1

1.86K views07:30

Аналитик данных

Media is too big

VIEW IN TELEGRAM

Машинное обучение на JavaScript

Заняться машинным обучением можно даже, если вы не знакомы с Python. Для этого у JS есть библиотека ml5.js, которая построена на основе TensorFlow.js.

В этом уроке вы познакомитесь с основами использования ml5.js для создания интерактивных и интеллектуальных веб-приложений. Ролик подойдёт даже тем, у кого ещё нет опыта работы с машинным обучением.

#javascript #ml #видео

2.07K views13:29

Аналитик данных

Media is too big

VIEW IN TELEGRAM

🔥 Бесплатный Курс: Математика машинного обучения. Тензоры

📌 Видео

@data_math

👍3❤1🔥1

2.15K views10:58

Аналитик данных

⚡️ Курс: Математика Машинного обучения Урок 2 Инвариантность

📌 Видео
📌 Урок 1
📌 Colab

Курс: Математика Машинного обучения. Инвариантность. Урок 2

🔥 https://xn--r1a.website/+mweO6x5UIXJjMTJi - мой авторский телеграм канал, где собрана вся база по ИИ и машинному обучению, разбор кода и лучшие уроки для вас, подписывайтесь!
🔥 https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy - для всех кто любит машинное обучение я собрал…

👍2🔥2😐1

2.42K viewsedited 09:15

Аналитик данных

Свежий мини-курс по работе с моделями типа O1 и другими «reasoning»-моделями.

Это официальный гайд по промптингу, созданный в сотрудничестве с OpenAI и ключевым разработчиком Колином Джарвисом (главой подразделения решений в области искусственного интеллекта).

Курс научит вас новым важным техникам для модификации запросов, выполнения планов, генерации кода, рассуждений и многого другого.

Он поможет улучшить ответы нейросети O1, ведь стандартные методы промпт-инжиниринга зачастую приводят к ухудшению качества ответов.

Гайды разработаны при участии OpenAI, поэтому им можно доверять:

https://www.deeplearning.ai/short-courses/reasoning-with-o1/

❤1👍1

2.02K views22:46

Аналитик данных

⚡️ Тензорное разложении и его применении в машинном обучении. Урок 4

📌 Видео
📌 Урок 1 / Урок2 / Урок3
📌 Colab

Тензорное разложении и его применении в машинном обучении. Урок 4

🔥 https://xn--r1a.website/+mweO6x5UIXJjMTJi - мой авторский телеграм канал, где собрана вся база по ИИ и машинному обучению, разбор кода и лучшие уроки для вас, подписывайтесь!
🔥 https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy - для всех кто любит машинное обучение я собрал…

👍3

2.19K views16:08

Аналитик данных

⚡️ Введение в тензорные сети

📌 Урок5
📌 Урок 1 / Урок2 / Урок3 / Урок4
📌 Colab

Что такое тензорные сети. Курс: Математика машинного обучения

Тензорные сети — это особый вид нейронных сетей, которые используют тензорные операции для обработки данных.

🔥 https://xn--r1a.website/+mweO6x5UIXJjMTJi - мой авторский телеграм канал, где собрана вся база по ИИ и машинному обучению, разбор кода и лучшие уроки для…

❤2👍2🔥2

2.18K viewsedited 08:20

Аналитик данных

🔥

Курс по изучению Mistral AI с JavaScript!

💡 Научитесь создавать интеллектуальные приложения с использованием моделей Mistral AI с открытым исходным кодом. Этот курс охватывает все: от создания чата до расширенных вариантов использования, таких как RAG и вызов функций.

🕞 Продолжительность: 1:24:04

🔗 Ссылка: *клик*

#курс #machinelearning #javascript

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤2👍2

1.98K viewsedited 09:36

Аналитик данных

💥 Подборка годных ML плейлистов для
Обучения

1. Caltech CS156: Обучение на данных: https://youtube.com/playlist?list=PLD63A284B7615313A

2. Stanford CS229: Machine Learning: https://youtube.com/playlist?list=PLoROMvodv4rMiGQp3WXShtMGgzqpfVfbU

3. Прикладное машинное обучение: https://youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ

4. Введение в машинное обучение (Тюбинген): https://youtube.com/playlist?list=PL05umP7R6ij35ShKLDqccJSDntugY4FQT

5. Лекция по машинному обучению (Стефан Хармелинг): https://youtube.com/playlist?list=PLzrCXlf6ypbxS5OYOY3EN_0u2fDuIT6Gt

@dataanlitics

🔥3👍2❤1

2K views03:58

Аналитик данных

Ваши данные - ваша сила

❤3👍2

1.57K views04:12

Аналитик данных

🎓 Введение в статистическую теорию машинного обучения

📌 Видео
📌 Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 / Урок 6
📌 Colab
📌Полный курс

Введение в статистическую теорию машинного обучения!

Статистика в машинном обучении
Машинное обучение (Machine Learning) представляет собой метод обучения компьютерных систем, основанный на статистических моделях и логических операциях

🔥 https://xn--r1a.website/+mweO6x5UIXJjMTJi - мой телеграм канал, где собрана вся…

👍2

1.84K views06:40

Аналитик данных

🔥

ACU — тщательно подобранный список ресурсов, посвященных AI-агентам для взаимодействия с компьютерными системами!

🌟 В него входят исследования, проекты, фреймворки и инструменты, которые описывают, как автономные программы могут выполнять задачи через клики, нажатия клавиш, вызовы API и другие действия.

🖥

Please open Telegram to view this post

VIEW IN TELEGRAM

1.69K views09:04

Аналитик данных

🔥 Руководство по инженерии ИИ – как начать карьеру и преуспеть в качестве инженера ИИ!

🔗 Ссылка: *клик*

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

1.61K viewsedited 10:29

Аналитик данных

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://xn--r1a.website/gamedev
Haskell: t.me/haskell_tg

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://xn--r1a.website/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://xn--r1a.website/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://xn--r1a.website/addlist/BkskQciUW_FhNjEy

👍2

1.54K views11:33