Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Начинаем погружаться в Марковские цепи

Это такая математическая модель, которая с успехом применяется в разных областях, таких как машинное обучение, генерация текстов или музыки, криптография и многих других. Ей много лет: она была разработана Андреем Марковым в начале 20 века.

😻 #math
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22👏3
Нашли тут интересную схему на тему того, как ИИ используется в медицине, и какие алгоритмы для каких задач подходят. Например, опорные вектора хорошо работают в задачах распознания рака, а рекуррентные нейронки в задачах классификации структуры белка.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥377
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла StarCode — самая мощная открытая модель для генерации кода

Компания BigCode выпустила сразу две открытых модели для генерации кода:

StarCoder - это 15B LLM для генерации кода с 8k токенов контекста. Модель училась на датасете The Stack (более 80 языков программирования) и тематических данных типа ответов со StackExchange (поэтому ей также можно задавать вопросы типа "что такое лямбда функция?"). Зафайнтюнена на 35B Python токенах. Лучше всего работает с питоном.

Вторая базовая модель StarCoderBase более универсальная и тренировалась на 1T токенов на 80+ языках программирования.

Уже даже вышел плагин для VSCode. Как поставить:
1. Установить плагин HF Code Autocomplete
2. F1 → Hugging Face Code: Set API token. Вставить свой токен отсюда.

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍215🔥4
Два самых простых способа удалить выбросы

😻 #python #train
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥4👏2
Forwarded from XOR
Один и тот же промпт в Midjourney с разницей в год. Мне бы так быстро развиваться.

❤️ #эйай
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥44👍5
Sure, bro

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
23
Как работает Stable Diffusion

Взглянем на идею диффузионных моделей, не углубляясь в математику

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍181
Media is too big
VIEW IN TELEGRAM
Nvidia показали свою новую нейросеть для разработчиков игр — NeuralVDB позволяет создавать крутую графику практически без нагрузки для компьютер.

В чем суть: нейросеть изучает освещение вокруг персонажа и то, как оно падает на объекты рядом. Всю полученную информацию ИИ сразу применяет в деле, позволяя создавать графонистые керамику, пыль и даже отпечатки пальцев. Самый сок в том, что нейросеть повышает детализацию объектов в 16 раз, при этом нагрузка на вашу бедную видеокарту снижается до 100 раз.

Надеемся, все это смогут нормально оптимизировать.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤‍🔥3🤔2
Компания MosaicML выпустила MPT, модель, аналогичную LLAMA-7b, под открытой лицензией. На широком наборе задач (12 штук) в 6 она лучше оригинальной LLAMA, в половине - чуть хуже. Достигнуто это благодаря огромному и разнообразному набору текстовых данных, а также длительной тренировке - суммарно модель увидела их аж 1 ТРИЛЛИОН (прямо как LLAMA).

Что интересно, так это то, что для модели выпущено сразу 3 версии: одна базовая, вторая дообучена на инструкциях, третья - обучена на чат (с открытых логов от ChatGPT и других датасетов). Дообучение на инструкциях очень важно, оно позволяет выполнять задачи, написанные естественным языком - прямо как это делает ChatGPT.

А еще модели обучены с нуля и их можно коммерчески использовать.

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍174🔥2
Как визуализировать дерево решений

Ну во-первых, это красиво. Во-вторых, самое прекрасное свойство деревьей решений – интерпретируемость, и визуализировать модель в этом случае очень полезно. Помимо того, что мы видим, как модель будет принимать решение, можно еще и оценить разделимость данных (например, посмотрев на индекс Джини и количество айтемов каждого класса в вершинах). Вот код на примере Ирисов Фишера:

# Load libraries
import pydotplus
from sklearn.tree import DecisionTreeClassifier
from sklearn import datasets
from IPython.display import Image
from sklearn import tree

# Load data
iris = datasets.load_iris()
features = iris.data
target = iris.target

# Create decision tree classifier object
decisiontree = DecisionTreeClassifier(random_state=0)

# Train model
model = decisiontree.fit(features, target)

# Create DOT data
dot_data = tree.export_graphviz(decisiontree,
out_file=None,
feature_names=iris.feature_names,
class_names=iris.target_names)

# Draw graph
graph = pydotplus.graph_from_dot_data(dot_data)

# Show graph
Image(graph.create_png())


😻 #analytics #python #train
Please open Telegram to view this post
VIEW IN TELEGRAM
36👍3
Keras уже курит на заднем сидении

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
27🤔5🫡3👍1
8 способов проверить “Что там с данными?” от Andy Kriebel.

Нашли и перевели для вас отличный пост с Linkedin – сохраняйте!

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥114