Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Нашли отличный гайд по SQL в виде схем Canvas

Сойдет также в виде красивой подробной шпаргалки. В документе есть все что нужно от уровня beginner и до advanced:

– введение в базы данных и основы инструкции SELECT
– синтаксис запросов и лучшие практики известных big Data компаний
– введение в основные понятия (например фильтрация и агрегирование)
– расширенные концепции, такие как оконные функции и массивы

А еще набор вопросов и задач для проверки знаний по каждому пункту, сторонние полезные ссылки и специальное руководство для тех, кто переходит на SQL с Excel. Из минусов: все по-английски. Но зато бесплатно и красиво!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍476🤯5🤨3🔥1😨1
Шутка дня:

– Куда датасаентисты уезжают на отдых?
– В случайный лес

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁162🤓23🤪13👍11🐳6😐6🗿6🤯3🤨21
Тензоры и как с ними работать

Тезнзоры – это главные объекты библиотеки TensorFlow, которая вместе в PyTorch является основным инструментом для обучения нейросетей.

Но как работать с этими тензорами? Мы очень старались и выкатили вам по этой теме коллаб. В нем – подробный гайд с кодом и пояснениями. Разбираем, как создавать тензоры, какие есть важные операции с ними, как изменить их размерность, перемножить их и многое другое.

Сохраняйте на здоровье -> https://colab.research.google.com/github/Veron28/bot_test/blob/master/tensorflow_by_data_secrets.ipynb

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
65👍17❤‍🔥4🤯3
Очень интересный материал «HUMANS ARE BIASED.
GENERATIVE AI
IS EVEN WORSE» от Bloomberg


Авторы рассказывают о том, как нейросеть Stable Diffusion усиливает расовые и гендерные стереотипы. Например, все портреты по запросу «инженер» мужские. Люди, сгенерированные по запросу «преступник» – в основном темнокожие мужчины, а темнокожие женщины, по мнению нейросети, занимаются уборкой или продают бургеры.

При этом в мире SD все даже хуже, чем в реальности. Например, по запросу «доктор» нейросеть генерирует всего 7% женщин, хотя в реальности женщин-докторов 32%.

В конце можно посмотреть примеры генераций и прочитать рассуждения о том, кто в ответе за такой расизм и сексизм нейросети. Спойлерить не будем. Лучше расскажите: что думаете об этом?

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯22😁16🌭125👍4🗿2🤔1👀1😨1
Что такое мультиколлинеарность и как от нее избавиться

Если кратко – это корреляция независимых переменных, которая затрудняет оценку и анализ общего результата. Мультиколлинеарность также может привести к оверфиту или стать причиной других трудностей. Подробнее – в карточках.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥8
PandasAI

С появлением ChatGPT многие задачи были автоматизированы в удобных утилитах. Для датасайентистов тоже появился такой лакомый кусочек: PandasAI. Эта библиотека-расширение pandas, в которую добавлена возможность выполнять задачи обработки данных без явного написания кода. Пишешь промпт – и поехали. Можно даже рисовать графики и работать с файлами.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥101👍15🤯12😐85
Ставь 🗿, если тоже плакал в конце

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
🗿236😁36🔥25🍌8😐4👍3🌚3🤯2🙈2🤗2💅1
Кодирование категориальных переменных: Frequency Encoding

Люди умеют разговаривать на языке категорий: мы понимаем, что такое, например, “синий” и “красный”. А машины различают только числа. Чтобы найти общий язык, нам нужен переводчик. Рассказываем про кодирование категориальных переменных и один из вариантов “перевода”.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍404
Вышла статья, в которой авторы придумали, как прикрутить GPT-4 к модели генерации изображений по тексту

Идеальный мир: берём GPT-4, получаем эмбеддинги текста, отдаём их модели, которая генерирует текст. Зачем? Потому что чем круче такой энкодер, тем круче в итоге генерации. А GPT-4 – наш state of the art.

Но есть проблема: GPT-4 не открытая модель. Казалось бы, на этом моменте мечты рушатся. Но нет.

Авторы статьи предлагают подойти к проблеме с другой стороны. Они говорят: зачем нам эмбеддинги, если можно сразу генерировать с помощью GPT-4 векторную картинку формата TikZ по запросу (и при этом отличного качества)? А потом просто отправляем промпт и TikZ в ControlNet и радуемся!

Гениально, не правда ли?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍307😐3🤯2🙈2
Центральная предельная теорема и почему она так важна

Сначала объясним интуитивно, потом добавим щепотку математики, приправим примером, а на десерт объясним, почему ЦПТ так важна.

😻 #math
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72❤‍🔥146🤯1