R4marketing | канал Алексея Селезнёва | Язык R
4.28K subscribers
59 photos
11 files
1.21K links
Автор канала Алексей Селезнёв, украинский аналитик, автор ряда курсов по языку R и пакетов расширяющих его возможности.

В канале публикуются статьи, доклады, новости, уроки и заметки по языку R.

Для связи: @AlexeySeleznev
Реклама: http://bit.ly/39MwJCY
Download Telegram
​​Data Science 'по ту сторону изгороди'

Автор: Илья Шутов (@iMissile)

Большое количество курсов по аналитике данных и питону создает впечатление, что «два месяца курсов, пандас в руках» и ты data science специалист, готовый порвать любую прямоугольную задачу.

Однако, изначально просто счёт относился к computer science, а data science было более широким и междисциплинарным понятием. В классическом понимании data scientist — «T-shape» специалист, который оцифровывает и увязывает административные и предметные вертикали/горизонтали компаний через математические модели.

Содержание:
● Задачки
● Формирование иерархического списка работ
● Сшивка цепочек идентификаторов
● Треугольная матрица
● Манипуляции с прямоугольными представлениями
● Подготовка time-series
● Комбинаторные задачки
● Числовая аннигиляция
● Парсинг полуструктурированного csv
● Еще немного задачек
● Заключение

#статьи_по_R
👍4
Продолжаем рисовать портрет подписчика, укажите ваш среднемесячный доход в долларовом эквиваленте за предыдущие 6 месяцев. Опрос анонимеый.
Anonymous Poll
6%
Нет дохода
7%
До 500$
22%
501$ - 1000$
19%
1001$ - 1500$
14%
1501$ - 2000$
12%
2001$ - 2500$
3%
2501$ - 3000$
7%
3001$ - 4000$
10%
Более 4000$
​​Обращаемся к ggplot2 на естественном языке

Пакет ggx является расширением для ggplot2, и позволяет использовать естественный язык для построения графиков, и получения справки. Состоит пакет всего из двух функций:

gg_() - Преобразует запрос на естественном языке в объект ggplot.
gghelp() - Позволяет получить справку по командам ggplot2 по запросу написанному на естественном языке.

Примеры использования:
 
library(ggx)
library(ggplot2)

# управление цветами графика
ggplot(data=iris,
mapping=aes(x=Sepal.Length,
y=Petal.Length, color=Species))+
ggtitle("Iris")+
geom_point()+
gg_("paint the title red")+
gg_("paint the x-axis label in green")+
gg_("also, I want a purple y-axis label")

# управление подписями графика
ggplot(data=iris,
mapping=aes(x=Sepal.Length,
y=Petal.Length, color=Species))+
ggtitle("Iris")+
geom_point()+
gg_("Rotate the x-axis labels by 32°")+
gg_("Rotate the y-axis labels by 172 degrees")

# управление легендой
ggplot(data=iris,
mapping=aes(x=Sepal.Length,
y=Petal.Length, color=Species))+
ggtitle("Iris")+
geom_point()+
gg_("remove legend")

# запрос справочной информации
gghelp("rotate x-axis labels by 90 degrees")
gghelp("increase font size on x-axis label")
gghelp("set x-axis label to 'Length of Sepal'")


#заметки_по_R
​​Программирование с dplyr

Друзья, опубликовал перевод виньетки "Programming with dplyr".

Содержание:
● Маскирование данных
● Переменные окружения и данных
● Косвенное обращение
● Концепция Tidy selection
● Синтаксис tidyselect DSL
● Косвенное обращение
● Рецепты
● Данные, предоставленные пользователем
● Исправление R CMD check NOTEs
● Одно или несколько пользовательских выражений
● Любое количество пользовательских выражений
● Преобразование пользовательских переменных
● Перебрать несколько переменных
● Использование переменной ввода Shiny
● Заключение

———————————
Буду благодарен за предложения по улучшению качества перевода. направлять предложения можно мне в личку.

Ссылки:
- Перевод
- Оригинал
🔥12
​​Курс "Математические методы в зоологии с использованием R".

Автор: Мария Варфаломеева (@varmara)

Цели этого курса:

Познакомить с применением различных математических методов в биологии (анализ мощности, регрессионный и дисперсионный анализ, анализ главных компонент, многомерное шкалирование, кластерный анализ), и научить самостоятельно анализировать данные с использованием скриптов на языке статистического программирования R, представлять в наглядном виде результаты анализов, интерпретировать их и представлять в виде научного отчета.

Содержание:

● Знакомство с R
● Тестирование гипотез. Анализ мощности
● Регрессионный анализ, ч.1
● Регрессионный анализ, ч.2
● Дисперсионный анализ, ч.1
● Дисперсионный анализ, ч.2
● Анализ главных компонент
● Дискриминантный анализ
● Ординация и классификация с использованием мер сходства-различия

#курсы_по_R
👍1
​​Палитры в R

Пакет MetBrewer был создан под вдохновением от посещения художественного Метропόлитен-музей в Нью Йорке (The Metropolitan Museum of Art) . По сути он состоит из набора палитр, полученных из картин представленных в этом музее.

В пакете всего одна функция met.brewer(), в которой доступно 3 аргумента:

● name - название палитры
● n - количество цветов, которые вам необходимо получить
● type - тип шкалы, непрерывная или дискретная.

Установка

Установить пакет можно из GitHub командой devtools::install_github("BlakeRMills/MetBrewer") .

Список доступных палитр

● Austria
● Cassatt
● Degas
● Egypt
● Gauguin
● Greek
● Hokusai
● Ingres
● Isfahan1
● Isfahan2
● Juarez
● Klimt
● Manet
● Monet
● Moreau
● Morgenstern
● Nattier
● NewKingdom
● Pillement
● Pissaro
● Redon
● Renoir
● Robert
● Stevens
● Tara
● Thomas
● Tiepolo
● Troy
● VanGogh1
● VanGogh2
● Veronese
● Wissing

Пример использования с ggplot2

 
library(ggplot2)
library(MetBrewer)

ggplot(data=iris,
aes(x=Sepal.Length,
y=Petal.Length,
color=Species))+
ggtitle("Iris")+
geom_point()+
scale_color_manual(values = met.brewer("Cross"))

Ссылки:
- Репозиторий на GitHub со всеми палитрами

#заметки_по_R
👍6🔥5
​​Индексирование с 0 в R

Индексирование элементов объектов в R начинается с 1, но во многих других языках, в том числе Python, индексация начинается с нуля.

Лично я никогда не понимал идеи индексации с нуля, тем не менее для кого-то она более привычна.

Пакет index0 позволяет вам использовать индексацию с нуля в R.

 
library(index0)
letters0 <- as.index0(letters)
numbers0 <- as.index0(c(2, 3, 4, 5, 6))

letters0[0]
#> [1] "a"
#> indexed from 0

numbers0[0]
#> [1] 2
#> indexed from 0

letters0[c(1, 2, 4)]
#> [1] "b" "c" "e"
#> indexed from 0

numbers0[c(1, 3)] <- NA
numbers0
#> [1] 2 NA 4 NA 6
#> indexed from 0


Ссылки:
- О пакете index0 узнал из статьи "Indexing from zero in R"

#заметки_по_R
👍4
​​Друзья, Филипп Управителев (@konhis) организовывает онлайн митап по R, передаю ему слово.

———————
Всем привет!
Приглашаю всех в пятницу 4 февраля 2022 в 20:00 MSK на онлайн-митап по R.
Запись митапа будет доступна позже.
Программа:
- Станислав Масюта, "Разработка рекомендательной системы для новичков"
- Игорь Магдеев, "Применение мodel-based clustering в задачах геологии и геофизики" (моделирование смесей Гауссовых распределений)
- Гарик Мороз, "Как подать свой пакет в ROpenSci и зачем это делать"
- Илья Шутов, "Практики применения R в бизнесе"
- Филипп Управителев: R intro

Запись всех докладов можно найти тут.
👍34🔥5
​​Как понять к какому пакету относится функция

Не редко используя чужой скрипт можно столкнуться с ошибкой Error in function(val) : could not find function "function".

Ошибка означает, что вы обращаетесь к функции, которая не определена ни в глобальном окружении, ни в окружении подключённых пакетов.

Как вы знаете, в R десятки тысяч пакетов, как понять какой именно необходимо установить, что бы экспортировать нужную функцию.

В этом поможет сайт rdocumentation.org. Перейдите по ссылке, введите в поиске название функции, и увидите все пакеты в которых она встречается.

Так же вы можете использовать пакет sos:
 
sos::findFn("fread")


Ссылки:
- вспомнил я об этом увидев сообщение в чате, автор @saraikinuv
- про пакет sos рассказал @iMissile так в чате

#заметки_по_R
👍8
​​Бесплатный курс Погрузись в мир бизнес аналитики с SQL и R

Автор: Андрон Алексанян
Платформа: SF Education

Программа:
1. Когортный анализ
2. Язык SQL
3. SQL часть 2
4. Язык R
5. Язык R часть 2
6. Машинное обучение на языке R

#курсы_по_R
👍7
​​Видео урок Грамматика графики в R. Пакет ggplot2

Автор: Артём Голубничий

Содержание:
● ggplot2
● грамматика графики
● грамматические элементы
● набор данных iris
● уровни ggplot2
● интерактивная графика
● быстрое построение изображения

#видео_уроки_по_R
👍7
​​Релиз rtgstat 0.3.0

Небольшое обновление rtgstat, пакета предназначенного для аналитики telegram каналов по средствам запроса данных из TGStat API.

Что нового?

● Добавлена новая функция tg_channels_search(), которая позволяет вам искать каналы задав тематику, язык или страну. На данный момент в TGStat API доступна статистика более чем по 500 000 различных телеграм каналов.
● Любая из функций пакета теперь не отправляя запрос к API вернёт ошибку, если в вашей сессии не установлен API токен.
● Исправлена ошибка чтения токенов, ранее функции пакета проверяли наличие токена только в опциях, игнорируя переменные среды, по умолчанию это вызывали ошибку Error: empty_token при работе с пакетом.

Установка новой версии: install.packages('rtgstat')

——————————
В марте выйдет видео урок по работе с пакетом rtgstat.
——————————

Ссылки:
- сайт пакета
- страница на CRAN
- репозиторий на GitHub

#новости_и_релизы_R
👍8
​​ОН КЛИНИК в поиске Trainee/Junior Web analyst

Курсы по программингу на Python или R будут плюсом.

Задачи:
● Внедрить (с участием подрядчиков) и поддерживать сквозную аналитику по интернет-продажам услуг в разрезе источников и каналов привлечения, типов услуг, затрат на привлечение (онлайн- и оффлайн-воронки);
● Разработка персонализированных отчетов для отдела маркетинга;
● Построение Ad-Hoc отчётов;
● Подготовка технических заданий для разработчиков и контроль их выполнения;
● Багфикс/багрепорты по работе систем веб-аналитики;
● Настройка тегов в Google Tag Manager;
● Настройка целей, представлений в Google Analytics;
● Анализ эффективности всех каналов трафика и подготовка предложений по оптимизации бюджетов и повышению уровня конверсии;
● Аналитика поведения пользователей и предложения по оптимизации удобства использования и поведенческого опыта;
● Разработка гипотез и проведение А/В-тестирований;
● Контроль и поддержание единой логики использования UTM-меток;
● Создание и поддержание актуальности отчетов маркетинговой аналитики на базе BI решений, которые позволят проводить аналитику всех каналов маркетинга с учетом реальных доходов от продаж услуг.

Требования к кандидату:
● Умение анализировать и прогнозировать результат;
● Знание Google Analytics, GTM и Excel на уверенном уровне;
● Понимание с BI системами: PowerBI или Google Data Studio;
● Понимание API (настройка сбора данных и интеграции с внешними системами), контроль разработки и внедрения с командой программистов;
● Знание различных типов моделей атрибуции.

Детали вакансии в личных сообщениях: tg @dariabarnett.
​​Уже через 20 минут (в 20:00 по Московскому времени) начнётся бесплатный онлайн митап по R.

Программа:
- Станислав Масюта, "Разработка рекомендательной системы для новичков"
- Игорь Магдеев, "Применение мodel-based clustering в задачах геологии и геофизики" (моделирование смесей Гауссовых распределений)
- Гарик Мороз, "Как подать свой пакет в ROpenSci и зачем это делать"
- Илья Шутов, "Практики применения R в бизнесе"
- Филипп Управителев: R intro

————————-
Запись всех докладов доступна в этом сообщении.
👍5
Как ускорить циклы в R. Многопоточность в языке R

Видео урок посвящённый многопоточности в R, в ходе урока будут рассмотрены следующие пакеты:

- foreach
- doFuture
- parallel
- pbapply
- furrr

Тайм коды:
00:00 Вступление
00:51 Что такое многопоточность
02:20 Какие пакеты мы будем использовать в ходе урока
03:25 Используем foreach в последовательном режиме
07:42 Аргументы конструкции foreach
10:05 Управление объединением результатов итераций цикла foreach
11:05 Выполнение foreach в многопоточном режиме
12:41 Схема реализации многопоточности
13:52 Возвращение к последовательному выполнению и ID процесса
14:56 Бекенды к foreach
15:38 Оператор %dorng%
18:10 Параллельная реализация функций семейства apply
20:52 Список функций пакетов parallel и pbapply
21:54 Пакет furrr
23:10 Соответствие функций пакета purrr и furrr
23:50 Заключение

#видео_уроки_по_R
🔥12👍8
​​Рефакторинг Shiny приложений

Автор: Илья Шутов (@iMissile)

В жизненном цикле любого эксплуатируемого ПО наступает фаза, когда накопившийся набор изменений (CR) ложится неподъемным грузом на первичную архитектуру и вот тут наступает пора рефакторинга. Много книг понаписано на эту тему, есть специфика для различных языков. Ниже затронем только отдельные аспекты, которые могут оказаться полезным применительно к RStudio Shiny приложениям. Это ряд практических методов, трюков и нюансов, накопившихся при рефакторинге, как правило, чужого Shiny кода.


Другие публикации по теме:
- русскоязычный мануал по разработке Shiny приложений
- серия статей, по сути небольшой учебник по созданию Shiny приложений от Дмитрия Храмова

#статьи_по_R
👍9
​​Друья, Филип Управителев (@konhis) организует очередной митап. В этот раз Андрей Огурцов (@biostat_r) расскажет про mlr3. Передаю организаторам слово.

—————-
Приглашаю в субботу 12 февраля в 17.00 MSK на вебинар по ml-фреймворку mlr3.

На вебинаре Андрей Огурцов расскажет про составляющие фреймворка mlr3 для машинного обучения и его основные возможности. Далее будет показан пример решения реальной задачи с использованием gpu-версии xgboost.

Подключиться к конференции Zoom

Идентификатор конференции: 878 2093 0405
Код доступа: 001163

#вебинары_по_R
👍12🔥7
​​Вакансия SEO аналитик в ОН КЛИНИК

Расширяем команду и ищем SEO аналитика.
Рассматриваем кандидатов от 2 лет опыта на позиции middle SEO, агентство или инхаус крупного проекта (от 500к трафика в мес из органики).

Возможен как удалённый так и офисный формат работы.

Задачи:
● Участие в разработке глобальной годовой SEO-стратегии по проекту;
● Анализ тематик, конкурентов и их основных методов продвижения;
● Анализ трендов и новых подходов/тактик на рынке SEO;
● Отслеживание результатов и корректировка стратегии при необходимости для достижения KPI по проекту;
● Планирование, распределение и выполнение задач по проекту согласно стратегии;
● Постоянный поиск новых возможностей для роста проекта;
● Проверка реализации задач по проекту.

Желательно иметь опыт/знания:
● Успешные кейсы по продвижению и решению проблем проектов.
● Серьезный опыт в использовании Google Analytics и других систем аналитики в решении проблем проекта и поиска возможностей для оптимизации и роста.
● Уверенный и обширный опыт работы с сервисами необходимыми для seo.
● Понимание алгоритмов поисковых систем и факторов ранжирования.
● Умение обрабатывать большой объем данных в Excel или Google таблицах.
● Умение правильно и четко излагать свои мысли устно и письменно.
● Абсолютная грамотность.

Команда:
● SEO team lead
● Middle Seo Specialist
● Junior Seo Specialist

Процессы внутри команды выстроены, задачи сложные и интересные, хорошие перспективы и условия для прокачки своих навыков.

Буду рада поделиться всеми подробностями в личных сообщениях: tg @dariabarnett.
❗️Кто тут интересовался автоворонками и чат-ботами, спрашивал, подойдут ли они вашему бизнесу?

Скоро будет проходить Эксклюзивный БЕСПЛАТНЫЙ мастермайнд “Как автоматизировать и увеличить продажи” с международным экспертом по мессенджер-маркетингу Вадимом Дроздовским 🤓

Какие темы будут рассматривать ⬇️

🔹 системный и масштабируемый канал генерации
🔹 потенциальных клиентов
🔹 повторные продажи
🔹 конверсия 80%+ за счет лид-магнита и трипваера
🔹 база постоянных, лояльных клиентов в единой системе
🔹 реферальный и органический бесплатный трафик
🔹 автоматизация пути клиента и прогрева лидов

🕓 Мастермайнд запланирован на 16 февраля в 19:00 по Киеву/20:00 Мск. Только эксклюзивная и практическая информация, без воды и “золотых унитазов” 👌

▶️ Регистрируйтесь по ссылке “для своих” тут - https://bit.ly/3uOJPMd