Ночное чтиво: чувак рассказывает как собрал данные с HackerNews в несколько потоков, загрузил в S3, а оттуда в Snowflake и проанализировал с помощью нескольких SQL-запросов. В частности, изучил упоминания популярных в последние дни тикеров $GME и прочих.
И вышел наиболее крупный релиз NumPy 1.20.0, в котором довольно много разнообразных изменений. Тем, кто использует Python для анализа данных имеет смысл ознакомиться.
Уже продложительное время я слушаю подкаст про технологии Запуск завтра.
Горячо его рекомендую, поскольку в русскоязычном пространстве это самый интересный подкаст, который вообще существует.
Автор подкаста Самат Галимов ведет телеграмм-канал Запуск завтра, в котором пишет про технологии. Кстати, как вы уже догадались, подкаст получил название одноименного канала в телеге.
Помимо этого, Самат вместе с партнером помогают бизнесу с IT, так что если вашей компании что-то нужно профессионально разработать или починить разработку, обращайтесь к Самату!
Горячо его рекомендую, поскольку в русскоязычном пространстве это самый интересный подкаст, который вообще существует.
Автор подкаста Самат Галимов ведет телеграмм-канал Запуск завтра, в котором пишет про технологии. Кстати, как вы уже догадались, подкаст получил название одноименного канала в телеге.
Помимо этого, Самат вместе с партнером помогают бизнесу с IT, так что если вашей компании что-то нужно профессионально разработать или починить разработку, обращайтесь к Самату!
Apple Podcasts
Запуск завтра
Подкаст (Технологии) · Каждые две недели · Подкаст о технологиях, меняющих нашу жизнь. Самат Галимов – человек, который решает проблемы. Он работает техническим директором и все время должен находить общий язык с людьми самых разных профессий ...
Спешу рассказать любопытную историю про наше тесное аналитическое коммьюнити. На прошлой неделе присоединился к онлайн-дискуссии в рамках ИНИД (в основном, в качестве слушателя), в которой Настя Кузнецова интересно рассказывала про подход к построению визуализации. Настя ведет телеграмм-канал "Настенька и графики", который я читаю и рекомендую.
После своего выступления Настя написала мне в телеграмм и выяснилось, что мы уже около года заочно знакомы (!), т.к. в рамках одного из проектов мы с командой аудировали аналитический стек компании, в которой работает Настя, и я лично задавал Насте n-ное количество вопросов 🙂
Совпадение? Не думаю!
После своего выступления Настя написала мне в телеграмм и выяснилось, что мы уже около года заочно знакомы (!), т.к. в рамках одного из проектов мы с командой аудировали аналитический стек компании, в которой работает Настя, и я лично задавал Насте n-ное количество вопросов 🙂
Совпадение? Не думаю!
Telegram
Anastasiya Kuznetsova
я настенька и графики https://xn--r1a.website/nastengraph
Офигенный пост и про телеграм, и про аналитику.
Давно известно, что в телеграмме есть фича по поиску ближайших к тебе людей (еще можно организовать чат, основанный на локации), в английской версии это называется Find People Nearby.
Чувак конкретно запарился, сэмулировал свою геолокацию GPS, запилил свою версию приложения телеги (тк под андроид опенсорс), в которой логировал передвижения и определение близлежайших к нему людей.
Из математики в посте — описание как он рассчитывал координаты людей поблизости.
Ключевая суть и его консерн о безопасности телеги в том, что потенциально можно подменить свою геолокацию на желаемую и обнаружить практически точные координаты людей поблизости (актуально не для густонаселенных городов).
Хорошая новость в том, что дефолтно эта опция отключена, но если вы ее ранее включили, проверьте на всякий случай (ниже скриншот где искать) :)
Давно известно, что в телеграмме есть фича по поиску ближайших к тебе людей (еще можно организовать чат, основанный на локации), в английской версии это называется Find People Nearby.
Чувак конкретно запарился, сэмулировал свою геолокацию GPS, запилил свою версию приложения телеги (тк под андроид опенсорс), в которой логировал передвижения и определение близлежайших к нему людей.
Из математики в посте — описание как он рассчитывал координаты людей поблизости.
Ключевая суть и его консерн о безопасности телеги в том, что потенциально можно подменить свою геолокацию на желаемую и обнаружить практически точные координаты людей поблизости (актуально не для густонаселенных городов).
Хорошая новость в том, что дефолтно эта опция отключена, но если вы ее ранее включили, проверьте на всякий случай (ниже скриншот где искать) :)
Telegram-боты не обладают методами для выгрузки подписчиков из каналов, но это можно сделать при помощи Telegram API. Сегодня напишем скрипт, который при помощи библиотеки Telethon собирает логины, имена, фамилии и телефоны подписчиков вашего канала.
https://leftjoin.ru/all/tg-api-parse/
https://leftjoin.ru/all/tg-api-parse/
LEFT JOIN
Сбор информации о подписчиках Telegram-канала
На 2021 год боты в Telegram так и не имеют метода, позволяющего получать информацию о подписчиках канала. Тем не менее, существует достаточно сложное в освоении Telegram API и построенная на нём библиотека Telethon. Сегодня мы посмотрим, как при помощи библиотеки…
Недавно наткнулся на очень интересный доклад в Stanford от создателя Segment о том, как они искали свой Product-Market Fit.
Peter (один из фаундеров) делится тем, с чего Segment начинался, насколько кардинально все поменялось в процессе и вообще безумно интересно рассказывает историю возникновения их стартапа.
У доклада есть продолжение в виде подкаста-интервью от YCombinator.
Peter (один из фаундеров) делится тем, с чего Segment начинался, насколько кардинально все поменялось в процессе и вообще безумно интересно рассказывает историю возникновения их стартапа.
У доклада есть продолжение в виде подкаста-интервью от YCombinator.
YouTube
How to Find Product Market Fit - Stanford CS183F: Startup School
Peter Reinhardt, co-founder and CEO of Segment, shares his experience on finding product market fit.
Иногда при возникновении ошибки во время работы с базой данных необходимо отменить все предыдущие действия. Для этого существуют транзакции — они представляют собой единую последовательность действий, у которой есть начало, конец и откат в случае ошибки. Сегодня изучим, как в библиотеке SQLAlchemy для Python использовать транзакции на примере парсинга информации о пользователях ВКонтакте в базу данных MySQL
https://leftjoin.ru/all/tranzakcii-v-sqlalchemy/
https://leftjoin.ru/all/tranzakcii-v-sqlalchemy/
Looker — BI-инструмент класса self-service: все отчёты и аналитику пользователь может сделать самостоятельно без привлечения специалиста в области данных, а последний заранее настраивает необходимые модели данных.
В новом видео цикла гайдов по BI-системам мы изучим интерфейс Looker, погрузимся в терминологию инструмента, взглянем на готовые приложения в Marketplace, разберёмся с построением Look ML моделей и посмотрим на итоговый дашборд по датасету SuperStore.
Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.
В новом видео цикла гайдов по BI-системам мы изучим интерфейс Looker, погрузимся в терминологию инструмента, взглянем на готовые приложения в Marketplace, разберёмся с построением Look ML моделей и посмотрим на итоговый дашборд по датасету SuperStore.
Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.
YouTube
Как создать дашборд в Looker? | построение дашборда Superstore | Гайд по BI
✔️Получить гайд по BI-системам от команды LEFT JOIN: https://xn--r1a.website/leftjoin_helper_bot?start=YouTube-ApacheSuperset
Обзор дашборда, созданного в Looker на основе датасета Superstore.
Полезные ссылки:
🔗 Сайт data-консалтинга LEFT JOIN: https://leftjoin.ru/…
Обзор дашборда, созданного в Looker на основе датасета Superstore.
Полезные ссылки:
🔗 Сайт data-консалтинга LEFT JOIN: https://leftjoin.ru/…
Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?
Anonymous Poll
38%
1
7%
2
3%
3
3%
4
7%
5
7%
6
10%
7
10%
8
10%
9
3%
10
Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?
Anonymous Poll
42%
1
9%
2
3%
3
3%
4
12%
5
12%
6
9%
7
3%
8
3%
9
3%
10
«Делайте макет логичным и простым. Провожайте взгляд пользователя по странице, используя последовательную визуальную иерархию заголовков и разделов. Сгруппируйте вместе связанные показатели, чтобы их было легко найти»
Перевели материал специалиста по данным Shopify о том, как поэтапно построить дашборд: какие вопросы себе нужно задать перед проектирвоанием, чем руководствоваться в процессе и что делать после публикации результата:
https://leftjoin.ru/all/make-dashboards-using-product-thinking-approach/
Перевели материал специалиста по данным Shopify о том, как поэтапно построить дашборд: какие вопросы себе нужно задать перед проектирвоанием, чем руководствоваться в процессе и что делать после публикации результата:
https://leftjoin.ru/all/make-dashboards-using-product-thinking-approach/
LEFT JOIN
Как создавать дашборды, используя подход продуктивного мышления
Этот материал – перевод статьи «How to Make Dashboards Using a Product Thinking Approach» Ни для кого не секрет, что передача результатов исследований другим людям — важнейшая часть науки о данных. Один из инструментов, который мы часто используем в Shopify —…
Open Graph — протокол, который позволяет контролировать превью сайта в социальных сетях. В новом материале посмотрим, как при помощи скрипта на php и Open Graph разметки сделать автоматическую генерацию картинок для превью в социальных сетях:
https://leftjoin.ru/all/open-graph-image/
https://leftjoin.ru/all/open-graph-image/
LEFT JOIN
Генерация Open Graph Image в Эгее
Протокол Open Graph нужен, чтобы управлять представлением контента сайта в социальных сетях. По сути — это набор тегов, позволяющий задать то, как будет отображаться информация о сайте на других площадках. В том числе можно указать картинку, которая будет…
Chartio — одно из решений облачной аналитики приобретен компанией Atlassian, многим известной по Jira / Confluence. Я использовал Chartio в нескольких проектах, у них очень интересно реализован слияние данных из разных источников. Итого, из современных BI-решений сделки по покупке уже состоялись по Looker, Redash, Periscope.
Наша с Ромой совместная работа про анализ зарплат рынка аналитиков данных попала в шортлист датавиз премии. Конечно, весь датавиз принадлежит Роману, однако это была интересная задачка и с точки зрения сбора данных.
И, разумеется, призываю подписчиков проголосовать за эту работу (естественно, в случае если она вам понравилась)🏅
И, разумеется, призываю подписчиков проголосовать за эту работу (естественно, в случае если она вам понравилась)🏅
Forwarded from Reveal the Data
Смотрите сколько классных работ на сайте премии Moscow DataViz Awards. Есть визуализации на любой вкус — от дата-арта до лонгридов и печатных работ. Две моих работы тоже попали в шорт-лист: совместная работа с Колей Валиотти про рынок вакансий аналитиков и трибьют Тафти в Табло. 🎉
#ссылка
#ссылка
В статье про Headless BI натыкался на решение Materialize, тогда бегло его изучил, почитав их сайт. Как понятно из названия и сайта, компания решает задачу материализации представлений для стриминга данных.
А вчера ребята рассказали, что сделали коннектор для dbt. Так что, процесс взаимодействия между компонентами modern data stack продолжается.
А вчера ребята рассказали, что сделали коннектор для dbt. Так что, процесс взаимодействия между компонентами modern data stack продолжается.
Telegram
Инжиниринг Данных
Свежий пост, где авторы рассказывают про концепт HeadlessBI