Forwarded from Українська девопсарня
Dropbox заопеснсорсили либу для golang для работы с xdp и ebfp
https://github.com/dropbox/goebpf/blob/master/README.md
https://github.com/dropbox/goebpf/blob/master/README.md
GitHub
goebpf/README.md at master · dropbox/goebpf
Library to work with eBPF programs from Go. Contribute to dropbox/goebpf development by creating an account on GitHub.
Forwarded from DataEng
Хороший доклад про принципы построения пайплайнов без привязки к каким-либо инструментам: Data Engineering Principles - Build frameworks not pipelines
Forwarded from DataEng
Если вы пользуетесь Apache Airflow для построения batch-процессов и хотите знать тонкости его работы, то рекомендую к прочтению пост: How Apache Airflow Distributes Jobs on Celery workers
www.sicara.ai
How Apache Airflow Distributes Jobs on Celery workers
Discover what happens when Apache Airflow performs task distribution on Celery workers through RabbitMQ queues.
Forwarded from DataEng
В блоге AirBnB вышла полезная статья про идемпотентный фреймворк для построения распределенных систем.
В самой статье идёт речь про кейс реализации системы предотвращающей двойное списание денег у клиентов сервиса.
Читаем: https://medium.com/airbnb-engineering/avoiding-double-payments-in-a-distributed-payments-system-2981f6b070bb
В самой статье идёт речь про кейс реализации системы предотвращающей двойное списание денег у клиентов сервиса.
Читаем: https://medium.com/airbnb-engineering/avoiding-double-payments-in-a-distributed-payments-system-2981f6b070bb
Medium
Avoiding Double Payments in a Distributed Payments System
How we built a generic idempotency framework to achieve eventual consistency and correctness across our payments micro-service…
Forwarded from DataEng
Нашел очень интересный доклад от Chief Data Engineer компании Paypal Sid Anand про data инфраструктуру компании. К слову, Paypal ежедневно обрабатывает более 1 миллиарда долларов транзакций в 200 странах. Как всё это работает и не падает смотрите в докладе
YouTube
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
Forwarded from DataEng
Интересный кейс про построение дата пайплайна через Python и Celery для обновления Amazon Redshift - читать. Советую изучения ради. Если же у вас стоит подобная задача, то рекомендую использовать наиболее подходящие для этого инструменты, например, Luigi или Apache Airflow.
Как сделать pipeline на Luigi я писал ещё в 2017 году в блоге. Для любителей celery тоже есть интересная статейка.
Как сделать pipeline на Luigi я писал ещё в 2017 году в блоге. Для любителей celery тоже есть интересная статейка.
Forwarded from DevBrain
Появилось видео моей презентации на Kolesa Conf в Алматы, которая проходила 12 апреля. Тема моей презентации: ETL на Python. Видео
YouTube
ETL на Python, или Построение идемпотентных дата пайплайнов, Адиль Хаштамов
Forwarded from DataEng
Сейчас идёт конференция PyCon US 2019. Один туториал был посвящен построению пайплайнов на Apache Airflow: https://youtu.be/n9_JjmHRtys
YouTube
Tania Allard - Building data pipelines in Python: Airflow vs scripts soup - PyCon 2019
"Speaker: Tania AllardIn data science (in its all its variants) a significant part of an individual’s time is spent preparing data into a digestible format. ...
Forwarded from DataEng
Обзор архитектуры Apache Spark с "высоты птичьего полёта": https://hackernoon.com/high-level-overview-of-apache-spark-c225a0a162e9
Hackernoon
High Level Overview of Apache Spark | HackerNoon
In <a href="https://hackernoon.com/why-we-need-apache-spark-51c8a57aa57a">my last post </a>we introduced a problem: copious, never ending streams of data, and it’s solution: Apache Spark. Here in Part II we’ll focus on Spark’s internal architecture and data…
Forwarded from DataEng
Обзорная презентация с Google IO про сервисы Google Cloud Platform. Будет интересно начинающим: https://www.youtube.com/watch?v=h4NJdvUcq2c
YouTube
Google Cloud Platform (GCP) Essentials (Google I/O'19)
This session is your key to the Google Cloud Platform kingdom, covering compute options, storage and database solutions, container-driven runtimes, continuous integration tools, applied DevOps principles, fully-managed big data processing, and machine learning…
Forwarded from DataEng
Если вы у себя используете Airflow, то эта статейка может быть весьма к стати: https://medium.com/flatiron-engineering/upgrading-airflow-with-zero-downtime-8df303760c96
Medium
Upgrading Airflow with Zero Downtime
At Flatiron Health, we use Airflow to orchestrate the pipelines necessary to build the mission-critical datasets we use to accelerate…
Forwarded from DataEng
Нашел в сети интересный чеклист для подготовки к интервью на позицию Data Engineer - The Interview Study Guide For Data EngineersThe Interview Study Guide For Data Engineers
Forwarded from DataEng
На HighLoad++ 2018 был доклад про data engineers: Дата-инженеры и кому они нужны - www.youtube.com/watch?v=KyZYDCkNPow
YouTube
Дата-инженеры и кому они нужны / Валентин Гогичашвили (Zalando SE)
Приглашаем на конференцию Saint HighLoad++ 2025, которая пройдет 23 и 24 июня в Санкт-Петербурге!
Программа, подробности и билеты по ссылке: https://highload.ru/spb/2025
________
HighLoad++ Moscow 2018
Тезисы и презентация:
http://www.highload.ru/mo…
Программа, подробности и билеты по ссылке: https://highload.ru/spb/2025
________
HighLoad++ Moscow 2018
Тезисы и презентация:
http://www.highload.ru/mo…
Forwarded from DataEng
Не так давно в Лондоне прошел Kafka Summit London 2019. Все видео с этого саммита уже доступны онлайн: https://www.confluent.io/resources/kafka-summit-london-2019/
Confluent
Kafka Summit London 2019 - Confluent
Confluent is building the foundational platform for data in motion so any organization can innovate and win in a digital-first world.
Forwarded from DataEng
Не так давно компания Lyft выпустила свой инструмент для Data Discovery - Amundsen. Задача этой тулзы - собрать в одном месте всю информацию о данных внутри компании. На Strata Data Confence разработчики выступили с рассказом о ней - Disrupting Data Discovery at Lyft (Amundsen).
Помимо доклада есть пост в техническом блоге Lyft - Amundsen — Lyft’s data discovery & metadata engine
Помимо доклада есть пост в техническом блоге Lyft - Amundsen — Lyft’s data discovery & metadata engine
YouTube
Disrupting Data Discovery at Lyft (Amundsen)
Lyft has reduced the time it takes to discover data by 10x by building its own data portal, Amundsen. Amundsen is built on three key pillars: an augmented da...
Forwarded from DataEng
Интересный доклад про построение дата-инжиниринг культуры: Creating a Data Engineering Culture
YouTube
Creating a Data Engineering Culture | Big Data Institute
Get the slides: https://www.datacouncil.ai/talks/creating-a-data-engineering-cultureDownload slides of this talk: https://www.dataengconf.com/speaker/creatin...
Forwarded from DataEng
Стали появляться видео с прошедшей конференции Data Council (бывшая DataEng Conf)
- Running Apache Airflow Reliably with Kubernetes
- Amundsen: A Data Discovery Platform From Lyft
- Notebooks as Functions with Papermill
- Operating Multi-Tenant Kafka Services for Developers on Heroku
- How Data is Transforming Politics
- Running Apache Airflow Reliably with Kubernetes
- Amundsen: A Data Discovery Platform From Lyft
- Notebooks as Functions with Papermill
- Operating Multi-Tenant Kafka Services for Developers on Heroku
- How Data is Transforming Politics
YouTube
Running Apache Airflow Reliably with Kubernetes | Astronomer
Get the slides: https://www.datacouncil.ai/talks/running-airflow-reliably-with-kubernetesABOUT THE TALKAstronomer is a data engineering platform that collect...
Forwarded from DataEng
трезвая статья про кафку: https://vicki.substack.com/p/you-dont-need-kafka
Normcore Tech
You don't need Kafka
really.
Forwarded from запуск завтра
«Клуб скучных технологий». Классная презентация о том, что важна конечная польза технологий, а не не «красота кода». «Скучные» технологии часто полезнее, чем модные и хайповые. Внимание ограничено и тратить его на технологии вместо идеи продукта — ошибка.
Форма подачи 🔥 и на десктопе и в мобиле.
http://boringtechnology.club
☙
Прагматичные программисты — соль земли. С ними кайф работать. Они не разглагольствуют о рефакторинге, масштабируемости, паттернах программирования, процессах и микросервисах. Эти слова вместо вопросов про продукт — тревожный звоночек.
Мне посчастливилось работать с прагматичным программистом Лешей Гусевым в самом начале моей карьеры. Леша мало говорил о технологиях, но задавал трудные вопросы про продукт. Леша занимался рефакторингом, но делал так, что мобильные разработчики получали нужное апи максимально быстро. Леша не выступал на конференциях про масштабируемость, но при этом сервис не падал под нагрузкой.
Ищите таких программистов, говорите с ними на равных и будет вам счастье.
С днём рождения, Лёша!
Форма подачи 🔥 и на десктопе и в мобиле.
http://boringtechnology.club
☙
Прагматичные программисты — соль земли. С ними кайф работать. Они не разглагольствуют о рефакторинге, масштабируемости, паттернах программирования, процессах и микросервисах. Эти слова вместо вопросов про продукт — тревожный звоночек.
Мне посчастливилось работать с прагматичным программистом Лешей Гусевым в самом начале моей карьеры. Леша мало говорил о технологиях, но задавал трудные вопросы про продукт. Леша занимался рефакторингом, но делал так, что мобильные разработчики получали нужное апи максимально быстро. Леша не выступал на конференциях про масштабируемость, но при этом сервис не падал под нагрузкой.
Ищите таких программистов, говорите с ними на равных и будет вам счастье.
С днём рождения, Лёша!
Forwarded from Записки админа
🛠 А вот здесь доступна большая подборка консольных сервисов, которые могут упростить жизнь - быстро узнать IP, быстро отправить файл, сгенерировать qr код, сократить ссылку и всё вот это вот: https://github.com/chubin/awesome-console-services
#фидбечат #будничное #cli
#фидбечат #будничное #cli