Dev0ps
40 subscribers
211 photos
3 videos
50 files
3.33K links
Download Telegram
Выложены доклады с OpenInfra Summit: 2022 Berlin
https://www.youtube.com/playlist?list=PLKqaoAnDyfgqUDjoZhZnDKF5aJrLMnm9E

Программа тут
https://openinfra.dev/summit-schedule
Forwarded from linkmeup
Желающим понять QUIC рекомендую проследовать по ссылке. Очень доходчиво и в удобной форме объяснён каждый его байт. Не классическая простыня текста, а красивенькая раскладушка по всем полям и датаграммам с возможностью провалиться в ад документации при достаточном усердии.
https://quic.ulfheim.net/
Forwarded from Типа про IT
🛠️ Bloomberg разродился новым, шикарным профилировщиком для Python-приложений. Цитирую:

Memray is a memory profiler for Python. It can track memory allocations in Python code, in native extension modules, and in the Python interpreter itself. It can generate several different types of reports to help you analyze the captured memory usage data. While commonly used as a CLI tool, it can also be used as a library to perform more fine-grained profiling tasks.

🕵️‍♀️ Traces every function call so it can accurately represent the call stack, unlike sampling profilers.
ℭ Also handles native calls in C/C++ libraries so the entire call stack is present in the results.
🏎 Blazing fast! Profiling causes minimal slowdown in the application. Tracking native code is somewhat slower, but this can be enabled or disabled on demand.
📈 It can generate various reports about the collected memory usage data, like flame graphs.
🧵 Works with Python threads.
👽🧵 Works with native-threads (e.g. C++ threads in native extensions)

Выбирайте анализатор: flame, summary, table, tree, stats или live? Будет что выводить на внешний монитор вместо скучного htop!

Но есть нюанс — Linux only, поэтому всем нам, плотно сидящим на OS X ничего не светит. Это печально.
Forwarded from Vik Gamov
Forwarded from Alexey Diushen
MultiTail - для просмотра тонны логов или статы с нескольких ресурсов в real-time https://www.vanheusden.com/multitail/
Forwarded from Mops DevOps
glaball для управления множеством GitLab-инстансов

В наиболее популярном случае иметь множество инсталляций GitLab — это антипаттерн. Однако обстоятельства бывают разными: специализация нашего бизнеса привела к тому, что мы администрируем десятки self-hosted GitLab-инстансов обслуживаемых клиентов. Периодически у нас возникает потребность проделать какие-то действия на всех GitLab’ах сразу, чтобы не тратить время на многократное повторение рутинных операций. Все началось с необходимости мониторинга за критическими обновлениями для GitLab. Но аппетиты росли: со временем нам уже хотелось искать по содержимому файлов во всех инсталляциях или даже создавать пользователей.

Расскажем о том, как мы решили эти задачи в рамках внутренней разработки, которую теперь публикуем как Open Source-проект под названием glaball.

👉 https://bit.ly/3HT2BGu

#gitlab #flant
Forwarded from Sysadmin Tools 🇺🇦
Forwarded from Big Data News
Non-immutable formats are the new trend of data storage. Hudi, Iceberg, Delta Lake… which suits your needs better? Check out this article by @lakeFS and choose wisely!

#datalake #architecture #storage

s.asm0dey.ru/Gpp4h
Forwarded from Pasha Finkelshteyn
https://xn--r1a.website/bigdatatools
Мы тут канал с новостями околобигдаты забацали
ugit - утилита для отмены выполненных git команд.

Github: https://github.com/Bhupesh-V/ugit
Обзор: https://bhupesh.me/undo-your-last-git-mistake-with-ugit/

#git #tui #будничное
Forwarded from Типа про IT
📦 Apache Parquet — это высокоэффективный бинарный column-oriented формат, который помимо самих данных содержит заодно и метаданные к ним, c типами и структурой. Считайте, что это как CSV, только сильно быстрее, занимает сильно меньше места у вас в облаке и, следовательно, дешевле в эксплуатации (иногда на порядки).

Про “паркет” хорошо знают все, кто работает с big data или ML, потому что там, на дне data-озёр, жирным слоем накапливаются мегатонны parquet-файлов, в которых большие компании хранят большие массивы данных.

Но мне кажется, что Parquet может быть полезен и в проектах поменьше, без сотен терабайт данных в S3. Где-то можно сэкономить на табличном процессинге используя Pandas (у которого, к слову, первоклассная поддержка формата), где-то можно разгрузить основную базу, ну или просто поближе познакомиться с технологией, которая лежит в основе всей современной data-движухи.

Если очень интересно и есть лишние 40 минут, посмотрите клёвый доклад от WeWork по теме.