C++ geek

🚀 Микро-оптимизация в C++20: Early Return + Атрибуты вероятности

В прошлом посте мы разобрали, как Early Return (ранний возврат) спасает нас от вложенных if и делает код чище. Но в C++20 мы можем сделать этот код еще и потенциально быстрее!

Встречайте атрибуты [[likely]] и [[unlikely]].

🧠 В чем суть?
Современные процессоры пытаются предсказать, какую ветку кода программа выполнит следующей (Branch Prediction). Если процессор угадал - всё летает. Если ошибся - теряем такты на очистку конвейера.

С помощью атрибутов мы даем компилятору (и процессору) «инсайд»: какая ветка будет выполняться чаще.

🛠 Как это выглядит в коде?

Обычно ошибки и проверки аргументов (Guard Clauses) срабатывают редко. Это идеальное место для [[unlikely]].


void ProcessImage(Image* img) {
    // 1. Проверка на null.
    // Это случается редко, помечаем как "маловероятно".
    if (img == nullptr) [[unlikely]] {
        return; // Компилятор уведет этот код "подальше" из горячего пути
    }

    // 2. Еще одна проверка
    if (img->IsEmpty()) [[unlikely]] {
        return;
    }

    // --- Happy Path ---
    // Процессор сразу прыгнет сюда, ожидая, что проверки выше ложны.
    img->ApplyFilter();
    img->Save();
}

⚙️ Что происходит под капотом?
Компилятор переставит инструкции ассемблера так, чтобы «счастливый путь» шел линейно, без прыжков (jmp), что улучшает работу кэша инструкций. Код обработки ошибок (ветка [[unlikely]]) будет сдвинут в конец функции или в «холодную» зону.

⚠️ Важный нюанс:
Используйте это только тогда, когда вы уверены в вероятностях (например, ошибки случаются в 1 случае из 1000). Если поставить атрибуты наугад, можно сделать только хуже (pessimization).

🔥 Итог:
Чистый код (Early Return) + Подсказки компилятору ([[unlikely]]) = Читаемость и Производительность.

#cpp #cpp20 #coding #optimization #tips #programming

➡️ @cpp_geek

🔥12

1.91K views21:09

C++ geek

✂️ C++17: Перестаньте копировать строки! (std::string_view)

Мы привыкли передавать строки в функции по константной ссылке: const std::string&. Нам кажется, что это эффективно, ведь мы не копируем объект, верно?

Не всегда. 🛑

Если вы передаете в такую функцию обычный текст в кавычках (строковый литерал) или часть другой строки, C++ втайне от вас создаст временный объект std::string, выделит память в куче (heap allocation), скопирует туда данные и только потом передаст ссылку.

Решение? std::string_view.

👀 Что это такое?
std::string_view - это супер-легкий объект, который ничего не хранит сам. Он просто «смотрит» на существующую строку. Внутри него только указатель на начало текста и длина.

Никаких аллокаций. Никаких копий. Ноль оверхеда.

🆚 Сравним:


// 🐢 ПЛОХО (до C++17)
void Log(const std::string& msg) { /* ... */ }

// При вызове создается временный std::string!
Log("Critical Error");


// 🚀 ХОРОШО (C++17)
void Log(std::string_view msg) { /* ... */ }

// Никаких аллокаций. Просто передаем указатель и длину.
Log("Critical Error");

🔥 Суперсила: Substrings без боли
Самое вкусное начинается, когда нужно взять подстроку.

⚫️

std::string::substr() - создает новую строку (копирование + аллокация).

⚫️

std::string_view::substr() - просто сдвигает указатель и меняет размер (математическая операция за наносекунды).

⚠️ Осторожно! (Подводный камень)
Так как string_view не владеет данными, а только смотрит на них, вы должны быть уверены, что исходная строка живет дольше, чем string_view.

⚫️

✅ Использовать как аргумент функции.

⚫️

❌ Возвращать из функции, если исходная строка была локальной переменной.

💡 Итог:
Если вам нужно только «почитать» строку (в аргументах функции), почти всегда используйте std::string_view вместо const std::string&.

#cpp #cpp17 #optimization #stringview #coding #tips

➡️ @cpp_geek

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤4

2.03K views14:30

C++ geek

🏗 Тетрис в памяти: Почему порядок полей в классе важен?

Вы создали простую структуру: bool, int и еще один bool.
Математика проста: 1 байт + 4 байта + 1 байт = 6 байт.

Вы проверяете через sizeof и видите... 12 байт. 🤯
Куда делись еще 6 байт? Вы только что потеряли 50% памяти на "воздух".

Это называется Padding (Выравнивание).

⚙️ Как это работает?
Процессор не любит читать данные по произвольным адресам. Ему удобно читать кусками по 4 или 8 байт (слова). Чтобы int (4 байта) не "разломился" посередине двух слов, компилятор вставляет пустые байты-заглушки.

❌ Плохой пример (Bad Layout):


struct Bad {
    bool a; // 1 байт
    // ... 3 байта PADDING (воздух) ...
    int b;  // 4 байта (должен начинаться с кратного 4 адреса)
    bool c; // 1 байт
    // ... 3 байта PADDING (чтобы выровнять общий размер) ...
};
// Итог: 12 байт

✅ Хороший пример (Good Layout):

Просто меняем порядок полей. Правило: "От больших к маленьким".


struct Good {
    int b;  // 4 байта
    bool a; // 1 байт
    bool c; // 1 байт
    // ... 2 байта PADDING (добиваем до кратности 4) ...
};
// Итог: 8 байт

📉 Почему это важно?
Кажется, что 4 байта ерунда. Но если у вас std::vector<Bad> на 1,000,000 элементов:

⚫️

Bad: ~12 MB памяти.

⚫️

Good: ~8 MB памяти.

Вы экономите 4 мегабайта просто переставив строчки местами! Плюс, более плотные данные лучше ложатся в кэш процессора (CPU Cache), что ускоряет обработку.

💡 Совет:
Объявляйте поля в порядке убывания их размера:

1. Указатели и double (8 байт)
2. int, float (4 байта)
3. short (2 байта)
4. bool, char (1 байт)

#cpp #optimization #memory #alignment #coding #tips

➡️ @cpp_geek

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14❤4💯2

3.03K views08:15

C++ geek

🪄 Магия std::string: Почему короткие строки работают быстрее? (SSO)

Многие думают, что std::string - это всегда:

1. Выделение памяти в куче (new / malloc).

2. Копирование данных туда.

3. Освобождение памяти (delete) в деструкторе.

Это медленно. Но если вы создадите строку "Hello", никаких аллокаций не произойдет. Почему?

Благодаря Small String Optimization (SSO).

⚙️ Как это работает?

Стандартная строка (на 64-битной системе) обычно занимает 24 или 32 байта (размер самой структуры sizeof(std::string)). В ней хранятся указатель на данные, размер и вместимость (capacity).

Разработчики STL подумали:
"Зачем нам тратить эти байты на указатели, если строка очень короткая? Давайте хранить текст прямо внутри объекта!"

Внутри std::string используется union:

⚫️

Вариант А (Длинная строка): Хранит указатель на кучу (Heap), размер и вместимость.

⚫️

Вариант Б (Короткая строка): Использует те же байты памяти как буфер для хранения символов.

📏 Где граница?

Это зависит от компилятора:

⚫️

MSVC (Windows): ~15 символов.

⚫️

GCC (Linux): ~15 символов.

⚫️

Clang (libc++): ~22 символа (благодаря хитрому сжатию битов).

Пример:


void Benchmark() {
    // 🚀 БЫСТРО (SSO):
    // Память не выделяется. Строка лежит на стеке, как char[16].
    std::string shortStr = "Hello World"; 

    // 🐢 МЕДЛЕННО (Heap Allocation):
    // Текст не влезает в буфер SSO. 
    // Вызывается malloc/new, данные летят в кучу.
    std::string longStr = "Hello World is a remarkably long phrase";
}

📉 Почему это важно для производительности?

1. Нет аллокаций: new и delete - это системные вызовы, они дорогие. SSO их исключает.

2. Cache Locality: Данные лежат на стеке, рядом с другими локальными переменными. Процессор обожает линейный доступ к памяти (L1 Cache), а прыжки в кучу (Heap) - ненавидит.

💡 Совет: Если вы оптимизируете структуру данных и у вас много коротких ID или имен (до 15 символов), обычный std::string будет работать великолепно без всяких хитростей. Не нужно менять его на char[] "для скорости" без замеров.

#cpp #optimization #sso #memory #stdstring #coding #tips

➡️ @cpp_geek

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥6❤3

1.94K views09:06

C++ geek

🗺 std::map или std::unordered_map: Битва за кэш

Когда нам нужно хранить пары «Ключ - Значение», рука сама тянется написать std::map. Это стандарт, это удобно, это сортировка из коробки.

Но с точки зрения производительности std::map это часто худший выбор. Почему?

🌲 1. std::map - Это Дерево (Red-Black Tree)
Каждый элемент в map - это отдельный узел (Node), выделенный в куче (new). Узлы разбросаны по памяти хаотично.

• Чтобы найти элемент, процессор прыгает по указателям: Root -> Left -> Right -> ...
• Каждый прыжок - это потенциальный Cache Miss (промах кэша). Процессор ждет сотни тактов, пока данные подтянутся из RAM.
• Сложность поиска: O(log N).

⚡ 2. std::unordered_map - Это Хеш-таблица
Здесь нет деревьев. Ключ превращается в число (хеш), и мы сразу прыгаем в нужную ячейку массива (Bucket).

• Массивы любят кэш процессора (Cache Locality).
• Сложность поиска: O(1) (в среднем). Это мгновенно.

🐢 Насколько велика разница?
На маленьких объемах (до 100 элементов) разницы почти нет.
Но на 1,000,000 элементов std::unordered_map может быть в 3-5 раз быстрее просто за счет отсутствия прыжков по памяти.

🤔 Когда использовать std::map?
Только в одном случае: Вам жизненно важен порядок ключей.
Например, если вы хотите вывести пользователей по алфавиту или найти диапазон дат (lower_bound / upper_bound).

🚀 Бонус: C++23 std::flat_map
В новом стандарте завезли std::flat_map. Это гибрид: интерфейс как у map (сортированный), но внутри - сплошной вектор.
Это самый быстрый вариант для поиска, но медленный для вставки. Если у вас C++23 - присмотритесь!

💡 Итог: если вам не нужна сортировка, всегда пишите std::unordered_map. Не заставляйте процессор бегать по дереву указателей без причины.

#cpp #stl #optimization #performance #map #hashing #coding #tips

➡️ @cpp_geek

👍11🔥5❤4

1.61K views11:25

C++ geek

🌉 Забудьте про передачу указателей и размеров! (std::span)

Помните, мы обсуждали std::string_view - легковесное «окно» для строк? В C++20 у него появился старший брат для массивов и векторов - std::span.

До C++20 у нас была классическая проблема. Допустим, вы пишете функцию, которая должна обработать список чисел.

🐢 Как мы писали раньше:

Вариант 1: Принимать const std::vector<int>&.
Минус: Функция теперь намертво привязана к std::vector. Если у вас данные лежат в std::array или обычном си-массиве int arr[10], придется копировать их в вектор. Аллокации, тормоза.

Вариант 2: Си-стайл (Указатель + размер).
Минус: Легко ошибиться с размером, потерять контекст, код выглядит грязно.


void ProcessOld(const int* data, size_t size) { /* ... */ }

🚀 Как мы пишем теперь (C++20):


#include <span>

// Принимаем любой непрерывный кусок памяти!
void ProcessNew(std::span<const int> data) {
    for (int val : data) {
        std::cout << val << " ";
    }
}

👀 Что такое std::span?
Как и string_view, это просто указатель на начало данных и их длина (обычно 16 байт). Он не владеет памятью, он только на нее смотрит.

Магия в том, что std::span умеет автоматически создаваться из чего угодно:


std::vector<int> vec = {1, 2, 3};
std::array<int, 3> arr = {4, 5, 6};
int raw[3] = {7, 8, 9};

// Одна функция работает со всеми типами контейнеров! Без копирования!
ProcessNew(vec); 
ProcessNew(arr);
ProcessNew(raw);

✂️ Суперсила: Subspan (Подмассивы)
Вам нужно передать в функцию только часть вектора, например, со 2-го по 5-й элемент? Никаких итераторов и копирования:


// Передаем кусок вектора за O(1)
ProcessNew( std::span{vec}.subspan(1, 4) );

⚠️ Важный нюанс:
std::span не умеет изменять размер данных (никаких

push_back). Но он может изменять сами элементы, если вы передадите std::span<int>

(без const).

💡 Итог: Если ваша функция принимает набор данных только для чтения или изменения элементов на месте, всегда используйте std::span. Это золотой стандарт современного C++.

#cpp #cpp20 #stdspan #optimization #memory #coding #tips

➡️ @cpp_geek

👍10🔥3❤2

1.55K views09:20

C++ geek

⏳ C++: Заставьте компилятор работать за вас (constexpr и consteval)

Вы когда-нибудь хотели, чтобы ваша программа мгновенно выдавала результат сложных вычислений в момент запуска? Это возможно, если переложить тяжелую математику на... ваш компилятор!

В современном C++ мы можем «запекать» результаты функций прямо в итоговый .exe файл. Для этого есть два инструмента.

1. constexpr - «Вычисли до запуска, если сможешь» (C++11)

Ключевое слово constexpr говорит компилятору: "Если все аргументы этой функции известны заранее, вычисли её прямо сейчас. Если нет - оставь до выполнения программы (Run-time)".

Это невероятно удобно для универсальных функций.


// Функция может работать и до запуска, и во время!
constexpr int GetArea(int width, int height) {
    return width * height;
}

int main() {
    // 🚀 Вычислится компилятором! В код вставится просто "200".
    // Zero runtime cost.
    int a = GetArea(10, 20); 

    int w;
    std::cin >> w;
    // 🐢 Вычислится процессором во время работы (w неизвестно заранее).
    int b = GetArea(w, 20); 
}

2. consteval - «Вычисли до запуска, или умри!» (C++20)

У constexpr есть проблема: мы не всегда уверены, вычислилась ли функция компилятором, или она тихо «соскользнула» в Run-time, замедляя программу.

Поэтому в C++20 добавили consteval. Это строгий приказ (Immediate Function). Если компилятор не может выполнить функцию прямо сейчас - он выдаст ошибку компиляции.


// Обязана выполниться во время компиляции
consteval int MagicHash(std::string_view str) {
    int hash = 0;
    for (char c : str) hash += c;
    return hash;
}

int main() {
    // ✅ Отлично. Компилятор сам посчитает хэш слова "admin".
    int h1 = MagicHash("admin"); 

    std::string user_input = "test";
    // ❌ ОШИБКА КОМПИЛЯЦИИ! user_input нельзя знать заранее.
    int h2 = MagicHash(user_input); 
}

📈 Зачем это нужно?

1. Максимальная производительность: Вы переносите время выполнения на этап сборки программы. Для пользователя всё работает за O(1).

2. Замена #define: Раньше константы и простые формулы писали через макросы препроцессора. Теперь constexpr делает это безопасно, с проверкой типов.

3. Безопасность: С consteval вы гарантируете, что тяжелая инициализация (например, генерация таблиц поиска) не ударит по производительности в продакшене.

💡Итог: Пишете математику или чистые функции без побочных эффектов? Ставьте constexpr.
Хотите 100% гарантию, что вычисления не попадут в готовый бинарник? Ставьте consteval.

#cpp #cpp20 #constexpr #optimization #performance #coding #tips

➡️ @cpp_geek

👍5❤3

1.45K views10:20

C++ geek

🎭 Сколько стоит virtual? Вся правда о полиморфизме и магии final

Мы обожаем интерфейсы и ООП. Добавить virtual перед методом - минутное дело, и вот наш код уже гибкий и расширяемый. Но задумывались ли вы, чем мы за это платим на уровне железа?

⚙️ Анатомия виртуального вызова (vtable)

Если в классе есть хотя бы одна виртуальная функция, компилятор втайне добавляет в каждый объект этого класса скрытое поле - vptr (указатель на виртуальную таблицу). Сама таблица (vtable) хранится где-то в памяти и содержит адреса реальных функций.

Как происходит вызов obj->DoWork() под капотом:

1. Процессор идет по адресу объекта obj.
2. Читает скрытый указатель vptr.
3. Делает прыжок в память, где лежит vtable.
4. Находит там нужный адрес функции для конкретного класса-наследника.
5. Делает еще один прыжок, чтобы выполнить код.

🚨 Почему это бьет по производительности?

Дело даже не в лишних прыжках по памяти (хотя промахи кэша процессора - это больно).
Главная проблема: Виртуальность убивает оптимизации.

Когда компилятор видит вызов виртуальной функции через указатель, он "слепнет". Он не знает, код какого именно наследника будет вызван во время работы программы (Run-time). Из-за этого он не может применить Inlining (встраивание тела функции вместо вызова) - а это самая мощная оптимизация в C++.

🛡 Спаситель из C++11: ключевое слово final

Слово final запрещает дальнейшее наследование класса или переопределение метода. Но кроме защиты архитектуры, оно делает невероятное: включает Девиртуализацию (Devirtualization).


class Base {
public:
    virtual void Process() = 0;
};

// Мы жестко фиксируем класс: от него нельзя наследоваться!
class Derived final : public Base {
public:
    void Process() override { 
        /* важная логика */ 
    }
};

void RunOptimized(Derived* obj) {
    // Компилятор видит: тип obj — Derived. 
    // Derived помечен как final. Значит, никто физически 
    // не мог переопределить метод Process!
    
    // 🚀 МАГИЯ: Компилятор выбрасывает vtable, игнорирует vptr 
    // и превращает вызов в обычный, или вообще инлайнит (встраивает) его!
    obj->Process(); 
}

💡 Золотое правило современного C++:
Относитесь к классам как к запечатанным. Пишите final для всех классов (особенно тех, что реализуют интерфейсы), если только вы не проектируете их специально для дальнейшего наследования.

Вы получите защиту от глупых архитектурных ошибок и бесплатный прирост скорости!

#cpp #cpp11 #oop #optimization #performance #coding #tips

➡️ @cpp_geek

👍10

967 views05:54

C++ geek

🚦 Многопоточность без тормозов: std::atomic против std::mutex

Мы все знаем классику: если несколько потоков одновременно пишут в одну переменную, случается Data Race (гонка данных), и программа выдает мусор или падает.

Первое, чему нас учат - ставьте std::mutex. Но мьютексы могут убить производительность вашего приложения.

🐢 Почему std::mutex такой медленный?
Мьютекс - это тяжеловесный механизм операционной системы.
Если Поток А захватил мьютекс, а Поток Б пытается сделать то же самое, ОС видит, что «дверь закрыта». ОС усыпляет Поток Б (происходит Context Switch) и отдает ядро процессора кому-то другому. Когда Поток А отпускает мьютекс, ОС должна снова «разбудить» Поток Б.

Смена контекста и пробуждение — это тысячи потерянных тактов процессора. Использовать мьютекс ради того, чтобы просто сделать counter++ - это как вызывать спецназ, чтобы разнять дерущихся котят.

🚀 Решение: std::atomic (Lock-Free магия)
Вместо того чтобы просить ОС усыплять потоки, мы можем использовать std::atomic. Он работает на уровне самого железа (процессора).

Для атомиков компилятор генерирует специальные ассемблерные инструкции (например, с префиксом LOCK на архитектуре x86). Процессор сам на аппаратном уровне гарантирует, что инкремент произойдет неделимо (атомарно). Никаких обращений к ОС, никаких засыпаний!

🆚 Давайте сравним в коде:


// 🐢 ТЯЖЕЛОВЕСНО (std::mutex)
std::mutex mtx;
int counter = 0;

void AddMutex() {
    std::lock_guard<std::mutex> lock(mtx);
    counter++; // Заморозили поток ОС ради одной операции!
}


// 🚀 БЕЗ БЛОКИРОВОК (std::atomic)
std::atomic<int> counter = 0;

void AddAtomic() {
    counter++; // Выполняется за наносекунды на уровне CPU
}

Разница в скорости на простых операциях типа счетчиков или флагов может достигать 50-100 раз в пользу std::atomic!

⚖️ Когда что использовать?

Нельзя просто взять и везде заменить мьютексы на атомики.
• ✅ Используйте std::atomic, если вам нужно защитить только одну простую переменную (счетчик метрик, флаг остановки bool, указатель на узел в lock-free очереди).

• 🛑 Используйте std::mutex, если вам нужно выполнить сложную логику, защитить кусок памяти (std::vector, std::map) или обновить сразу две и более переменных одновременно.

💡 Итог: Многопоточность - это искусство компромисса. Оставляйте тяжелые замки (mutex) для больших комнат, а для маленьких сейфов (int, bool) используйте умные аппаратные ключи (atomic).

#cpp #multithreading #atomic #mutex #optimization #coding #tips

➡️ @cpp_geek

👍6❤2

1.25K views04:32

C++ geek

🧬 Двойная цена std::shared_ptr: Почему профи всегда пишут make_shared?

Мы все используем умные указатели. Но то, как вы их создаете, кардинально меняет работу с памятью под капотом.

Встречали такой код?


// 🐢 ПЛОХО: Классический подход
std::shared_ptr<User> user(new User());

Кажется, всё логично: выделили память через new, передали в shared_ptr. Но на деле вы заставляете программу сделать две аллокации (выделения памяти) вместо одной.

⚙️ Анатомия shared_ptr

std::shared_ptr состоит из двух частей:

1. Сам объект (ваши данные User).

2. Контрольный блок (Control Block) - служебная структура, где лежат счетчики ссылок (reference count) и счетчики weak_ptr.

Когда вы пишете std::shared_ptr<User>(new User()), происходит следующее:

1. Отрабатывает new User() - программа идет к ОС и просит кусок памяти.

2. Конструктор shared_ptr видит сырой указатель, понимает, что ему нужен Контрольный блок, и еще раз идет к ОС за вторым куском памяти.

Два системных вызова. Фрагментация кучи (heap). Промахи кэша процессора, потому что объект и счетчик лежат в разных концах памяти.

🚀 Решение: std::make_shared


// 🚀 ХОРОШО: Единый блок памяти
auto user = std::make_shared<User>();

Что делает make_shared? Он считает размер вашего объекта User + размер Контрольного блока, и просит у операционной системы один большой кусок памяти за один раз.

Плюсы:
• В 2 раза меньше аллокаций. Код работает быстрее.

• Cache Locality. Объект и счетчик ссылок лежат в памяти впритык друг к другу. Процессор это обожает.

• Безопасность. До C++17 старый подход с new мог привести к утечке памяти, если функция принимала несколько аргументов и один из них бросал исключение. С make_shared это исключено.

🦇 Темная сторона (О чем не пишут в туториалах)

Есть ровно один случай, когда make_shared может навредить. Это связано со слабыми указателями (std::weak_ptr).

Если вы удалили все shared_ptr, вызывается деструктор объекта User. Но если остался хотя бы один weak_ptr, Контрольный блок обязан жить!
А так как make_shared склеил Контрольный блок и объект в один кусок памяти, оперативная память из-под объекта User не вернется системе, пока жив weak_ptr (даже если сам объект уже "мертв" и деструктор отработал).
Если ваш объект весит 500 Мегабайт - вы получите «фантомную» утечку памяти.

💡В 99% случаев используйте std::make_shared. Используйте new std::shared_ptr только если у вас гигантские объекты, на которые подолгу смотрят «зависшие» weak_ptr, или если вам нужен кастомный удалитель (custom deleter).

#cpp #memory #pointers #optimization #sharedptr #coding #tips

➡️ @cpp_geek

👍5❤1

1.14K views07:03

About

Blog

Apps

Platform