Написал код для создания спектрограммы звука, используя обычное "Дискретное преобразование Фурье" (снизу).
Анализируя каждую частоту сигнала отдельно, показывает преимущество перед FFT (Быстрое преобразование Фурье). Поскольку в FFT размер окна напрямую влияет на точность оценки сигнала, из-за наложения соседних спектров, искажающее частотное представление — это приводит к размытию пика в спектре.
"Дискретное преобразование Фурье" же: анализирует каждую заданную частоту на всем отрезке заданного по времени, по формульной точности от минус бесконечности до плюс бесконечности. От чего имеет идеальное разрешение и не страдает от ограниченного разрешения по частоте, и может идеально разделить даже бесконечно близкие частоты.
Проблема лишь в том, что на вычисление FFT сверху меньше секуны, в то время как FT внизу вычисляется минутами.
И всё же Важно видеть, что внизу находятся непосредственно точное отображении звукового сигнала, а сверху лишь его приблизительный вид путём FFT.
Анализируя каждую частоту сигнала отдельно, показывает преимущество перед FFT (Быстрое преобразование Фурье). Поскольку в FFT размер окна напрямую влияет на точность оценки сигнала, из-за наложения соседних спектров, искажающее частотное представление — это приводит к размытию пика в спектре.
"Дискретное преобразование Фурье" же: анализирует каждую заданную частоту на всем отрезке заданного по времени, по формульной точности от минус бесконечности до плюс бесконечности. От чего имеет идеальное разрешение и не страдает от ограниченного разрешения по частоте, и может идеально разделить даже бесконечно близкие частоты.
Проблема лишь в том, что на вычисление FFT сверху меньше секуны, в то время как FT внизу вычисляется минутами.
И всё же Важно видеть, что внизу находятся непосредственно точное отображении звукового сигнала, а сверху лишь его приблизительный вид путём FFT.
DFT_MUSIC.jpeg
24.3 MB
Так выглядит музыка.
Сверх-большая спектрограмма.
40 000 000 вызовов обработки Дискретного преобразования Фурье.
Высоты тона вычислялось с шагом 4 герц, продолжительность с шагом 25 герц. То есть каждый следующий вправо пиксель это мощность сигнала на частоте 25 герц от предыдущего пикселя. "Ширина окна" 500 герц.
Всего здесь 4 секунды звука.
Сверх-большая спектрограмма.
40 000 000 вызовов обработки Дискретного преобразования Фурье.
Высоты тона вычислялось с шагом 4 герц, продолжительность с шагом 25 герц. То есть каждый следующий вправо пиксель это мощность сигнала на частоте 25 герц от предыдущего пикселя. "Ширина окна" 500 герц.
Всего здесь 4 секунды звука.
window_size.png
1.1 MB
Влияние размера окна на вид спектрограммы.
Дискретное преобразование Фурье
Быстрое преобразование Фурье
Дискретное преобразование Фурье
Быстрое преобразование Фурье
DFT_59136x2756.jpeg
48.9 MB
размер окна 400 герц
шаг пикселя по высоте тона 8 герц
шаг пикселя по продолжительности 10 герц
шаг пикселя по высоте тона 8 герц
шаг пикселя по продолжительности 10 герц
Контент -_-
DFT_MUSIC.jpeg
Поскольку принцип неопределенности Гейзенберга накладывает фундаментальное ограничение (физика е́баная) на одновременное измерение времени и частоты. — Чем точнее вы хотите определить момент времени, тем менее точно вы сможете определить частоту, и наоборот. Невозможно одновременно получить идеально точную информацию о частоте и времени сигнала. Большой размера окна (увеличение разрешения по времени) уменьшает разрешение по частоте, и наоборот.
Три различных способа создать спектрограмму максимально точно.
(Размер окна 400 герц)
1. Дискретное преобразование Фурье
2. Преобразование Вигнера — Вилла
3. Чирплет-преобразование
Три различных способа создать спектрограмму максимально точно.
(Размер окна 400 герц)
1. Дискретное преобразование Фурье
2. Преобразование Вигнера — Вилла
3. Чирплет-преобразование