[Language-Agnostic] Начало работы с программным аудио


Answers

Похоже, вы хотите узнать больше о en.wikipedia.org/wiki/Pulse-code_modulation

В основном каждое 32-битное значение представляет уровень напряжения в указанное время. Так как частота выборки равна 44100 Гц, вы получаете 441000 32 бит в секунду на канал (* 2, поскольку у вас есть стерео)

С стерео звуками левый и правый каналы часто чередуются, так что первый образец представляет левый канал, второй - правый и т. Д.

Question

Я ищу помощь, чтобы начать работать программно со звуком.

В частности, платформа, с которой я работаю, предоставляет API для извлечения аудиоданных из ресурса (например, MP3) или для воспроизведения произвольных данных в виде аудио. В обоих случаях фактическими данными являются массивы байтов 32-битных поплавков, представляющие стерео с частотой 44,1 КГц. Я ищу, чтобы понять, что представляют собой эти float, и какие вещи могут быть сделаны с ними для динамического анализа или изменения звука, который они представляют.

Какие концепции мне нужно, чтобы научиться работать со звуком таким образом?




Недавно я опубликовал аналогичный вопрос: хорошие аудио-руководства по dsp .

Золотая ссылка - это, конечно же, The Audio EQ Cookbook , если вы хотите писать и сортировать EQ , но, как правило, архив musicdsp.org - лучший ресурс, который я нашел для кодирования аудио DSP.

Вот видео с синтезатором («Soundoid»), с которым я выступил во Flash: http://www.youtube.com/watch?v=O-1hHiA7y4o

И вы можете играть здесь: http://www.zachernuk.com/2011/03/28/soundoid-audio-synthesizer-v0-5/