2015年12月7日 星期一

Audio Wave Format Specification

WAV File - Waveform Audio File Format (WAVE, or more commonly known as WAV due to its filename extension).
是微软與IBM公司所開發在個人電腦儲存音訊串流的編碼格式,它受到Windows平台的應用軟體之廣泛支援,也是使用者經常使用的指定規格之一。WAV音頻格式沒有經過壓縮(原則上只有在類比轉數位這個過程會失真),所以音質不會出現失真的情況,但相對地,它的檔案體積在各種音頻格式中是比較大的。一般音樂CD片也是由WAV檔編輯而成。



底下的網頁講的也蠻不錯的
http://soundfile.sapp.org/doc/WaveFormat/

Little Endian注意事項:
裏面的Size存放格式都是Little Endian, 因此讀入後要轉換一下, 在fdk-aac的範例程式轉換函式入下:
static uint32_t read_int32(struct wav_reader* wr) {
        uint32_t value = 0;
        value |= fgetc(wr->wav) <<  0;
        value |= fgetc(wr->wav) <<  8;
        value |= fgetc(wr->wav) << 16;
        value |= fgetc(wr->wav) << 24;
        return value;
}
你也可以在include byteswap.h後使用bswap_32()函式
#include <stdio.h>
#include <stdlib.h>
#include <byteswap.h>

int main(int argc, char** argv){
        unsigned int a = 0x46000600;
        printf("%08x\n", bswap_32(a));
}


底下的範例檔案是使用ffmpeg將pcm資料轉成wav檔,整個wav檔的大小為778318bytes

52, 49, 46, 46代表"RIFF".
000be046代表扣掉目前的8個bytes後面的資料長度, 所以是778310+8=778318bytes.
57, 41 56, 45代表"WAVE".
66, 6d, 74, 20代表"fmt ".
00000010代表後面有接著16bytes的fmt資料(01 00 01 00 11 2b 00 00 22 56 00 00 02 00 10 00)
    0001 => Audio Format = 1(PCM)
    0001 => NumChannels = 1 channel
    00002b11 => 11025 Sample Rate
    00005622 => 22050 ByteRate
    0002 => BlockAlign = 2
    0010 => BitsPerSample = 16
4c, 49, 53, 54代表"LIST".
0000001a代表後面有接著26bytes的list資料(49 4e 46 4f 49 53 46 54 0e 00 00 00 4c 61 76 66 35 37 2e 31 39 2e 31 30 30 00)
64, 61, 74, 61代表"data".
000be000代表後面接著778240的資料. 所以778240+78=778318bytes

參考:
https://www.aelius.com/njh/wavemetatools/

沒有留言:

一個小故事讓我們明白資金流通的意義

“又是炎熱小鎮慵懶的一天。太陽高掛,街道無人,每個人都債台高築,靠信用度日。這時,從外地來了一位有錢的旅客,他進了一家旅館,拿出一張1000 元鈔票放在櫃檯,說想先看看房間,挑一間合適的過夜,就在此人上樓的時候---- 店主抓了這張1000 元鈔,跑到隔壁屠戶那裡支付了他欠的肉錢...