まず音声データの考え方と見方です。覚える必要はありませんが、基本の構造と意味を理解しておけば、今後の音声データの加工作業で役に立つと思います。
カタカナ用語の多い世界ですから、その意味の基本でも知っていれば理解が早くなります。
今回は、音声のデータ形式を見ていきます。PCMとそのサンプリング周波数、量子化ビット数というものを解説します。
基本的な理解だけでいいので、難しそうな用語が出てきても、「あ!あのブログで読んだことあるな!」程度で大丈夫です。
音声データの種類
音声をコンピュータに取り込み、パソコンで扱えるデータとして録音する方法は、マイクを直接コンピュータに接続して行うことが出来ます。
最近のノートパソコンでは、始めからマイクが内蔵されていることも多くなりました。
その他に、コンピュータのライン入力に他の音声再生装置、カセットテープレコーダやCDプレーヤーなどを接続し、再生した音声や音楽をコンピュータへ取り込む方法があります。
また、パソコン自体で発生させた音声データは、そのまま音声データとして保存することが出来ます。
コンピュータの内蔵音源を使って演奏させたMIDI形式のファイルなどがあります。
ファイル形式は、圧縮や方式の違いにより、WAVE、MP3、WMA、MIDIなどがあります。
音をデジタル化する基本データ形式・PCM
音をデジタル化する基本の基本は、圧縮しない音声フォーマットであるPCMとなります。
Windowsでは.wavとして、MacOSでは.aiffとして保存されます。
PCMとは、音声、音楽など音のアナログ信号をデジタルデータに変換する方式です。
アナログ信号を一定の時間に区切って、その強弱などをデータ化します。
記録するデータは、ひとつはサンプリング周波数で、1秒の間に何回数値化を行うのかという数値と、量子化ビット数というデータを何ビットの数値で表現するかで記録しています。
- サンプリング周波数・・・1秒間の数値化数
- 量子化ビット数・・・何ビットの数値で表現するかの値
例えば、音楽CD(CD-DA)はPCM方式で出来ています。
1秒間に44100回、数値化して(サンプリング周波数44.1kHz)、
0~65535の65536段階の量子化ビット数(量子化16ビット)という音声データで作られています。
音声データの種類の基本的のまとめ
音声データのファイル形式には、圧縮や方式の違いにより、WAVE、MP3、WMA、MIDIなどたくさんあり、その基本的なデータ形式としてPCM音源から様々に進化したファイルに変換されていきます。
高度な技術論的にはすこし違うところもありますが、一般の利用者として、趣味やビジネスで活用することとしての理解として説明しました。
PCMとは、音声、音楽など音のアナログ信号をデジタルデータに変換する方式という点。
サンプリング周波数が、1秒間の数値化数。
量子化ビット数が、何ビットの数値で表現するかの値。
以上をなんとなく知っておく程度でいいと思います。
次回は、音声データのファイル形式をもっと細かく見ていきたいと思います。
コメント