勉強部屋 > 動画像符号化
動画像符号化とは?
テレビやDVD,動画サイトなど様々な場面で動画を閲覧する機会がある
動画はパラパラマンガのように一枚一枚の画像を高速に表示することで動いているように見える
この画像は画素と呼ばれる小さな点の配列で表されており,解像度はこの画素数のことである
例えば,フルハイビジョンの場合の解像度は1920×1080であり,1枚の画像が2,138,400もの画素で構成されていることになる
画素は明るさと色の情報で構成される
解像度(総画素数)[画素/frame]×1画素の情報量[bit/画素]×1秒に表示される枚数(フレーム数)[fps]=1秒間の情報量[bps]
フレームとは1枚の画像のこと
情報量はbit(ビット)という単位で表され,1bitとは0か1かの情報を送れる情報量のこと(ちなみに,2bitだと00,01,10,11の4つの情報を送れる)
ハイビジョンの場合には約750Mbpsにもなり,光ファイバでもだいたい100Mbpsなのでハイビジョンを見ることはできず,DVDの容量は4.7GBなので1分程度しか収録できない
ちなみに,1Byte(バイト)は8bit(ビット)である
そこで,工夫をして情報量を減らさないといけないのである
こういった経緯で動画像符号化という技術が必要とされてきたのである
歴史
動画像符号化の国際標準化を担う機関としてMPEG(Moving Picture Experts Group)とITU-T(International Telecommunication Union-Telecommunication sector)がある
MPEG-2/H.262はMPEGとITU-Tが共同開発し,DVDやHDTVディジタル放送に採用された
MPEG-4はMPEGが開発し,第3世代携帯電話やディジタルカメラ,携帯用ビデオプレーヤーなどに採用された
MPEG-4 AVC/H.264もMPEGとITU-Tが共同開発し,Blu-rayやYouTube,ニコニコ動画などに採用され,MPEG-2の2倍以上の圧縮効率を達成
HEVCは次世代の映像符号化技術でMPEGとITU-Tが2013年をめどに開発を進めていて,AVC/H.264の約2倍の圧縮効率を目標としている
予測符号化
動画像には,空間・時間方向とも近傍画素間に高い相関がある
よって,画素間での予測を行うことで符号化すべき情報量を減らすことができる
フレーム内予測(Intraframe Prediction)
同一フレーム上の近傍画素を用いて予測を行うこと
フレーム間予測(Interframe Prediction)
符号化済みのフレーム上の画素を用いて時間方向の予測を行うこと
動き補償予測
動き補償予測は被予測画素がすでに符号化されたフレームの中でどの位置に移動しているかをあらかじめ検出し,その動き領分補整した位置の画素を予測値として採用する方法
半画素精度予測
動きベクトルで表される変位の単位を画素の精度よりさらに細かい半画素精度とする
半画素だけ変位した位置の画素はもともと存在しないので,近傍の画素からの補間で形成される
処理としてはローパスフィルタに相当し,予測画像中の特異点の削減・平滑化に寄与する
両方向予測
動き補償予測は,時間的に過去のフレームから現在のフレームを予測する順方向予測,時間的に未来のフレームを先に符号化しておき,そこから予測する逆方向予測,過去と未来の両方を使った両方予測などによって予測効率を高めている
Iピクチャ(Intra-coded Picture)
ピクチャ内で閉じて符号化され,他のピクチャを参照しないピクチャ
Pピクチャ(Predictive-coded Picture)
順方向予測のみを用いて符号化を行うピクチャ
Bピクチャ(Bi-directional predictive-coded Picture)
順方向予測,逆方向予測,両方向予測を用いて符号化を行うピクチャ

参考文献・参考サイト
小野定康 村上篤道 浅井光太郎,「ユビキタス技術 動画像の高能率符号化―MPEG-4とH.264―」,オーム社,2005年