動画圧縮の鍵、GOPを理解する

コーデック

2025.01.15

動画圧縮の鍵、GOPを理解する

動画圧縮の鍵、GOPを理解する

動画を作りたい

『グループオブピクチャー』って、動画をいくつかのまとまりに分けることですよね？なぜ、いくつかのまとまりに分ける必要があるのでしょうか？

動画制作専門家

いい質問ですね。グループオブピクチャー（GOP）に分けるのは、主に圧縮効率を高めるためと、動画の再生や編集をスムーズにするためです。

動画を作りたい

圧縮効率と再生・編集の効率ですか？詳しく教えてください。

動画制作専門家

例えば、Iピクチャーは一枚の絵として圧縮されますが、PピクチャーやBピクチャーは前の絵や後の絵との違いだけを記録するので、データ量が少なくて済みます。GOPに分けることで、このI、P、Bピクチャーを効果的に配置し、全体のデータ量を減らせるのです。また、Iピクチャーを再生の始点にすることで、動画の途中の場面からも再生しやすくなります。

Groupofpictureとは。

動画を圧縮したり、再生したり、編集したりするときの、いくつかの絵をまとめた単位のことを「グループ・オブ・ピクチャー」と言います。この絵のまとまりは、動画をＭＰＥＧという方法で圧縮するときに使われます。グループ・オブ・ピクチャーに含まれる一つ一つの絵は、「アイピクチャー」「ピピクチャー」「ビピクチャー」のどれかに分類されて、それぞれ圧縮されます。
アイピクチャーは、一枚の絵としてJPEGと似たように圧縮されます。前の絵や後の絵の情報は使わず、その絵の情報だけで圧縮します。動画を再生したり編集したりするときは、まずこのアイピクチャーが表示され、これを基準にしてピピクチャーやビピクチャーが表示されます。
ピピクチャーは、前の絵との違いを元に圧縮されます。前の絵としてはアイピクチャーもピピクチャーも使えます。ピピクチャーの情報量はアイピクチャーよりも少なくなります。
ビピクチャーは、前後の絵との違いを元に圧縮されます。前の絵としてはアイピクチャーもピピクチャーも使えます。ビピクチャーの情報量はアイピクチャーやピピクチャーよりも少なくなります。

動画圧縮の基本

動画を取り扱う上で、どうしても避けることができないのがファイルサイズの大きさです。美しい高画質動画ほどファイルサイズは大きくなり、パソコンやスマートフォンといった機器の保存容量を圧迫するだけでなく、動画のやり取りにかかる時間も長くなってしまいます。そこで必要になってくるのが動画圧縮技術です。動画圧縮は、ファイルサイズを小さくすることでこれらの問題を解決し、誰でも気軽に動画を楽しめるようにするための大切な技術です。

動画圧縮には様々な方法がありますが、共通して使われている考え方のひとつにGOP（グループ・オブ・ピクチャーズ）という仕組みがあります。これは、動画をいくつかのコマの集まり（グループ）に分けて、それぞれのグループの中で効率的にデータを減らす方法です。グループの中には、Iフレーム、Pフレーム、Bフレームと呼ばれる３種類のフレーム（コマ）があります。

Iフレームは、グループの中で一番最初のフレームで、それ自体で完結した画像情報を持っています。いわば、一枚の絵のようなものです。そのため、他のフレームに比べてデータ量は多くなります。Pフレームは、Iフレームを基準にして、変化した部分の情報だけを持つフレームです。前のフレームとの違いだけを記録するので、データ量はIフレームより少なくなります。Bフレームは、前後のフレームを基準にして、変化した部分の情報だけを持つフレームです。これもデータ量は少なくなります。

これらのフレームを組み合わせることで、全体的なデータ量を減らしつつ、高画質を維持することができます。例えば、風景がほとんど変わらないシーンでは、Iフレームを１枚作って、あとはPフレームやBフレームを使って変化した部分だけを記録すれば、データ量は大幅に削減できます。このように、GOPをうまく使うことで、動画のファイルサイズを小さくし、快適な動画視聴を実現することが可能になります。

動画圧縮技術は日々進化しており、より高画質で小さなファイルサイズの動画を実現するための研究開発が盛んに行われています。動画圧縮は、動画配信や動画共有サービスなど、様々な場面で活用されており、私たちの動画視聴体験を支える重要な役割を担っています。

フレームの種類	説明	データ量
Iフレーム	グループの最初のフレーム。それ自体で完結した画像情報を持つ。	多
Pフレーム	Iフレームを基準に、変化した部分の情報だけを持つ。	少
Bフレーム	前後のフレームを基準に、変化した部分の情報だけを持つ。	少

GOPとは

動画を小さくするために、いくつかの絵をまとめて扱う仕組みがあります。これを『画像集団』と言います。この画像集団は、動画を縮める時の基本的なかたまりで、いくつかの種類の絵を組み合わせて、できるだけ小さくできるように工夫されています。

画像集団の中には、主に３種類の絵があります。まず『基準の絵』と呼ばれる絵は、一枚の絵だけで情報が完結していて、他の絵を参考にしません。まるで写真のようです。次に『前の絵を参考に予測した絵』があります。これは、直前の基準の絵や、前の絵を参考に予測した絵との違いだけを記録しているので、基準の絵よりも容量が小さくなります。最後に『前後２枚の絵を参考に予測した絵』があります。これは、前の絵と後ろの絵の両方を使って予測するので、さらに容量を小さくできます。

この３種類の絵をうまく組み合わせることで、画像集団全体を小さくすることができます。例えば、基準の絵を１枚用意し、その後ろに前の絵を参考に予測した絵をいくつか並べ、さらに前後２枚の絵を参考に予測した絵を間に挟むといった具合です。

画像集団の長さは、含まれる絵の数で決まり、例えば１５枚の絵でできている画像集団の長さは１５と言います。この長さは、動画をどれくらい小さくできるかと、見た目の綺麗さに影響します。長ければ長いほど、小さくできますが、急な動きの多い場面では、絵がぼやけて見えることがあります。逆に短ければ、画質は良くなりますが、ファイルサイズは大きくなります。ですから、動画の内容や目的に合わせて、適切な長さを選ぶことが大切です。例えば、動きが少ない風景の動画であれば、長い画像集団を使っても問題ありませんが、スポーツのような動きの激しい動画では、短い画像集団を使う方が綺麗に仕上がります。

絵の種類	説明	容量	用途
基準の絵	一枚の絵だけで情報が完結。他の絵を参考にしない。	大きい	基準となる絵
前の絵を参考に予測した絵	直前の絵との違いだけを記録。	小さい	動きが少ない場面
前後2枚の絵を参考に予測した絵	前後2枚の絵を使って予測。	さらに小さい	動きが少ない場面

画像集団の長さ	ファイルサイズ	画質	用途
長い	小さい	急な動きの多い場面ではぼやける	動きが少ない風景
短い	大きい	良い	動きの激しいスポーツ

Iピクチャー

{動画を滑らかに、かつ容量を抑えて記録・再生するために、動画は圧縮されます。}その中でも「Iピクチャー」は動画圧縮において大変重要な役割を担っています。

Iピクチャーとは、「画面内符号化ピクチャー」の略称で、他の画面の情報一切参照せずに、単独で圧縮される画面のことを指します。まるで一枚一枚の写真のように、それぞれの画面が独立して保存されているイメージです。

この圧縮方法は、静止画の圧縮技術であるJPEGとよく似ています。JPEGもまた、一枚一枚の写真を個別に圧縮する技術です。Iピクチャーも同様に、各画面を独立して圧縮するため、他の画面との関連性を利用した圧縮は行われません。そのため、他の種類のピクチャーと比べてデータ量は大きくなってしまいます。

しかし、データ量が大きいにも関わらず、Iピクチャーは動画再生において無くてはならない存在です。なぜなら、Iピクチャーは他のピクチャー（PピクチャーやBピクチャー）の基準となる重要な画面だからです。

例えば、動画を再生する時、まず最初に表示されるのはIピクチャーです。そして、このIピクチャーを基準にして、その後の画面が再生されます。また、動画の途中の場面を見たい時、早送りや巻き戻しを行う際にも、まずIピクチャーを探し出して表示します。Iピクチャーが表示されて初めて、目的の場面周辺の映像が再生可能になるのです。

このように、Iピクチャーは動画を好きな場面から再生できるようにするための、いわば道標のような役割を果たしています。動画をスムーズに、そして思い通りに再生するために、Iピクチャーは欠かせない要素と言えるでしょう。

項目	説明
Iピクチャーとは	画面内符号化ピクチャーの略称。他の画面の情報一切参照せずに、単独で圧縮される画面。
圧縮方法	静止画の圧縮技術であるJPEGと同様、各画面を独立して圧縮。
データ量	他の種類のピクチャーと比べて大きい。
重要性	動画再生において無くてはならない存在。他のピクチャー（PピクチャーやBピクチャー）の基準となる重要な画面。
役割	動画を好きな場面から再生できるようにするための道標。動画の早送りや巻き戻しを行う際にも、まずIピクチャーを探し出して表示。

Pピクチャー

動き予測符号化画面、略して動き予測画面とは、時間的な変化に着目した、容量を抑えた動画の画面のことを指します。この動き予測画面は、直前の画面との違い、つまり変化した部分の情報だけを記録することで、全体の容量を小さくしています。直前の画面が、動き予測画面でも、動き予測をしない画面でも、変化した部分だけを記録するため、動き予測をしない画面に比べて、データ量は小さくなります。

動き予測画面を使うことで、動画全体のデータ量を大幅に減らすことができます。例えば、空の映像を考えてみましょう。空全体の色が少しずつ変化していく様子を撮影したとします。もし、それぞれの画面をすべて記録していたら、膨大なデータ量になってしまいます。しかし、動き予測画面を使うと、変化した部分、つまり空の色の変化だけを記録すればよいため、データ量を大幅に削減できます。

一方で、動き予測画面には弱点もあります。直前の画面の情報をもとに作られているため、直前の画面に何らかの問題が発生した場合、その影響が後続の動き予測画面にも広がってしまう可能性があります。例えば、直前の画面でノイズが発生した場合、そのノイズが次の動き予測画面にも現れ、さらにその次の画面にも影響を与えてしまうかもしれません。これは、動き予測画面が前の画面に依存しているという性質によるものです。そのため、動き予測画面を使う際には、エラーの影響範囲も考慮する必要があります。

項目	説明
動き予測画面	時間的な変化に着目し、容量を抑えた動画の画面。直前の画面との違い（変化した部分の情報）だけを記録することで全体の容量を小さくする。
メリット	動画全体のデータ量を大幅に減らすことができる。例：空の映像で、空全体の色が少しずつ変化していく様子を撮影する場合、色の変化のみを記録すればよい。
デメリット	直前の画面の情報をもとに作られているため、直前の画面に何らかの問題が発生した場合、その影響が後続の動き予測画面にも広がってしまう。例：ノイズが発生した場合、そのノイズが次の画面にも影響を与える。
注意点	動き予測画面は前の画面に依存しているため、エラーの影響範囲も考慮する必要がある。

Bピクチャー

{動画を小さくするために、様々な方法が考えられています}。その一つに、前後のコマとの違いだけを記録する方法があります。これを「両方向予測符号化画像」、短い名前でBピクチャーと呼びます。

Bピクチャーは、前のコマの情報だけでなく、後ろのコマの情報も使って作られます。例えるなら、パラパラ漫画の間に新しく絵を挟むようなものです。前の絵と後ろの絵を参考に、間の絵を描くことで、少ない情報で滑らかな動きを表現できます。

Bピクチャーを使う一番のメリットは、動画のファイルサイズを小さくできることです。前のコマと後ろのコマとの違いだけを記録するので、必要なデータ量が少なくて済みます。同じ画質で比較すると、前のコマだけを基準にするPピクチャーよりも、さらにファイルサイズを小さくできます。また、全く新しい絵を描くIピクチャーと比べても、Bピクチャーのデータ量ははるかに小さいです。

しかし、Bピクチャーにはデメリットもあります。一つは、作るのに時間がかかること。前のコマと後ろのコマ、両方の情報が必要なので、どうしても処理に時間がかかります。もう一つは、動画編集がしにくいこと。Bピクチャーは前後のコマに依存しているので、一部分だけを編集しようとすると、その前後のコマにも影響が出てしまうからです。そのため、Bピクチャーは編集にはあまり向いていません。

Bピクチャーは、動画を高画質のまま小さくしたい時に役立ちます。動画配信サービスなどで使われることが多い技術です。デメリットも理解した上で、うまく活用することで、効率の良い動画の保存と配信が可能になります。

項目	内容
名称	両方向予測符号化画像（Bピクチャー）
仕組み	前後のコマとの違いだけを記録
メリット	動画のファイルサイズを小さくできる高画質のまま小さくできる
デメリット	作るのに時間がかかる動画編集がしにくい
用途	動画配信サービスなど

GOPの選び方

動画を滑らかに再生し、容量を抑える技術に、「GOP」と呼ばれる仕組みがあります。このGOPは「Group of Pictures（一群の画像）」の略で、複数の画像をまとめて扱う単位です。GOPの長さを適切に設定することは、動画の質や編集のしやすさに直結するため、とても重要です。

GOPの中には、基準となる「Iピクチャー」、Iピクチャーとの差分情報を持つ「Pピクチャー」、そしてIピクチャーとPピクチャーの両方との差分情報を持つ「Bピクチャー」の３種類の画像があります。GOPの長さは、Iピクチャーから次のIピクチャーまでの画像の枚数で表されます。

GOPの長さを設定する際には、圧縮の効率、画質、編集のしやすさのバランスを考える必要があります。GOPを長く設定すると、差分情報を使う画像の割合が増えるため、ファイルサイズを小さく、つまり圧縮の効率を高めることができます。しかし、一部分に問題が発生した場合、その影響がGOP全体に及んでしまう可能性があります。例えば、ある箇所のデータが破損すると、そのIピクチャーから次のIピクチャーまでの画像が正しく表示されなくなるかもしれません。

また、動画編集の際には、編集点の前にあるIピクチャーまでデータを読み込んで処理を行う必要があります。そのため、GOPが長いと、編集作業に時間がかかることがあります。編集点を探すために多くの画像データを読み込む必要があるからです。

最適なGOPの長さは、動画の用途によって異なります。例えば、生放送のように遅延を最小限に抑えたい場合は、短いGOPが適しています。短いGOPでは、問題が発生した場合の影響範囲が小さいため、すぐに復旧できます。一方で、画質を重視する映画などのコンテンツでは、長いGOPが適しています。高い圧縮効率により、美しい映像を保ったままファイルサイズを小さくできるからです。

このように、動画の内容や目的に合わせてGOPの長さを調整することで、より良い動画を作成することができます。

GOPの長さ	メリット	デメリット	適した用途
長い	ファイルサイズが小さい（圧縮効率が高い）	データ破損の影響範囲が大きい編集に時間がかかる	画質重視の映画など
短い	データ破損の影響範囲が小さい編集時間が短い遅延が少ない	ファイルサイズが大きい（圧縮効率が低い）	生放送など