PGM 背 景削除
ドラッグアンドドロップ または クリックで選択
プライベートで安全
すべてがブラウザで行われます。あなたのファイルが私たちのサーバーに触れることはありません。
超高速
アップロードも待つ必要もありません。ファイルをドロップした瞬間に変換します。
本当に無料
アカウントは必要ありません。隠れたコストもありません。ファイルサイズのトリックもありません。
背景の削除は、被写体を周囲から分離し、透明な背景に配置したり、 シーンを交換したり、新しいデザインに合成したりできるようにします。内部では、 アルファマット(ピクセルごとの不透明度0〜1)を推定し、前景を何か他のものの上にアルファ合成しています。これはポーター-ダフの数学であり、「フリンジ」や ストレートアルファ対乗算済みアルファのようなおなじみの落とし穴の原因です。乗算済みアルファとリニアカラーに関する実践的なガイダンスについては、 MicrosoftのWin2Dノート、 Søren Sandmann、および Lomontのリニアブレンドに関する記事を参照してください。
人々が背景を削除する主な方法
1) クロマキー(「グリーン/ブルースクリーン」)
キャプチャを制御できる場合は、背景を単色(多くの場合緑)で塗りつぶし、その色相をキーアウトします。 これは高速で、映画や放送で実証済みであり、ビデオに最適です。トレードオフは照明とワードローブです。 色付きの光がエッジ(特に髪)にこぼれるため、デスピルツールを使用して汚染を中和します。 優れた入門書には、Nukeのドキュメント、 Mixing Light、および実践的な Fusionデモが含まれます。
2) インタラクティブセグメンテーション(クラシックCV)
背景が乱雑な単一の画像の場合、インタラクティブアルゴリズムには、ユーザーからのいくつかのヒント(たとえば、緩い 長方形や落書き)が必要であり、鮮明なマスクに収束します。標準的な方法は GrabCut (本の章)であり、前景/背景のカラーモデルを学習し、グラフカットを繰り返し使用してそれらを分離します。GIMPの前景選択では、 SIOX (ImageJプラグイン)に基づいた同様のアイデアが見られます。
3) 画像マッティング(きめ細かいアルファ)
マッティングは、かすかな境界(髪、毛皮、煙、ガラス)での部分的な透明度を解決します。クラシックな クローズドフォームマッティングは、 トライマップ(明確な前景/明確な背景/不明)を取得し、強力なエッジ忠実 度でアルファの線形システムを解きます。現代の ディープイメージマッティングは、 Adobe Composition-1Kデータセット(MMEditingドキュメント)でニューラルネットワークをトレーニングし、 SAD、MSE、Gradient、Connectivity(ベンチマークの説明)などのメトリックで評価されます。
4) ディープラーニングカットアウト(トライマップなし)
- U2-Net(顕著なオブジェクト検出)は、強力な一般的な「背景削除」エンジンです (リポジトリ)。
- MODNetは、リアルタイムのポートレートマッティングを対象としています(PDF)。
- F、B、Alpha(FBA)マッティングは、前景、背景、アルファを共同で予測して、カラーハローを低減します (リポジトリ)。
- Background Matting V2は 、背景プレートを想定し、最大4K/30fpsでリアルタイムにストランドレベルのマットを生成します (プロジェクトページ、 リポジトリ)。
関連するセグメンテーション作業も役立ちます: DeepLabv3+は、エンコーダー-デコーダーとatrous畳み込みで境界を洗練します (PDF); Mask R-CNNは、インスタンスごとのマスクを提供します (PDF); そして SAM(Segment Anything)は、 なじみのない画像に対してゼロショットマスクを生成するプロンプト可能な基盤モデルです。
人気のあるツールが行うこと
- Photoshop: 背景を削除クイックアクションは、内部で「被写体を選択→レイヤーマスク」を実行します (ここ で確認; チュートリアル)。
- GIMP: 前景選択(SIOX)。
- Canva: 画像と短いビデオ用の1クリック 背景リムーバー。
- remove.bg: 自動化のためのWebアプリ+ API。
- Appleデバイス: 写真/Safari/クイックルックのシステムレベルの「被写体を持ち上げる」 (iOSでのカットアウト)。
よりクリーンなカットアウトのためのワークフローのヒント
- 賢く撮影する。 良好な照明と強い被写体と背景のコントラストは、すべての方法に役立ちます。グリーン/ブルースクリーンを使用する場合は、 デスピルを計画してください (ガイド)。
- 広く始めて、狭く絞り込む。 自動選択(被写体を選択、 U2-Net、 SAM)を実行し、次にブラシまたはマッティング(例: クローズドフォーム)でエッジを洗練します。
- 半透明に注意する。 ガラス、ベール、モーションブラー、飛び散った髪には、真のアルファが必要です(単なるハードマスクではありません)。 F/B/αも回復する方法は、ハローを最小限に抑えます。
- アルファを知る。 ストレート対乗算済みは、異なるエッジの動作を生成します。一貫してエクスポート/合成します( 概要、 Hargreavesを参照)。
- 適切な出力を選択する。 「背景なし」の場合は、クリーンなアルファを持つラスター(PNG/WebPなど)を配信するか、さらなる編集が予想される場合はマスク付きのレイヤーファイルを保持します。重要なのは、計算した アルファの品質であり、ポーター-ダフに根ざしています。
品質と評価
学術研究では、Composition-1Kに関するSAD、MSE、Gradient、およびConnectivityエラーが報告されています。モデルを選択する場合は、これらのメトリックを探してください (メトリックの定義; Background Mattingのメトリックセクション)。 ポートレート/ビデオの場合、MODNetと Background Matting V2は強力です。一般的な「顕著なオブジェクト」画像の場合、 U2-Netは堅実なベースラインです。困難な透明度の場合、 FBAはよりクリーンになる可能性があります。
一般的なエッジケース(および修正)
- 髪と毛皮: マッティング(トライマップまたは MODNetのようなポートレートマッティング)を優先し、チェッカーボードで検査します。
- 微細な構造(自転車のスポーク、釣り糸): 高解像度の入力を使用し、マッティングの前に DeepLabv3+などの境界認識セグメンターを前処理ステップとして使用します。
- 透けて見えるもの(煙、ガラス): 部分的なアルファと、多くの場合、前景色の推定が必要です (FBA)。
- ビデオ会議: きれいなプレートをキャプチャできる場合は、 Background Matting V2は、単純な「仮想背景」トグルよりも自然に見えます。
これが現実世界でどこに現れるか
- Eコマース: マーケットプレイス(Amazonなど)では、多くの場合、純白のメイン画像背景が必要です。 製品画像ガイド (RGB 255,255,255)を参照してください。
- デザインツール: Canvaの 背景リムーバーとPhotoshopの 背景を削除は、 迅速なカットアウトを合理化します。
- オンデバイスの利便性: iOS/macOSの「被写体を持ち上げる」は、カジュアルな共有に最適です。
カットアウトが時々偽物に見える理由(および修正)
- カラースピル: 緑/青の光が被写体に回り込みます— デスピルコントロールまたはターゲットを絞った色置換を使用します。
- ハロー/フリンジ: 通常、アルファ解釈の不一致(ストレート対乗算済み)または古い背景で汚染されたエッジピクセル。正しく変換/解釈します (概要、 詳細)。
- 間違ったぼかし/粒子: 非常にシャープな被写体を柔らかい背景に貼り付けると、それが目立ちます。合成後にレンズのぼかしと粒子を一致させます( ポーター-ダフの基本を参照)。
TL;DRプレイブック
- キャプチャを制御する場合: クロマキーを使用します。均等に照明します。 デスピルを計画します。
- 1回限りの写真の場合: Photoshopの 背景を削除、 Canvaの リムーバー、または remove.bgを試してください。髪の毛はブラシ/マッティングで洗練します。
- 本番グレードのエッジが必要な場合: マッティング( クローズドフォーム またはディープ)を使用し、透明度でアルファを確認します。 アルファ解釈に注意してください。
- ポートレート/ビデオの場合: MODNetまたは Background Matting V2を検討してください。クリックガイド付きセグメンテーションの場合、 SAMは強力なフロントエンドです。
PGM フォーマットとは何ですか?
ポータブルグレイマップフォーマット(グレースケール)
ポータブルグレイマップフォーマット(PGM)は、画像処理やコンピュータグラフィックスにおいて、グレースケール画像をシンプルで装飾のないフォーマットで表現するために広く受け入れられ、使用されているフォーマットです。その重要性は、そのシンプルさだけでなく、さまざまなコンピューティングプラットフォームやソフトウェアエコシステムにおける柔軟性と移植性にもあります。PGMフォーマットのコンテキストにおけるグレースケール画像は、さまざまなグレースケールのシェードで構成されており、各ピクセルは黒から白までの強度値を表します。PGM規格の策定は、主に計算オーバーヘッドを最小限に抑えて 画像の解析と操作を容易にすることを目的としており、そのため、迅速な画像処理タスクや教育目的に特に適しています。
PGMファイルの構造は単純で、ヘッダーの後に画像データが続きます。ヘッダー自体は4つの部分に分かれています。ファイルがPGMであることを識別し、バイナリフォーマットかASCIIフォーマットかを示すマジックナンバー、ピクセル単位の幅と高さで指定された画像の寸法、各ピクセルの可能な強度値の範囲を決定する最大グレースケール値、最後に、オプションで画像に関する追加情報を提供するために含めることができるコメントです。マジックナンバー「P2」はASCII PGMを示し、「P5」はバイナリPGMを示します。この区別は、人間の可読性とストレージ効率のバランスを考慮しています。
ヘッダーに続いて、画像データはヘッダーで指定されたピクセル寸法に対応するグリッドフォーマットで概説されています。ASCII PGM(P2)では、各ピクセルの強度値がプレーンテキストでリストされ、画像の左上から右下に向かって順序付けられ、空白で区切られます。値は黒を表す0からヘッダーで指定された最大グレースケール値(白を表す)までの範囲です。このフォーマットの可読性は、編集とデバッグを容易にしますが、ファイルサイズと解析速度の点ではバイナリ対応物に比べて効率が低くなります。
一方、バイナリPGMファイル(P5)は、強度値にバイナリ表現を使用して、よりコンパクトな形式で画像データをエンコードします。このフォーマットはファイルサイズを大幅に削減し、より高速な読み書き操作を可能にします。これは、大量の画像を処理したり、高性能を必要とす るアプリケーションに有利です。ただし、トレードオフとして、バイナリファイルは人間が読めず、表示や編集には特殊なソフトウェアが必要です。バイナリPGMを処理する場合は、ファイルのエンコーディングとシステムのアーキテクチャ、特にエンディアンを考慮して、バイナリデータを正しく処理することが重要です。
PGMフォーマットの柔軟性は、ヘッダーの最大グレースケール値パラメータによって示されます。この値は画像のビット深度を決定し、それによって表現できるグレースケールの強度の範囲が決まります。一般的な選択肢は255で、これは各ピクセルが0から255の間の任意の値を取ることができ、8ビット画像で256の異なるグレースケールを可能にすることを意味します。この設定はほとんどのアプリケーションに十分ですが、PGMフォーマットは最大グレースケール値を増やすことで、1ピクセルあたり16ビットなどのより高いビット深度に対応できます。この機能により、高ダイナミックレンジイメージングアプリケーションに適した、より細かい強度の階調を持つ画像の表現が可能になります。
PGMフォーマットのシンプルさは、操作と処理にも及びます。このフォーマットは十分に文書化されており、より洗練された画像フォーマットに見られる複雑な機能がないため、PGM画像を解析、変更、生成するプログラムは基本的なプログラミングスキルで作成できます。このアクセシビリティは、画像処理における実験と学習を容易にし、PGMを学術的な環境や愛好家の間で人気のある選択肢にしています。さらに、フォーマットの単純な性質により、フィルタリング、エッジ検出、コントラスト調 整などのタスクのアルゴリズムを効率的に実装でき、研究と実用的なアプリケーションの両方で継続的に使用されています。
その強みにもかかわらず、PGMフォーマットには制限もあります。最も注目すべき点は、グレースケール用に本質的に設計されているため、カラー画像をサポートしていないことです。これはモノクロ画像のみを扱うアプリケーションにとっては欠点ではありませんが、カラー情報を必要とするタスクでは、カラー画像用のポータブルピックスマップフォーマット(PPM)など、Netpbmフォーマットファミリーの兄弟に目を向ける必要があります。さらに、PGMフォーマットのシンプルさは、JPEGやPNGなどのより複雑なフォーマットで利用できる圧縮、メタデータストレージ(基本的なコメントを超える)、レイヤーなどの最新の機能をサポートしていないことを意味します。この制限により、高解像度画像のファイルサイズが大きくなり、特定のアプリケーションでの使用が制限される可能性があります。
PGMフォーマットの互換性と他のフォーマットとの変換の容易さは、その注目すべき利点の1つです。画像データを単純で文書化された方法でエンコードするため、PGM画像を他のフォーマットに変換したり、その逆を行ったりするのは比較的簡単です。この機能により、さまざまなフォーマットから画像を調達し、シンプルさを追求してPGMで処理し、次に配布やストレージに適した最終フォーマットに変換する画像処理パイプラインの優れた中間フォーマットになります。さまざまなプログラミング言語の多数のユーティリティとライブラリがこれらの変換プロセスをサポートしており、PGM フォーマットの多用途で適応可能なワークフローにおける役割を強化しています。
PGMファイルのセキュリティ上の考慮事項は、一般的に、フォーマットが不適切または悪意を持って作成されたファイルを解析および処理することと関連するリスクを中心に展開されます。そのシンプルさから、PGMフォーマットはより複雑なフォーマットと比較して特定の脆弱性にさらされにくくなっています。ただし、PGMファイルを解析するアプリケーションは、正しくないヘッダー情報、予想される寸法を超えるデータ、有効範囲外の値など、予期しない入力を処理するための堅牢なエラー処理を実装する必要があります。特にユーザーが提供する画像を受け入れるアプリケーションでは、PGMファイルを安全に処理することは、潜在的なセキュリティの悪用を防ぐために不可欠です。
将来を見据えると、PGMフォーマットは、そのシンプルさと制限にもかかわらず、技術業界の特定のニッチで永続的な関連性を持ち、単純で十分に文書化されたファイルフォーマットの価値を強調しています。教育ツールとしての役割、迅速な画像処理タスクへの適性、画像フォーマット変換の促進は、ファイルフォーマット設計における機能性と複雑さのバランスの重要性を例示しています。技術の進歩に伴い、機能が強化され、圧縮が向上し、新しいイメージングテクノロジーをサポートする新しい画像フォーマットが間違いなく登場します。しかし、PGMフォーマットのレガシーは残り、パフォーマンス、シンプルさ、移植性の最適な組み合わせを目指す将来のフォーマットの設計のベンチマークとして機能します。
結論として、ポ ータブルグレイマップフォーマット(PGM)は、そのシンプルさにもかかわらず、デジタルイメージングの領域において貴重な資産を表しています。使いやすさ、アクセシビリティ、単純さを中心としたその設計思想は、教育からソフトウェア開発まで、さまざまな分野でその継続的な関連性を確保してきました。グレースケール画像の効率的な操作と処理を可能にすることで、PGMフォーマットは画像処理愛好家と専門家の両方にとってツールキットの定番として定着しています。教育的価値、処理パイプラインにおける役割、画像操作におけるシンプルさのために使用されるかに関係なく、PGMフォーマットは、絶えず進化するデジタルテクノロジーの風景において、設計の優れた、シンプルなファイルフォーマットの永続的な影響の証です。
対応フォーマット
AAI.aai
AAI Dune 画像
AI.ai
Adobe Illustrator CS2
AVIF.avif
AV1 画像ファイルフォーマット
BAYER.bayer
Raw ベイヤー画像
BMP.bmp
Microsoft Windows ビットマップ画像
CIN.cin
Cineon 画像ファイル
CLIP.clip
画像クリップマスク
CMYK.cmyk
Raw シアン、マジェンタ、イエロー、黒サンプル
CUR.cur
Microsoft アイコン
DCX.dcx
ZSoft IBM PC マルチページ Paintbrush
DDS.dds
Microsoft DirectDraw Surface
DPX.dpx
SMTPE 268M-2003 (DPX 2.0) 画像
DXT1.dxt1
Microsoft DirectDraw Surface
EPDF.epdf
カプセル化されたポータブルドキュメントフォーマット
EPI.epi
Adobe カプセル化PostScriptインターチェンジフォーマット
EPS.eps
Adobe カプセル化PostScript
EPSF.epsf
Adobe カプセル化PostScript
EPSI.epsi
Adobe カプセル化PostScriptインターチェンジフォーマット
EPT.ept
TIFFプレビュー付きカプセル化PostScript
EPT2.ept2
TIFFプレビュー付きカプセル化PostScript Level II
EXR.exr
高ダイナミックレンジ(HDR)画像
FF.ff
Farbfeld
FITS.fits
フレキシブル画像転送システム
GIF.gif
CompuServe グラフィックス交換フォーマット
HDR.hdr
高ダイナミックレンジ画像
HEIC.heic
高効率画像コンテナ
HRZ.hrz
スロースキャンテレビジョン
ICO.ico
Microsoft アイコン
ICON.icon
Microsoft アイコン
J2C.j2c
JPEG-2000 コードストリーム
J2K.j2k
JPEG-2000 コードストリーム
JNG.jng
JPEG ネットワークグラフィックス
JP2.jp2
JPEG-2000 ファイルフォーマット構文
JPE.jpe
JPEG JFIFフォーマット
JPEG.jpeg
JPEG JFIFフォーマット
JPG.jpg
JPEG JFIFフォーマット
JPM.jpm
JPEG-2000 ファイルフォーマット構文
JPS.jps
JPEG JPSフォーマット
JPT.jpt
JPEG-2000 ファイルフォーマット構文
JXL.jxl
JPEG XL画像
MAP.map
マルチレゾリューションシームレス画像データベース(MrSID)
MAT.mat
MATLAB レベル5画像フォーマット
PAL.pal
Palm ピクスマップ
PALM.palm
Palm ピクスマップ
PAM.pam
一般的な2次元ビットマップフォーマット
PBM.pbm
ポータブルビットマップフォーマット(白黒)
PCD.pcd
フォトCD
PCT.pct
Apple Macintosh QuickDraw/PICT
PCX.pcx
ZSoft IBM PC ペイントブラシ
PDB.pdb
Palm 画像ビューアフォーマット
PDF.pdf
ポータブルドキュメントフォーマット
PDFA.pdfa
ポータブルドキュメントアーカイブフォーマット
PFM.pfm
ポータブルフロートフォーマット
PGM.pgm
ポータブルグレイマップフォーマット(グレースケール)
PGX.pgx
JPEG 2000 非圧縮フォーマット
PICT.pict
Apple Macintosh QuickDraw/PICT
PJPEG.pjpeg
JPEG JFIFフォーマット
PNG.png
ポータブルネットワークグラフィックス
PNG00.png00
オリジナル画像からビット深度、カラータイプを継承したPNG
PNG24.png24
不透明またはバイナリ透過24ビットRGB(zlib 1.2.11)
PNG32.png32
不透明またはバイナリ透過32ビットRGBA
PNG48.png48
不透明またはバイナリ透過48ビットRGB
PNG64.png64
不透明またはバイナリ透過64ビットRGBA
PNG8.png8
不透明またはバイナリ透過8ビットインデックスカラー
PNM.pnm
ポータブルエニーマップ
PPM.ppm
ポータブルピクスマップフォーマット(カラー)
PS.ps
Adobe PostScriptファイル
PSB.psb
Adobe 大容量ドキュメントフォーマット
PSD.psd
Adobe Photoshop ビットマップ
RGB.rgb
Raw 赤、緑、青サンプル
RGBA.rgba
Raw 赤、緑、青、アルファサンプル
RGBO.rgbo
Raw 赤、緑、青、不透明度サンプル
SIX.six
DEC SIXELグラフィックスフォーマット
SUN.sun
Sunラスタファイル
SVG.svg
スケーラブルベクターグラフィックス
TIFF.tiff
TIFF(タグ付き画像ファイルフォーマット)
VDA.vda
Truevision Targa画像
VIPS.vips
VIPS画像
WBMP.wbmp
ワイヤレスビットマップ(レベル0)画像
WEBP.webp
WebP画像フォーマット
YUV.yuv
CCIR 601 4:1:1 または 4:2:2
よくある質問
これはどのように機能しますか?
このコンバーターはブラウザ内で完全に動作します。ファイルを選択すると、メモリに読み込まれ、選択したフォーマットに変換されます。その後、変換されたファイルをダウンロードできます。
ファイルの変換にかかる時間は?
変換は瞬時に開始され、ほとんどのファイルは1秒以内に変換されます。大きなファイルの場合、時間がかかる場合があります。
ファイルの扱いは?
ファイルは決してサーバにアップロードされません。ブラウザ内で変換され、変換されたファイルがダウンロードされます。ファイルは見られません。
変換できるファイルタイプは?
画像フォーマット間の変換すべてに対応しています。JPEG、PNG、GIF、WebP、SVG、BMP、TIFFなどです。
料金はかかりますか?
このコンバーターは完全に無料で、永久に無料のままです。ブラウ ザ内で動作するため、サーバを用意する必要がないので、料金を請求する必要がありません。
一度に複数のファイルを変換できますか?
はい、一度に複数のファイルを変換できます。追加時に複数のファイルを選択してください。