ファイルフォーマット

曖昧さ回避 ファイルタイプ」はこの項目へ転送されています。Mac OS 9以前に用いられたファイルのメタ情報については「Finder」をご覧ください。
曖昧さ回避 ファイル形式」や「ファイルタイプ」はこの項目へ転送されています。文具のファイルの種類については「ファイル (文具)」をご覧ください。
ウィキペディア ウィキペディアにおける記事で使うファイルの形式については、「Help:画像などのファイルのアップロードと利用#アップロード可能なファイル形式」をご覧ください。

ファイルフォーマット: file formatファイル形式)は情報をファイルへ収納する形式である[1]

概要

コンピュータにおいてメディア(文書音声画像動画)やプログラムはファイルとして保存される。統一された順序・構造でこれらの情報がファイルとして保存されていれば、OSアプリケーションは一貫した方法でファイルにアクセスし情報を利用できる。これを可能にする、ファイルへの情報格納規格がファイルフォーマット(ファイル形式)である。

通常「ファイルフォーマット」と呼ばれるが、MS-DOSMicrosoft WindowsUNIXUnix系などのオペレーティングシステムにおけるファイルはストリーミングデータ(データストリーム)形式であり、正確には「各ファイルに格納されたデータのフォーマット」の事である。

通常ファイルに格納されたデータは、テキストまたはバイナリファイルなので、ファイルの内容だけからはそのファイルフォーマットを知ることが困難な場合がある。このため、ファイル名に拡張子をつけて識別したり、ネットワークでの転送時にはMIMEヘッダ(メディアタイプ)等をあわせて送ったり、といった方法が採られる。このようなメタデータを付与する方法はファイルの内容自体に影響を与えず、またファイルを開くことなく種別を判定できる、という利点がある。しかし、拡張子は簡単に、しかも自由に編集できるため、信頼性は極めて低い。またMIMEタイプはIANAによって正式に登録・標準化されていない独自の文字列をアプリケーションやシステムが勝手に付与することもありうる。そのため、多くのファイルフォーマットは、ファイルの先頭にマジックナンバーと呼ばれる、より確実にファイル形式を識別するための情報を付加する。

さまざまなアプリケーションで扱える標準的なフォーマットもあるが、オペレーティングシステムやアプリケーションによりそのデータ形式は様々である。特定のアプリケーションで扱えるデータ形式に変換するためのファイルコンバータを利用できることがある。

データの区切りの単位に注目した分類

  • bit(ビット)をデータの区切りの単位とするデータ。例:圧縮されたデータ
  • byte(バイト、1byte = 8bit)を単位とするデータ。例:各種アプリケーションのデータファイル
  • 文字を単位とするデータ。例:テキストファイル

テキストもバイナリの一種であるが、実際のビット列はエンコーディング時に採用する文字セットに左右される。テキストのデータストリームをデコードする際のヒントとして、ファイル先頭付近にバイト順マークや文字セット名を記載するフォーマットもある。

各種プログラミング言語ソースファイルも、構造化されたプレーンテキストファイルの一種である。

汎用性に注目した分類

標準化されたフォーマット
国際的な機関で制定されたフォーマット。ファイルフォーマットの例としては、JPEG、MPEGなどがある。標準化機関の例としては、国際標準化機構 (ISO)、日本産業規格 (JIS)、World Wide Web Consortium (W3C) などがある。
事実上、業界標準となっているフォーマット
後述する「特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット」に含まれるが、広く使用され事実上標準(デファクトスタンダード)となっているもの。例としては、GIFFBXPDF(米Adobe社、後にISO標準化)などがある。
特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット
各種OSやアプリケーションのデータファイル。例としては、BMP、RTF(Microsoft Windows)など多数ある。

よく知られたファイルフォーマット一覧

詳細は「ファイルフォーマット一覧」を参照

テキスト、ハイパーテキスト、ドキュメント

  • プレーンテキスト
  • RTF (Rich Text Format)
  • HTML (HyperText Markup Language)
  • XHTML (Extensible HyperText Markup Language)
  • MHTML (MIME Encapsulation of Aggregate HTML Documents)
  • TeX
  • PDF (Portable Document Format)
  • DjVu
  • DVI (DeVice Independent)
  • CSV (Comma-Separated Values)

オフィススイート 用のフォーマット

主なオフィススイート用のフォーマットには以下がある。

データ記述フォーマット

画像・図形

詳細は「画像ファイルフォーマット」を参照

3D

ラスターイメージ

詳細は「ラスターイメージ」を参照

ベクターイメージ

詳細は「ベクターイメージ」を参照

音声

詳細は「音声ファイルフォーマット」を参照
コーデック」も参照

楽曲

動画

時間軸を持つもの

  • アニメーションGIF
  • MNG (Multiple-image Network Graphics)
  • SWF (Macromedia Shockwave Flash)
  • SMIL (Synchronized Multimedia Integration Language)

ファイルアーカイブ(圧縮など)

オブジェクトファイル

詳細は「オブジェクトファイル」を参照

通信関連

その他

  • EDIF (Electronic Design Interchange Format) - 電子設計データ

ファイルフォーマットと関連づけ

特定のファイルフォーマットと、それを開くアプリケーションソフトウェアを登録しておき、操作を行いたいファイルを選択した際にアプリケーションソフトウェアを選ぶ手間を省くための動作を関連づけ (association) という。関連づける手法はオペレーティングシステムなどの環境により異なる。例えばWindowsOS/2では拡張子によって対応するアプリケーションを選択する(Windowsではレジストリに登録する。OS/2ではWPSの.INIファイルに情報が格納される)。

Mac OSでは、ファイルのメタデータとしてクリエータとタイプというデータがある。ファイルシステムのHFSHFS+、ファイル転送プロトコルのAFPではこれらは保持されるが、FTPHTTP、電子メール等を介してファイルをやりとりする場合は、クリエータとタイプを保持するフォーマット(MacバイナリAppleSingleAppleDoubleBinHex等)に変換するか、Mac OS用のアーカイブフォーマット(StuffItMacLHA等)を用いる必要がある。 macOSではクリエータとタイプがあればそれを優先するが、なければ拡張子による対応づけが利用される。

脚注

[脚注の使い方]
  1. ^ "ファイルは、その中身が意味する内容や目的によって、情報の記録の仕方が変わります。これを「ファイルフォーマット」(file format) と言います。" ファイルとディレクトリの概念. 京都産業大学 - コンピュータ・リテラシ. 2022-12-27閲覧.

関連項目

外部リンク

  • 拡張子辞典(ccfa.info)
  • (英語) dotwhat.net - File extension and file format information. Information on opening, editing an creating file extensions.
  • FileTypes.jp - ファイル拡張子とファイルの種類
  • Manpage of SUFFIXES(LinuxのManpageの日本語訳)
ファイル (コンピュータ)
形式
属性
組織
操作
  • Open(英語版)
  • Close(英語版)
  • Read(英語版)
  • Write(英語版)
リンク
管理
カテゴリ カテゴリ
典拠管理データベース: 国立図書館 ウィキデータを編集
  • ドイツ