blog

ソフトウェア開発|Pythonで設定ファイルを解析する

最初のステップは設定ファイルのフォーマットを選ぶことです: INI, JSON, YAML, TOML のどれかです。...

Oct 29, 2025 · 5 min. read
シェア

最初のステップは設定ファイルのフォーマットを選択することです: INI、JSON、YAML、TOML。

プログラムには十分な数の引数が必要な場合があり、それらをすべてコマンドライン引数や環境変数として使用するのは快適でも実現可能でもありません。 このような場合、設定ファイルを使う必要があります。

人気のある設定ファイルフォーマットはいくつかあります。由緒あるINIフォーマット、人気があるが手で書くのが難しいこともあるJSONフォーマット、広く使われているが時々驚くほど詳細なYAMLフォーマット、そして多くの人がまだ聞いたことがない新しく登場したTOMLなどです。

最初の仕事は、フォーマットを選択し、その選択を文書化することです。この簡単な部分を解決した後は、コンフィギュレーションを解析する番です。

コンフィギュレーションに「抽象」データに対応するクラスを用意するのはいいアイデアかもしれません。このコードはコンフィギュレーションに対して何もしないので、パースロジックを示す最も簡単な方法です。

ファイルプロセッサーの構成を想像してください:入力ディレクトリ、出力ディレクトリ、抽出されるファイルで構成されています。

コンフィギュレーション・クラスの抽象的な定義も似たようなものでしょう:

  1. from __future__ import annotations
  1. import attr
  2. @attr.frozen
  3. class Configuration:
  4. @attr.frozen
  5. class Files:
  6. input_dir: str
  7. output_dir: str
  8. files: Files
  9. @attr.frozen
  10. class Parameters:
  11. patterns: List[str]
  12. parameters: Parameters

フォーマット固有のコードを簡単にするために、辞書からそのようなものを解析する関数も書く必要があります。これは、コンフィギュレーションがアンダースコアではなくダッシュを使うことを想定していることに注意してください。 この違いは珍しいことではありません。

  1. def configuration_from_dict(details):
  2. files = Configuration.Files(
  3. input_dir=details["files"]["input-dir"],
  4. output_dir=details["files"]["output-dir"],
  5. parameters = Configuration.Paraneters(
  6. patterns=details["parameters"]["patterns"]
  7. return Configuration(
  8. files=files,
  9. parameters=parameters,

JSON

JSONはJavaScriptに似たフォーマットです。

以下はJSON形式の設定サンプルです:

  1. json_config = """
  2. "files": {
  3. "input-dir": "inputs",
  4. "output-dir": "outputs"
  5. "parameters": {
  6. "patterns": [
  7. "*.txt",
  8. "*.md"

解析ロジックは json モジュールを使って JSON を Python 組み込みのデータ構造に解析し、辞書からクラスを作成します:

  1. import json
  2. def configuration_from_json(data):
  3. parsed = json.loads(data)
  4. return configuration_from_dict(parsed)

INI

INI フォーマットは、当初 Windows でのみ使用されていましたが、現在では設定の標準となっています。

これはINIと同じ設定です:

  1. ini_config="""
  2. [files]
  3. input-dir = inputs
  4. output-dir = outputs
  5. [parameters]
  6. patterns = ['*.txt', '*.md']

Pythonは組み込みのconfigparserモジュールを使ってそれを解析できます。パーサはディクテのようなオブジェクトとして動作するので、直接 configuration_from_dictに渡すことができます:

  1. import configparser
  2. def configuration_from_ini(data):
  3. parser = configparser.ConfigParser()
  4. parser.read_string(data)
  5. return configuration_from_dict(parser)

YAML

YAMLはJSONを拡張したもので、手作業で書きやすいように設計されています。これは、部分的には、非常に長い仕様を持つことで達成されました。

同じ設定をYAMLで示します:

  1. yaml_config = """
  2. input-dir: inputs
  3. output-dir: outputs
  4. parameters:
  5. patterns:
  6. - '*.txt'
  7. - '*.md'

Python に YAML を解析させるには、サードパーティのモジュールをインストールする必要があります。YAMLパーサーは configuration_from_dict 渡すことができる組み込みのPythonデータ型も返します。しかし、YAMLパーサーはバイトストリームを必要とするので、文字列をバイトストリームに変換する必要があります。

  1. import io
  2. import yaml
  3. def configuration_from_yaml(data):
  4. fp = io.StringIO(data)
  5. parsed = yaml.safe_load(fp)
  6. return configuration_from_dict(parsed)

TOML

TOMLはYAMLの軽量な代替となることを意図しています。その仕様はより短く、すでにいくつかの場所で人気があります。

これはTOMLと同じ設定です:

  1. toml_config = """
  2. [files]
  3. input-dir = "inputs"
  4. output-dir = "outputs"
  5. [parameters]
  6. patterns = [ "*.txt", "*.md",]

TOML をパースするには、サードパーティのパッケージをインストールする必要があります。YAMLやJSONのように、基本的なPythonデータ型を返します。

  1. import toml
  2. def configuration_from_toml(data):
  3. parsed = toml.loads(data)
  4. return configuration_from_dict(parsed)

まとめ

設定フォーマットの選択は微妙なトレードオフです。しかし、一度決めたら、Python は少量のコードでほとんどの一般的なフォーマットを解析できます。

Read next