python config.py




配置文件,包含python中的键值对列表 (4)

我有一个python脚本,它分析一组错误消息,并检查每条消息是否与特定模式(正则表达式)匹配,以便对这些消息进行分组。 例如,“文件x不存在”和“文件y不存在”将匹配“文件。*不存在”并且被视为“未找到文件”类别的两次出现。

随着模式和类别的数量不断增加,我想把这些夫妇“正则表达/显示字符串”放在配置文件中,基本上是某种类型的字典序列化。

我希望这个文件可以手工编辑,所以我放弃任何形式的二进制序列化,而且我宁愿不采用xml序列化来避免字符转义问题(&<>等等...... )。

你知道什么是实现这个目标的好方法吗?

更新:感谢Daren Thomas和Federico Ramponi,但我不能拥有可能任意代码的外部python文件。


你有两个不错的选择:

  1. 使用ConfigParser Python标准配置文件格式
  2. YAML使用像PyYAML这样的库

标准Python配置文件看起来像带有[sections]key : valuekey = value对的INI文件。 这种格式的优点是:

  • 不需要第三方库
  • 简单,熟悉的文件格式。

YAML的不同之处在于它被设计为人性化的数据序列化格式,而不是专门为配置而设计的。 它非常易读,并为您提供了几种表示相同数据的方法。 对于您的问题,您可以创建一个如下所示的YAML文件:

file .* does not exist : file not found
user .* not found : authorization error

或者像这样:

{ file .* does not exist: file not found,
  user .* not found: authorization error }

使用PyYAML不是更简单:

import yaml

errors = yaml.load(open('my.yaml'))

此时, errors是具有预期格式的Python字典。 YAML能够代表字典以外的代码:如果您更喜欢字对列表,请使用以下格式:

-
  - file .* does not exist 
  - file not found
-
  - user .* not found
  - authorization error

要么

[ [file .* does not exist, file not found],
  [user .* not found, authorization error]]

yaml.load时,这将生成一个列表列表。

YAML的一个优点是,您可以使用它将现有的硬编码数据导出到文件以创建初始版本,而不是剪切/粘贴加上一堆查找/替换以将数据转换为正确的格式。

YAML格式需要花费更多时间才能熟悉,但使用PyYAML比使用ConfigParser更简单,其优点是您可以使用YAML获得更多关于数据表示方式的选项。

任何一个听起来都能满足您当前的需求,ConfigParser将更容易入手,而YAML将在您的需求扩展时为您提供更多的灵活性。

祝你好运!


如果您是唯一可以访问配置文件的人,则可以使用简单的低级解决方案。 将“词典”保存在文本文件中作为元组列表(regexp,message),就像它是一个python表达式一样:

[
("file .* does not exist", "file not found"),
("user .* not authorized", "authorization error")
]
在您的代码中,加载它,然后评估它,并在结果中编译正则表达式:
f = open("messages.py")
messages = eval(f.read()) # caution: you must be sure of what's in that file
f.close()
messages = [(re.compile(r), m) for (r,m) in messages]
最后得到一个元组列表(compiled_regexp,message)。


我想你想要标准库中的ConfigParser模块。 它读写INI样式文件。 我链接到的标准文档中的示例和文档非常全面。


我有时只是编写一个名为config.py的python模块(即文件)或具有以下内容的东西:

config = {
    'name': 'hello',
    'see?': 'world'
}

然后可以像这样“读取”:

from config import config
config['name']
config['see?']

简单。







serialization