一个例子是人为的,但是我有很多类似的问题。

db_file_names = ['f1', 'f2']  # list of database files

def make_report(filename):
    # read the database and prepare some report object
    return report_object


现在,我想构造一个字典:db_version-> number_of_tables。报告对象包含我需要的所有信息。

字典理解可能类似于:

d = {
    make_report(filename).db_version: make_report(filename).num_tables
    for filename in db_file_names
}


这种方法有时可行,但效率很低:为每个数据库准备两次报告。

为了避免这种低效率,我通常使用以下方法之一:

使用临时存储:

reports = [make_report(filename) for filename in db_file_names]
d = {r.db_version: r.num_tables for r in reports}


或使用一些适配器生成器:

def gen_data():
    for filename in db_file_names:
        report = make_report(filename)
        yield report.db_version, report.num_tables

d = {dat[0]: dat[1] for dat in gen_data()}


但是通常只有在我写了一些错误的理解,思考并意识到之后,这种情况下才能进行干净,简单的理解。

问题是,在这种情况下是否有更好的方法来创建所需的词典?

从昨天(当我决定发布此问题)开始,我又发明了一种方法,与其他所有方法相比,我更喜欢这种方法:

d = {
    report.db_version: report.num_tables
    for filename in db_file_names
    for report in [make_report(filename), ]
}


但即使这样看起来也不是很好。

最佳答案

您可以使用:

d = {
    r.db_version: r.num_tables
    for r in map(make_report, db_file_names)
}


请注意,在Python 3中,map提供了一个迭代器,因此没有不必要的存储成本。

关于python - 在这种复杂的情况下,如何编写字典理解?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50273538/

10-12 22:57