我是Python和Pyspark的新手,正在练习TF-IDF。
我将txt文件中句子中的所有单词分开,删除了标点符号,删除了停用词列表中的单词,并将它们保存为带有以下代码的字典。
x = text_file.flatmap(lambda line: str_clean(line).split()
x = x.filter(lambda word: word not in stopwords
x = x.reduceByKey(lambda a,b: a+b)
x = x.collectAsMap()
我有10个不同的txt文件用于同一过程。我想在字典的键中添加一个像
"@d1"
这样的字符串,以便我可以指示该键来自文档1。如何将
"@1"
添加到词典中的所有键?本质上,我的字典采用以下形式:
{'word1': 1, 'word2': 1, 'word3': 2, ....}
我希望它是:
{'word1@d1': 1, 'word2@d1': 1, 'word3@d1': 2, ...}
最佳答案
{k+'@d1': v for k, v in d.items()}
在Python 3.6+中,可以使用f字符串:
{f'{k}@d1': v for k, v in d.items()}
关于python - 将字符串添加到字典中的所有键(Python),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48681634/