我已经使用Pywikibot构建了一些报告工具。随着事情的发展,现在最多需要2个小时才能完成报告,因此我希望加快速度。主要观点:

  • 禁用限制,脚本是只读的,因此page.get(throttle=False)处理此
  • 缓存
  • 直接数据库访问

  • 不幸的是,我找不到太多有关缓存和数据库访问的文档。似乎只有这种方式可以深入研究代码,而且user-config.py中关于数据库访问的信息有限。如果有的话,在哪里可以找到有关pywikibot缓存和直接数据库访问的良好文档?

    并且,还有其他加快速度的方法吗?

    最佳答案

    使用PreloadingGenerator,以便分批加载页面。或MySQLPageGenerator(如果您使用直接数据库访问)。

    请参阅示例here

    10-06 11:39