我想在YouTube上抓取包含字幕/隐藏式字幕(CC)的特定语言的视频。

例如,

  • 我想抓取200个带有英文字幕/(CC)的随机英语视频。
  • 我想抓取300个带有中文字幕/(CC)的随机中文视频。
  • 我想抓取550个带有马来语字幕/(CC)的马来随机视频。

  • 这里有一个api可以帮助提取成绩单,但是现在的主要瓶颈是我必须去youtube上搜索这些视频并逐一观看,以查看它们是否确实是正确的语言,以及它们是否真的包含字幕/抄送。

    最佳答案

    一个选项是:

  • 使用YouTube Data API- search 请求来搜索包含字幕的视频;为此,请使用值videoCaptionclosedCaption参数。
  • 您可能需要使用另一个参数,以将搜索词简化为特定主题或获得某些所需结果。例如,对于q参数,使用搜索项检索期望的结果;还有所有参数,例如:videoDurationtype = video,relevanceLanguage

  • 获得此类结果后,请复制/粘贴从请求结果中获得的videoId,然后使用网络抓取工具来获取更多视频和相关视频。
  • 关于youtube - 查找带有字幕的特定语言的随机youtube视频,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/61350749/

    10-11 22:22
    查看更多