我正在尝试了解如何使用追溯表中的事件文件(按播放数据播放)。我还想了解如何在跳过Chadwick工具之前使用Retrosheet提供的DiamondWare工具。我正在关注http://www.retrosheet.org/stepex.txt,但我认为此信息已过时(也许我错了),因为它使用的是“1982al.zip”,并且在网页中找不到该数据格式。

我还看到了一些用Python和R开发的工具。我尝试使用R包“retrosheet”(https://github.com/rmscriven/retrosheet),但效果不佳(可能是由于我的无知)。

我想要的是学习,所以我的问题是:有人可以给我推荐“教程”或“指南”,或者给我一些建议以开始使用翻页纸吗?什么是开始使用摘要表的最快,最好的方法是什么?

预先非常感谢您。

塞尔吉奥

最佳答案

The retrosheet package博客上Retrosheet Package, Part 2Exploring Baseball Data with R的帖子将引导读者了解 retrosheet r软件包的一些用例。

前者着眼于堪萨斯城皇家队2014-2015年赛程,而后者则探索了迈克·特劳特(Mike Trout)2013年的本垒打。

更新

好像retrosheet不再被维护。如果您想使用它,我不建议您从CRAN安装它。相反,您应该使用拉取请求版本-keberwein/retrosheet-可以修复getRetrosheet()函数。

为此,请遵循以下代码:

# assuming you've already installed retrosheet
# remove unmaintained version of retrosheet
remove.packages( pkgs = "retrosheet" )

# install devtools to enable you to download packages from GitHub
install.packages( pkgs = "devtools" )
library( devtools )

# install PR request version of retrosheet
install_github( repo = "keberwein/retrosheet" )

# load retrosheet
library( retrosheet )

# download 2017 MLB rosters
roster.2017 <- getRetrosheet( type = "roster", year = 2017)

# check the dimension of each data frame in roster.2017
lapply( X = roster.2017, FUN = dim )
# $ARI
# [1] 45  7
#
# $ATL
# [1] 49  7
#
# $BAL
# [1] 50  7
#
# $BOS
# [1] 49  7
#
# $CHA
# [1] 51  7
#
# $CHN
# [1] 47  7
#
# $CIN
# [1] 47  7
#
# $CLE
# [1] 41  7
#
# $COL
# [1] 41  7
#
# $DET
# [1] 49  7
#
# $HOU
# [1] 46  7
#
# $KCA
# [1] 49  7
#
# $LAN
# [1] 52  7
#
# $MIA
# [1] 43  7
#
# $MIL
# [1] 50  7
#
# $MIN
# [1] 52  7
#
# $NYA
# [1] 51  7
#
# $NYN
# [1] 52  7
#
# $OAK
# [1] 54  7
#
# $PHI
# [1] 51  7
#
# $PIT
# [1] 47  7
#
# $SDN
# [1] 52  7
#
# $SEA
# [1] 61  7
#
# $SFN
# [1] 49  7
#
# $SLN
# [1] 48  7
#
# $TBA
# [1] 53  7
#
# $TEX
# [1] 51  7
#
# $TOR
# [1] 60  7
#
# $WAS
# [1] 49  7

# end of script #

10-04 22:27