我正在尝试了解如何使用追溯表中的事件文件(按播放数据播放)。我还想了解如何在跳过Chadwick工具之前使用Retrosheet提供的DiamondWare工具。我正在关注http://www.retrosheet.org/stepex.txt,但我认为此信息已过时(也许我错了),因为它使用的是“1982al.zip”,并且在网页中找不到该数据格式。
我还看到了一些用Python和R开发的工具。我尝试使用R包“retrosheet”(https://github.com/rmscriven/retrosheet),但效果不佳(可能是由于我的无知)。
我想要的是学习,所以我的问题是:有人可以给我推荐“教程”或“指南”,或者给我一些建议以开始使用翻页纸吗?什么是开始使用摘要表的最快,最好的方法是什么?
预先非常感谢您。
塞尔吉奥
最佳答案
The retrosheet package博客上Retrosheet Package, Part 2和Exploring Baseball Data with R的帖子将引导读者了解 retrosheet
r软件包的一些用例。
前者着眼于堪萨斯城皇家队2014-2015年赛程,而后者则探索了迈克·特劳特(Mike Trout)2013年的本垒打。
更新
好像retrosheet
不再被维护。如果您想使用它,我不建议您从CRAN安装它。相反,您应该使用拉取请求版本-keberwein/retrosheet-可以修复getRetrosheet()
函数。
为此,请遵循以下代码:
# assuming you've already installed retrosheet
# remove unmaintained version of retrosheet
remove.packages( pkgs = "retrosheet" )
# install devtools to enable you to download packages from GitHub
install.packages( pkgs = "devtools" )
library( devtools )
# install PR request version of retrosheet
install_github( repo = "keberwein/retrosheet" )
# load retrosheet
library( retrosheet )
# download 2017 MLB rosters
roster.2017 <- getRetrosheet( type = "roster", year = 2017)
# check the dimension of each data frame in roster.2017
lapply( X = roster.2017, FUN = dim )
# $ARI
# [1] 45 7
#
# $ATL
# [1] 49 7
#
# $BAL
# [1] 50 7
#
# $BOS
# [1] 49 7
#
# $CHA
# [1] 51 7
#
# $CHN
# [1] 47 7
#
# $CIN
# [1] 47 7
#
# $CLE
# [1] 41 7
#
# $COL
# [1] 41 7
#
# $DET
# [1] 49 7
#
# $HOU
# [1] 46 7
#
# $KCA
# [1] 49 7
#
# $LAN
# [1] 52 7
#
# $MIA
# [1] 43 7
#
# $MIL
# [1] 50 7
#
# $MIN
# [1] 52 7
#
# $NYA
# [1] 51 7
#
# $NYN
# [1] 52 7
#
# $OAK
# [1] 54 7
#
# $PHI
# [1] 51 7
#
# $PIT
# [1] 47 7
#
# $SDN
# [1] 52 7
#
# $SEA
# [1] 61 7
#
# $SFN
# [1] 49 7
#
# $SLN
# [1] 48 7
#
# $TBA
# [1] 53 7
#
# $TEX
# [1] 51 7
#
# $TOR
# [1] 60 7
#
# $WAS
# [1] 49 7
# end of script #