我有一个跨过几年的几种物种的计数数据。我只想看看冬季每年每种物种的丰度动态。问题是冬季跨度超过两年,分别是明年的11月,12月和明年1月。现在,我想将连续两年中每种冬季的丰富度相结合,并进行一些分析。例如,我想在第一轮中将2005年11月至12月和2006年1月的子集进行子集并对此进行一些分析,然后在第二轮中就想要对2006年11月至12月和2007年1月的子集进行子集,然后重复相同的分析,依此类推....如何在R中做到这一点?
这是数据的一个例子
date species year month day abundance temp
9/3/2005 A 2005 9 3 3 19
9/15/2005 B 2005 9 15 30 16
10/4/2005 A 2005 10 4 24 12
11/6/2005 A 2005 11 6 32 14
12/8/2005 A 2005 12 8 15 13
1/3/2005 A 2006 1 3 64 19
1/4/2006 B 2006 1 4 2 13
2/10/2006 A 2006 2 10 56 12
2/8/2006 A 2006 1 3 34 19
3/9/2006 A 2006 1 3 64 19
最佳答案
我将日期列转换为日期类(可能使用lubridate
),并删除年月日列,因为它们是多余的。
然后使用季节性年份(定义为年份,除非月份为1月,否则为上一年)创建一个新列。用case_when
构成的另一列定义行的季节。
library(dplyr)
library(lubridate)
# converts to date format
df$date <- mdy(df$date)
# add in columns
df <- mutate(df,
season_year = ifelse(month(date) == 1, year(date) - 1, year(date)),
season = case_when(
month(date) %in% c(2, 3, 4) ~ "Spring",
month(date) %in% c(5, 6, 7) ~ "Summer",
month(date) %in% c(8, 9, 10) ~ "Autumn",
month(date) %in% c(11, 12, 1) ~ "Winter",
T ~ NA_character_
))
# date species abundance temp season_year season
# 1 2005-09-03 A 3 19 2005 Autumn
# 2 2005-09-15 B 30 16 2005 Autumn
# 3 2005-10-04 A 24 12 2005 Autumn
# 4 2005-11-06 A 32 14 2005 Winter
# 5 2005-12-08 A 15 13 2005 Winter
# 6 2005-01-03 A 64 19 2004 Winter
# 7 2006-01-04 B 2 13 2005 Winter
# 8 2006-02-10 A 56 12 2006 Spring
# 9 2006-02-08 A 34 19 2006 Spring
# 10 2006-03-09 A 64 19 2006 Spring
然后,您可以
group_by()
和/或filter()
数据进行进一步分析:df %>%
group_by(season_year) %>%
filter(season == "Winter") %>%
summarise(count = sum(abundance))
# # A tibble: 2 x 2
# season_year count
# <dbl> <int>
# 1 2004 64
# 2 2005 49