判断俩个样本是否属于同一分布:
from scipy.stats import ks_2samp
import numpy as np
# 假设这是两个数据集的数据
data_set_1 = np.random.normal(0, 1, 1000) # 正态分布,均值0,标准差1
data_set_2 = np.random.normal(0.5, 1.5, 1000) # 正态分布,均值0.5,标准差1.5
# 进行KS检验
statistic, p_value = ks_2samp(data_set_1, data_set_2)
# 输出结果
print(f"KS统计量: {statistic}")
print(f"P值: {p_value}")
# 判断显著性
alpha = 0.05
if p_value < alpha:
print("两个数据集的分布有显著差异。")
else:
print("两个数据集的分布没有显著差异。")