X_train, X_test, y_train, y_test = \
    train_test_split(X, y, test_size=0.30, random_state=1)


在此示例中,(X_train, X_test) X以大写形式提及,其中
(y_train, y_test)在这里y用小写字母提及。

是否有令人信服的理由遵循该命名约定?

最佳答案

这是因为您具有多个功能(输入)和一个响应变量(输出)。然后,输入X是具有number_of_features列和number_of_samples行的矩阵,而输出y是具有number_of_samples元素的列向量。遵循在数学和/或相关领域中广泛使用的使用大写字母命名矩阵和使用小写字母向量命名的惯例,X必须为大写字母,而y必须为小写字母。

如果只有一个功能,则输入是列向量而不是矩阵,则x应该是小写。如果您有多个响应变量,并且输出是矩阵,则Y应该是大写的。

最后,使用比Xy更多的描述性名称始终是一个好主意。然后,遵循PEP 8惯例uf,使用snake_case作为变量名-或遵循以下建议的样式指南-就是要走的路。

10-08 07:56