最近收缩质心(Nearest Centroids)是一种线性分类机器学习算法。它通过将新样本与训练数据集中基于类别的质心进行比较,来预测样本所属的类别。最近收缩质心算法(Nearest Shrunken Centroids)是其一种扩展,它将基于类别的质心向整个训练数据集的质心进行偏移,并移除 [...]

最近收缩质心(Nearest Centroids)是一种线性分类机器学习算法。它通过将新样本与训练数据集中基于类别的质心进行比较,来预测样本所属的类别。最近收缩质心算法(Nearest Shrunken Centroids)是其一种扩展,它将基于类别的质心向整个训练数据集的质心进行偏移,并移除 [...]
回归(Regression)是一种建模任务,旨在根据输入预测一个数值。线性回归是回归的标准算法,它假设输入与目标变量之间存在线性关系。线性回归的一种扩展是在训练过程中向损失函数添加惩罚项,以鼓励更简单的模型,这些模型具有较小的系数 [...]
回归(Regression)是一种建模任务,旨在根据输入预测一个数值。线性回归是回归的标准算法,它假设输入与目标变量之间存在线性关系。线性回归的一种扩展是在训练过程中向损失函数添加惩罚项,以鼓励更简单的模型,这些模型具有较小的系数 [...]
回归(Regression)是一种建模任务,旨在根据输入预测一个数值。线性回归是回归的标准算法,它假设输入与目标变量之间存在线性关系。线性回归的一种扩展是在训练过程中向损失函数添加惩罚项,以鼓励更简单的模型,这些模型具有较小的系数 [...]
回归(Regression)是一种建模任务,旨在根据输入预测一个数值。用于回归任务的算法也被称为“回归”算法,其中最广为人知且可能最成功的便是线性回归。线性回归拟合一条直线或超平面,以最好地描述输入与 [...] 之间的线性关系。
高斯过程分类器(Gaussian Processes Classifier)是一种分类机器学习算法。高斯过程是高斯概率分布的推广,可以作为复杂非参数机器学习算法(用于分类和回归)的基础。它们属于一种核模型,类似于支持向量机(SVM)。与 SVM 不同的是,它们能够预测高度 [...]
半径邻近分类器(Radius Neighbors Classifier)是一种分类机器学习算法。它是 k-近邻算法(k-nearest neighbors)的一种扩展,它通过考虑新样本半径范围内的所有样本来做出预测,而不是仅考虑 k 个最近邻。因此,基于半径的方法在选择邻近样本时更适合稀疏数据,可以防止 [...] 离得远的样本。
线性判别分析(Linear Discriminant Analysis)是一种线性分类机器学习算法。该算法通过为每个类别构建一个概率模型,该模型基于每个输入变量观测值的具体分布。然后,通过计算新样本属于每个类别的条件概率来对其进行分类,并选择概率最高的类别。 [...]
对测试集进行爬坡(Hill climbing the test set)是一种在不接触训练集甚至不开发预测模型的情况下,在机器学习竞赛中获得良好或完美预测的方法。作为机器学习竞赛的一种方法,这种做法理应受到鄙视,并且大多数竞赛平台都设有限制来阻止它,这一点很重要。尽管如此, [...]
对测试集进行训练(Training to the test set)是一种过拟合类型,在这种情况下,模型被准备好以牺牲泛化误差的增加为代价,从而在给定的测试集上获得良好的性能。这是一种在机器学习竞赛中常见的过拟合类型,在这些竞赛中提供了完整的训练数据集,并且 [...]