机器学习算法有很多,每个算法都是一个研究领域。你需要选择一个你想要深入研究的机器学习算法的细节程度。如果你是一位对应用预测建模感兴趣的开发者,那么存在一个最佳切入点。本文将描述这个最佳切入点,并为你提供一个 […]

机器学习算法有很多,每个算法都是一个研究领域。你需要选择一个你想要深入研究的机器学习算法的细节程度。如果你是一位对应用预测建模感兴趣的开发者,那么存在一个最佳切入点。本文将描述这个最佳切入点,并为你提供一个 […]
Boosting 是一种集成技术,它试图从多个弱分类器构建一个强分类器。在本文中,你将了解机器学习的 AdaBoost 集成方法。阅读本文后,你将知道:什么是 Boosting 集成方法以及它通常如何工作。如何学习 Boosting 决策 […]
随机森林(Random Forest)是最流行、最强大的机器学习算法之一。它是一种称为“自助聚合”(Bootstrap Aggregation)或“装袋”(bagging)的集成机器学习算法。在本文中,你将了解用于预测建模的装袋集成算法和随机森林算法。阅读本文后,你将了解: […]
支持向量机(Support Vector Machines)可能是最流行和谈论最多的机器学习算法之一。它们在 1990 年代开发时非常受欢迎,并且至今仍是高性能算法的首选方法,只需很少的调优。在本文中,你将了解支持向量机(SVM)机器学习 […]
K-最近邻(K-Nearest Neighbors)的一个缺点是你需要保留整个训练数据集。学习向量量化(Learning Vector Quantization,简称 LVQ)是一种人工神经网络算法,它允许你选择要保留的训练实例数量,并学习这些实例应该是什么样子。在本文 […]
在本文中,你将了解用于分类和回归的 K-最近邻(KNN)算法。阅读本文后,你将知道:KNN 使用的模型表示。如何使用 KNN 学习模型(提示:它不是学习)。如何使用 KNN 进行预测。KNN 的许多名称,包括不同领域如何称呼它 […]
朴素贝叶斯(Naive Bayes)是一种非常简单的分类算法,它对每个输入变量的独立性做出了很强的假设。尽管如此,它在许多问题领域都被证明是有效的。在本文中,你将了解用于分类数据的朴素贝叶斯算法。阅读本文后,你将知道:如何 […]
朴素贝叶斯(Naive Bayes)是一种简单但功能强大的预测建模算法。在本文中,你将了解用于分类的朴素贝叶斯算法。阅读本文后,你将知道:朴素贝叶斯实际存储在文件中的模型表示。如何学习到的模型 […]
决策树(Decision Trees)是预测建模机器学习的重要算法类型。经典的决策树算法已经存在数十年,而像随机森林(random forest)这样的现代变种是最强大的技术之一。在本文中,你将了解被称为 CART 的基础决策树算法,CART 代表 […]
逻辑回归(Logistic regression)是一种分类算法,传统上仅限于二分类问题。如果你有多个类别,那么线性判别分析(Linear Discriminant Analysis)是首选的线性分类技术。在本文中,你将了解用于分类预测建模问题的线性判别分析(LDA)算法。阅读本文后,你将知道: […]