从这里开始学习机器学习

在应用机器学习方面需要帮助入门吗？

这些正是您一直在寻找的循序渐进的指南！

您希望在哪些方面获得帮助？

我该如何开始？

我被问到最常见的问题是：“我该如何开始？”

关于机器学习入门，我最好的建议可以分解为一个五步流程

第一步：调整心态。相信您可以实践和应用机器学习。
第二步：选择一个流程。使用系统化的流程来解决问题。
- 应用机器学习流程
第三步：选择一个工具。根据您的水平选择一个工具，并将其与您的流程相对应。
- 初学者：Weka Workbench。
- 中级：Python 生态系统。
- 高级：R 平台。
- 最适合机器学习的编程语言
第四步：在数据集上实践。选择数据集进行练习，实践整个流程。
第五步：建立作品集。收集结果并展示您的技能。

关于这种自上而下方法的更多信息，请参阅

我的许多学生都使用这种方法，在 Kaggle 竞赛中表现出色，并找到了机器学习工程师和数据科学家的工作。

应用机器学习流程

机器学习的好处在于预测以及能够做出预测的模型。

具备应用机器学习的技能意味着知道如何在一个又一个问题上持续可靠地提供高质量的预测。您需要遵循一个系统化的流程。

以下是一个五步流程，您可以遵循它在预测建模问题上持续获得高于平均水平的结果

要了解此流程的精彩总结，请参阅以下文章

机器学习概率

概率是量化和利用不确定性的数学。它是许多数学领域（如统计学）的基石，对应用机器学习至关重要。

以下是一个三步流程，您可以利用它快速掌握机器学习所需的概率知识。

第一步：了解什么是概率。
- 机器学习中的数学符号基础
- 什么是概率？
第二步：了解为什么概率对机器学习如此重要。
- 学习机器学习概率的 5 个理由
- 机器学习中的不确定性入门指南
第三步：深入研究概率主题。
- 机器学习概率迷你课程
- 机器学习概率（我的书）

您可以在此处查看所有关于概率的教程。以下是一些最受欢迎的教程精选。

概率基础

贝叶斯定理

概率分布

信息论

机器学习统计学

统计方法是深入理解机器学习算法行为所需的重要数学基础领域。

以下是一个三步流程，您可以利用它快速掌握机器学习所需的统计方法。

第一步：了解什么是统计方法。
- 什么是统计学（以及它为何在机器学习中如此重要）？
第二步：了解为什么统计方法对机器学习很重要。
- 应用统计学与机器学习之间的密切关系
- 机器学习项目中如何使用统计方法的 10 个例子
第三步：深入研究统计方法的主题。
- 机器学习统计学（7 天迷你课程）
- 机器学习统计方法（我的书）

您可以在此处查看所有统计方法的文章。以下是一些最受欢迎的教程精选。

描述性统计

统计假设检验

重采样方法

估计统计

机器学习线性代数

线性代数是深入理解机器学习算法所需的重要数学基础领域。

以下是一个三步流程，您可以利用它快速掌握机器学习所需的线性代数知识。

第一步：了解什么是线性代数。
- 机器学习中的数学符号基础
- 线性代数简明介绍
第二步：了解为什么线性代数对机器学习很重要。
第三步：深入研究线性代数主题。
- 机器学习线性代数迷你课程
- 机器学习线性代数（我的书）

您可以在此处查看所有线性代数的文章。以下是一些最受欢迎的教程精选。

Python 中的线性代数

矩阵

向量

矩阵分解

机器学习优化

优化是所有机器学习算法的核心。当我们训练一个机器学习模型时，它实际上是在用给定的数据集进行优化。

您可以快速通过三个步骤熟悉机器学习中的优化。

第一步：了解什么是优化。
- 将应用机器学习作为一个搜索问题的简明介绍
- 函数优化入门指南
第二步：了解优化算法。
第三步：深入研究优化主题。
- 如何手动优化机器学习模型超参数
- 机器学习优化（我的书）

您可以在此处查看所有优化的文章。以下是一些最受欢迎的教程精选。

局部优化

全局优化

梯度下降

优化的应用

机器学习微积分

微积分是许多机器学习算法成功的幕后推手。当我们谈论机器学习算法的梯度下降优化部分时，梯度就是用微积分求出来的。

您可以通过三个步骤熟悉机器学习中的微积分。

第一步：了解微积分是关于什么的。
- 什么是微积分？
- 微积分的关键概念：变化率
第二步：了解微分法则。
第三步：深入研究微积分主题。
- 微积分在行动：神经网络
- 微分在神经网络中的应用
- 机器学习微积分（我的书）

您可以在此处查看所有微积分的文章。以下是一些最受欢迎的教程精选。

基础微积分

多元微积分

用于优化的微积分

微积分的应用

用于机器学习的 Python

Python 是机器学习项目的通用语言。不仅有许多机器学习库是用 Python 编写的，而且它还能帮助我们快速、整洁地完成机器学习项目。拥有良好的 Python 编程技能可以让您在更短的时间内完成更多工作！

您可以通过三个步骤熟悉用于机器学习的 Python。

第一步：学习语言。
- 如何为机器学习学习 Python？
- Python 中的一些语言特性
第二步：学习如何使用该语言。
第三步：学习在 Python 生态系统中可以做什么。

您可以在此处查看所有 Python 的文章。但不要错过用于机器学习的 Python（我的书）。以下是一些最受欢迎的教程精选。

基础语言

故障排除

语言技巧

库

理解机器学习算法

机器学习是关于机器学习算法的。

您需要知道对于一个给定的问题有哪些可用的算法，它们是如何工作的，以及如何最大限度地利用它们。

以下是如何开始学习机器学习算法

第一步：发现不同类型的机器学习算法。
- 机器学习算法巡览
第二步：发现机器学习算法的基础。
第三步：了解顶级机器学习算法如何工作。
- 机器学习算法迷你课程
- 精通机器学习算法（我的书）

您可以在此处查看所有机器学习算法的文章。以下是一些最受欢迎的教程精选。

线性算法

非线性算法

集成算法

如何学习/研究机器学习算法

Weka 机器学习（无代码）

Weka 是一个可以用来开始应用机器学习的平台。

它有一个图形用户界面，这意味着不需要编程，并且它提供了一套最先进的算法。

以下是您如何开始使用 Weka

第一步：了解 Weka 平台的特性。
- 什么是 Weka 机器学习工作台
第二步：了解如何在 Weka 平台中操作。
- 如何下载和安装 Weka 机器学习工作台
- Weka 机器学习工作台巡览
第三步：了解如何使用 Weka 交付结果。
- 如何在 Weka 中运行您的第一个分类器
- 使用 Weka 的应用机器学习迷你课程
- Weka 机器学习精通（我的书）

您可以在此处查看所有 Weka 机器学习的文章。以下是一些最受欢迎的教程精选。

在 Weka 中准备数据

Weka 算法教程

Python 机器学习 (scikit-learn)

Python 是应用机器学习领域发展最快的平台之一。

您可以在模型的开发和操作部署中使用像 pandas 和 scikit-learn 这样的相同工具。

以下是您开始使用 Python 进行机器学习的步骤

第一步：了解用于机器学习的 Python
- Scikit-Learn 简明介绍：一个 Python 机器学习库
第二步：了解 Python 机器学习的生态系统。
第三步：了解如何使用 Python 中的机器学习解决问题。
- 您的第一个 Python 机器学习项目分步指南
- Python 机器学习迷你课程
- Python 机器学习精通（我的书）

您可以在此处查看所有 Python 机器学习的文章。以下是一些最受欢迎的教程精选。

在 Python 中准备数据

Python 中的机器学习

R 机器学习 (caret)

R 是一个用于统计计算的平台，也是专业数据科学家中最受欢迎的平台。

它之所以受欢迎，是因为有大量的可用技术，以及像强大的 caret 包这样优秀的接口。

以下是如何开始使用 R 进行机器学习

第一步：了解 R 平台及其受欢迎的原因。
第二步：了解 R 中的机器学习算法。
- 如何在 R 中开始使用机器学习算法
第三步：了解如何使用 R 中的机器学习解决问题。
- 您的第一个 R 机器学习项目分步指南
- R 机器学习迷你课程
- R 机器学习精通（我的书）

您可以在此处查看所有 R 机器学习的文章。以下是一些最受欢迎的教程精选。

R 中的数据准备

R 中的应用机器学习

从零开始编写算法代码 (Python)

通过从零开始编写机器学习算法的代码，您可以学到很多东西。

通过编码学习是许多开发者和工程师偏爱的学习方式。

以下是如何通过从零开始编写所有代码来入门机器学习。

第一步：了解从零开始编写算法的好处。
- 从零开始实现机器学习算法的好处
- 通过从零开始实现来理解机器学习算法
第二步：了解从零开始编写算法代码只是一种学习工具。
- 停止从零开始编写机器学习算法代码
- 在实现机器学习算法时不要从开源代码开始
第三步：了解如何用 Python 从零开始编写机器学习算法代码。
- 从零开始的机器学习算法（我的书）

您可以在此处查看所有“从零开始编写算法代码”的文章。以下是一些最受欢迎的教程精选。

2. 准备数据

线性算法

算法评估

非线性算法

时间序列预测简介 (Python)

时间序列预测是商业应用中的一个重要课题。

许多数据集都包含时间成分，但从机器学习的角度来看，时间序列这个主题很少被深入探讨。

以下是如何开始学习时间序列预测

第一步：了解时间序列预测。
- 什么是时间序列预测？
第二步：将时间序列视为监督学习。
- 将时间序列预测作为监督学习
第三步：了解如何精通时间序列预测并交付成果。
- 使用 Python 进行时间序列预测迷你课程
- 使用 Python 进行时间序列预测（我的书）

您可以在此处查看所有时间序列预测的文章。以下是一些最受欢迎的教程精选。

数据准备教程

预测教程

机器学习的数据准备 (Python)

您的预测模型的性能取决于您用来训练它的数据。

因此，数据准备可能是您应用机器学习项目中最重要的部分。

以下是如何开始进行机器学习的数据准备

第一步：了解数据准备的重要性。
- 机器学习项目中的数据准备是什么
- 为什么数据准备在机器学习中如此重要
第二步：了解数据准备技术。
- 机器学习数据准备技术巡览
- 机器学习中数据准备技术的框架
第三步：了解如何精通数据准备并交付成果。
- 如何为机器学习选择数据准备方法
- 机器学习的数据准备（7 天迷你课程）
- 机器学习的数据准备（我的书）

您可以在此处查看所有数据准备的教程。以下是一些最受欢迎的教程精选。

数据清洗

特征选择

数据转换

降维

Python 数据科学技术

数据科学是利用数学、统计学和机器学习技术从数据中提取见解。

Python 生态系统中有大量的数据科学工具，其他机器学习项目中的许多技术对数据科学也很有用。

以下是如何开始使用 Python 进行数据科学

第一步：管理数据
- 解码数据：描述性统计简介
- 探索字典、分类变量和插补数据
第二步：从基本统计技术中获得见解
- 检验房地产假设：深入了解假设检验
- 推断性见解：置信区间如何揭示艾姆斯房地产市场
第三步：从更复杂的模型中获得见解
- 解释线性回归模型中的系数
- 拓展思路：探索用于回归的树状模型
- 数据科学入门指南和进阶数据科学（我的书）

您可以在此处和此处查看所有数据科学的文章。以下是一些最受欢迎的教程精选。

处理数据中的缺失值

统计检验

回归模型

基于树的模型

Python 中的 XGBoost（随机梯度提升）

XGBoost 是梯度提升决策树的高度优化实现。

它之所以受欢迎，是因为世界上一些最优秀的数据科学家正在使用它来赢得机器学习竞赛。

以下是如何开始使用 XGBoost

第一步：了解梯度提升算法。
- 机器学习梯度提升算法简明介绍
第二步：了解 XGBoost。
- 应用机器学习 XGBoost 简明介绍
第三步：了解如何精通 XGBoost 并交付成果。

您可以在此处查看所有 XGBoost 的文章。以下是一些最受欢迎的教程精选。

XGBoost 基础

XGBoost 调优

不平衡分类

不平衡分类指的是某一类别的样本数量远多于另一类别的分类任务。

这类问题通常需要使用专门的性能指标和学习算法，因为标准的指标和方法不可靠或完全失效。

以下是您如何开始学习不平衡分类

第一步：了解不平衡分类的挑战
- 不平衡分类简明介绍
第二步：了解类别分布不均衡的直观理解。
- 建立对严重倾斜类别分布的直觉
第三步：了解如何解决不平衡分类问题。
- 不平衡分类项目的分步框架
- 使用 Python 进行不平衡分类（7 天迷你课程）
- 使用 Python 进行不平衡分类（我的书）

您可以在此处查看所有不平衡分类的文章。以下是一些最受欢迎的教程精选。

性能度量

成本敏感算法

数据采样

高级方法

深度学习 (Keras)

深度学习是一个迷人而强大的领域。

最先进的成果来自深度学习领域，它是机器学习中不可忽视的一个子领域。

以下是如何开始学习深度学习

第一步：了解深度学习的全部内容。
- 什么是深度学习？
- 8 个鼓舞人心的深度学习应用
第二步：了解最好的工具和库。
第三步：了解如何解决问题并交付成果。

您可以在此处查看所有深度学习的文章。以下是一些最受欢迎的教程精选。

背景知识

多层感知器

卷积神经网络

循环神经网络

深度学习 (PyTorch)

除了 Keras，PyTorch 是另一个市场份额巨大的深度学习库。了解 PyTorch 并熟悉其语法非常重要。

以下是如何开始在 PyTorch 中进行深度学习

第一步：了解深度学习的全部内容。
- 什么是深度学习？
- 8 个鼓舞人心的深度学习应用
第二步：了解 PyTorch
- 一些深度学习库概述
- PyTorch 教程：如何使用 Python 开发深度学习模型
第三步：了解如何解决问题并交付成果。
- 使用 PyTorch 分步开发您的第一个神经网络
- 使用 PyTorch 进行深度学习迷你课程
- 使用 PyTorch 的深度学习（我的书）

您可以在此处查看所有 PyTorch 深度学习的文章。以下是一些最受欢迎的教程精选。

背景知识

多层感知器

模型构建技术

高级网络

OpenCV 中的机器学习

OpenCV 是最流行的图像处理库，但其机器学习模块却鲜为人知。

如果您已经在使用 OpenCV，那么在您的项目中添加机器学习应该是零额外成本的。您可以利用在 scikit-learn 或 Keras 中学到的经验，将您的图像处理项目提升到一个新的水平。

以下是您开始在 OpenCV 中使用机器学习的步骤

第一步：复习 OpenCV 提供的功能
- OpenCV 简明介绍
第二步：了解如何呈现图像以供机器学习模型使用
第三步：了解如何在 OpenCV 中使用机器学习
- 使用 OpenCV 进行图像分类的随机森林
- OpenCV 中的机器学习（7 天迷你课程）
- OpenCV 中的机器学习（我的书）

您可以在此处查看所有 OpenCV 机器学习的文章。以下是一些最受欢迎的教程精选。

OpenCV 和图像处理基础

Python 中的机器学习

更好的深度学习性能

虽然定义和拟合深度学习神经网络模型很容易，但在特定的预测建模问题上获得良好性能可能具有挑战性。

您可以使用一些标准技术来改进学习、减少过拟合，并用您的深度学习模型做出更好的预测。

以下是如何开始获得更好的深度学习性能

第一步：了解深度学习的挑战。
- 为什么训练神经网络很困难
- 训练深度学习神经网络模型的挑战
第二步：了解诊断和改进模型性能的框架。
第三步：了解可用于提高性能的技术。
- 如何获得更好的深度学习结果（7 天迷你课程）
- 更好的深度学习（我的书）

您可以在此处查看所有更好的深度学习文章。以下是一些最受欢迎的教程精选。

更好的学习（修复训练）

更好的泛化（修复过拟合）

更好的预测（集成）

技巧、窍门和资源

集成学习

预测性能是许多分类和回归问题上最重要的考量。集成学习算法结合了多个模型的预测，旨在比任何一个成员模型表现得更好。

以下是如何开始获得更好的集成学习性能

第一步：了解集成学习。
- 集成学习简明介绍
- 为什么使用集成学习
第二步：了解集成学习算法。
- 集成学习算法简明介绍
第三步：了解可用于提高性能的技术。
- 使用 Python 的集成机器学习（7 天迷你课程）
- 使用 Python 的集成学习算法（我的书）

您可以在此处查看所有集成学习的文章。以下是一些最受欢迎的教程精选。

集成基础

堆叠集成

装袋法集成

提升法集成

长短期记忆网络 (LSTMs)

长短期记忆 (LSTM) 循环神经网络专为序列预测问题设计，是解决挑战性预测问题的最先进深度学习技术。

以下是如何在 Python 中开始使用 LSTM

第一步：了解 LSTM 的前景。
- 循环神经网络在时间序列预测中的前景
第二步：了解 LSTM 在哪些方面有用。
第三步：了解如何在您的项目中使用 LSTM。
- Keras 中长短期记忆模型的 5 步生命周期
- 长短期记忆网络（迷你课程）
- 使用 Python 的长短期记忆网络（我的书）

您可以在此处查看所有 LSTM 的文章。以下是使用 Python 和 Keras 深度学习库的 LSTM 一些最受欢迎的教程精选。

为 LSTM 准备数据

LSTM 行为

使用 LSTM 建模

用于时间序列的 LSTM

用于自然语言处理 (NLP) 的深度学习

由于自然语言的混乱性，处理文本数据很困难。

文本问题尚未“解决”，但要在具有挑战性的 NLP 问题上获得最先进的结果，您需要采用深度学习方法

以下是如何开始用于自然语言处理的深度学习

第一步：了解用于 NLP 的深度学习的全部内容。
第二步：了解 NLP 的标准数据集。
- 深度学习在自然语言处理中的 7 个应用
- 自然语言处理数据集
第三步：了解如何解决问题并交付成果。
- 用于自然语言处理的深度学习速成课程
- 用于自然语言处理的深度学习（我的书）

您可以在此处查看所有用于 NLP 的深度学习文章。以下是一些最受欢迎的教程精选。

词袋模型

语言建模

文本摘要

文本分类

词嵌入

图片描述

文本翻译

用于计算机视觉的深度学习

由于原始像素与图像含义之间存在鸿沟，处理图像数据很困难。

计算机视觉问题尚未解决，但要在目标检测和人脸识别等具有挑战性的计算机视觉任务上获得最先进的结果，您需要深度学习方法。

以下是如何开始用于计算机视觉的深度学习

第一步：了解用于计算机视觉的深度学习的全部内容。
- 什么是计算机视觉？
- 深度学习在计算机视觉中的前景是什么？
第二步：了解计算机视觉的标准任务和数据集。
第三步：了解如何解决问题并交付成果。
- 如何开始用于计算机视觉的深度学习（7 天迷你课程）
- 用于计算机视觉的深度学习（我的书）

您可以在此处查看所有用于计算机视觉的深度学习文章。以下是一些最受欢迎的教程精选。

图像数据处理

图像数据增强

图像分类

图像数据准备

卷积神经网络基础

对象识别

用于时间序列预测的深度学习

深度学习神经网络能够自动学习从输入到输出的任意复杂映射，并支持多输入和多输出。

像 MLP、CNN 和 LSTM 这样的方法为时间序列预测带来了巨大的希望。

以下是如何开始使用深度学习进行时间序列预测

第一步：了解深度学习在时间序列中的前景（和局限性）。
第二步：了解如何开发稳健的基线和可靠的预测模型。
- 时间序列预测问题分类
- 如何开发一个有能力的机器学习时间序列预测模型
第三步：了解如何构建用于时间序列预测的深度学习模型。
- 如何开始使用深度学习进行时间序列预测（7 天迷你课程）
- 用于时间序列预测的深度学习（我的书）

您可以在此处查看所有用于时间序列预测的深度学习文章。以下是一些最受欢迎的教程精选。

预测趋势和季节性（单变量）

人类活动识别（多变量分类）

预测用电量（多变量，多步）

模型类型

时间序列案例研究

预测空气污染（多变量，多步）

生成对抗网络 (GANs)

生成对抗网络（简称 GANs）是一种使用深度学习方法（如卷积神经网络）进行生成建模的方法。

GANs 是一个激动人心且快速变化的领域，它通过在各种问题领域（尤其是在图像到图像转换任务中）生成逼真的样本，实现了生成模型的承诺。

以下是如何开始使用深度学习进行生成对抗网络

第一步：了解 GANs 在生成建模中的前景。
- 18 个令人印象深刻的生成对抗网络应用
第二步：了解 GAN 架构和不同的 GAN 模型。
- 生成对抗网络简明介绍
- 生成对抗网络模型巡览
第三步：了解如何在 Python 中使用 Keras 开发 GAN 模型。
- 如何开始使用生成对抗网络（7 天迷你课程）
- 使用 Python 的生成对抗网络（我的书）

您可以在此处查看所有生成对抗网络的教程。以下是一些最受欢迎的教程精选。

GAN 基础

GAN 损失函数

开发简单的 GAN 模型

用于图像翻译的 GANs

注意力机制与 Transformer

注意力机制是为解决循环神经网络在处理长输入序列时效果不佳的问题而发明的技术。我们了解到，注意力机制本身可以用作神经网络的构建块，因此我们现在有了 Transformer 架构。

注意力机制和 Transformer 模型被证明能够带来惊人的结果，尤其是在自然语言处理领域。有许多例子表明，以某种方式使用 Transformer 模型可以使计算机理解人类语言，并以类似人类的质量执行诸如翻译或总结段落等任务。

以下是如何开始理解注意力机制和 Transformer

第一步：了解什么是注意力以及它能做什么。
- 注意力研究概览
第二步：了解如何在神经网络模型中使用注意力。
- 在 Keras 中向循环神经网络添加自定义注意力层
第三步：学习 Transformer 模型是如何从注意力机制构建的。
- Transformer 模型
- 用注意力机制构建 Transformer 模型（我的书）

您可以在此处查看所有注意力和 Transformer 的教程。以下是一些最受欢迎的教程精选。

注意力基础

Transformer 基础

从零开始构建 Transformer 模型

需要更多帮助吗？

我在这里帮助您在应用机器学习方面变得出色。

如果您仍有问题并需要帮助，您有以下选择

电子书：我销售一系列电子书，教您如何快速获得机器学习成果。
- 机器学习精通电子书目录
博客：我在博客上写了很多关于应用机器学习的文章，试试搜索功能。
- 机器学习精通博客
常见问题：我收到的最常见问题及其答案
- 机器学习精通常见问题解答
联系：您可以通过联系方式向我提问，但请一次只提一个问题。
- 机器学习精通联系方式

导航

在应用机器学习方面需要帮助入门吗？

这些正是您一直在寻找的循序渐进的指南！

您希望在哪些方面获得帮助？

基础知识

初学者

中级

高级

我该如何开始？

应用机器学习流程

机器学习概率

概率基础

贝叶斯定理

概率分布

信息论

机器学习统计学

描述性统计

统计假设检验

重采样方法

估计统计

机器学习线性代数

Python 中的线性代数

矩阵

向量

矩阵分解

机器学习优化

局部优化

全局优化

梯度下降

优化的应用

机器学习微积分

基础微积分

多元微积分

用于优化的微积分

微积分的应用

用于机器学习的 Python

基础语言

故障排除

语言技巧

库

理解机器学习算法

线性算法

非线性算法

集成算法

如何学习/研究机器学习算法

Weka 机器学习（无代码）

在 Weka 中准备数据

Weka 算法教程

Python 机器学习 (scikit-learn)

在 Python 中准备数据

Python 中的机器学习

R 机器学习 (caret)

R 中的数据准备

R 中的应用机器学习

从零开始编写算法代码 (Python)

2. 准备数据

线性算法

算法评估

非线性算法

时间序列预测简介 (Python)

数据准备教程

预测教程

机器学习的数据准备 (Python)

数据清洗

特征选择

数据转换

降维

Python 数据科学技术

处理数据中的缺失值

统计检验

回归模型

基于树的模型

Python 中的 XGBoost（随机梯度提升）

XGBoost 基础

XGBoost 调优

不平衡分类

性能度量

成本敏感算法

数据采样

高级方法