在应用机器学习方面需要帮助入门吗?
这些正是您一直在寻找的循序渐进的指南!
您希望在哪些方面获得帮助?
初学者
我该如何开始?
我被问到最常见的问题是:“我该如何开始?”
关于机器学习入门,我最好的建议可以分解为一个五步流程
- 第一步:调整心态。相信您可以实践和应用机器学习。
- 第二步:选择一个流程。使用系统化的流程来解决问题。
- 第三步:选择一个工具。根据您的水平选择一个工具,并将其与您的流程相对应。
- 初学者:Weka Workbench。
- 中级:Python 生态系统。
- 高级:R 平台。
- 最适合机器学习的编程语言
- 第四步:在数据集上实践。选择数据集进行练习,实践整个流程。
- 第五步:建立作品集。收集结果并展示您的技能。
关于这种自上而下方法的更多信息,请参阅
我的许多学生都使用这种方法,在 Kaggle 竞赛中表现出色,并找到了机器学习工程师和数据科学家的工作。
应用机器学习流程
机器学习的好处在于预测以及能够做出预测的模型。
具备应用机器学习的技能意味着知道如何在一个又一个问题上持续可靠地提供高质量的预测。您需要遵循一个系统化的流程。
以下是一个五步流程,您可以遵循它在预测建模问题上持续获得高于平均水平的结果
- 第一步:定义您的问题。
- 第二步:准备您的数据。
- 第三步:抽查算法。
- 第四步:改进结果。
- 第五步:展示结果。
要了解此流程的精彩总结,请参阅以下文章
机器学习概率
概率是量化和利用不确定性的数学。它是许多数学领域(如统计学)的基石,对应用机器学习至关重要。
以下是一个三步流程,您可以利用它快速掌握机器学习所需的概率知识。
- 第一步:了解什么是概率。
- 第二步:了解为什么概率对机器学习如此重要。
- 第三步:深入研究概率主题。
- 机器学习概率迷你课程
- 机器学习概率(我的书)
您可以在此处查看所有关于概率的教程。以下是一些最受欢迎的教程精选。
概率基础
贝叶斯定理
机器学习统计学
统计方法是深入理解机器学习算法行为所需的重要数学基础领域。
以下是一个三步流程,您可以利用它快速掌握机器学习所需的统计方法。
- 第一步:了解什么是统计方法。
- 第二步:了解为什么统计方法对机器学习很重要。
- 第三步:深入研究统计方法的主题。
- 机器学习统计学(7 天迷你课程)
- 机器学习统计方法(我的书)
您可以在此处查看所有统计方法的文章。以下是一些最受欢迎的教程精选。
描述性统计
统计假设检验
机器学习线性代数
线性代数是深入理解机器学习算法所需的重要数学基础领域。
以下是一个三步流程,您可以利用它快速掌握机器学习所需的线性代数知识。
- 第一步:了解什么是线性代数。
- 第二步:了解为什么线性代数对机器学习很重要。
- 第三步:深入研究线性代数主题。
- 机器学习线性代数迷你课程
- 机器学习线性代数(我的书)
您可以在此处查看所有线性代数的文章。以下是一些最受欢迎的教程精选。
Python 中的线性代数
矩阵
机器学习优化
优化是所有机器学习算法的核心。当我们训练一个机器学习模型时,它实际上是在用给定的数据集进行优化。
您可以快速通过三个步骤熟悉机器学习中的优化。
- 第一步:了解什么是优化。
- 第二步:了解优化算法。
- 第三步:深入研究优化主题。
- 如何手动优化机器学习模型超参数
- 机器学习优化(我的书)
您可以在此处查看所有优化的文章。以下是一些最受欢迎的教程精选。
局部优化
全局优化
机器学习微积分
微积分是许多机器学习算法成功的幕后推手。当我们谈论机器学习算法的梯度下降优化部分时,梯度就是用微积分求出来的。
您可以通过三个步骤熟悉机器学习中的微积分。
- 第一步:了解微积分是关于什么的。
- 第二步:了解微分法则。
- 第三步:深入研究微积分主题。
您可以在此处查看所有微积分的文章。以下是一些最受欢迎的教程精选。
基础微积分
多元微积分
用于机器学习的 Python
Python 是机器学习项目的通用语言。不仅有许多机器学习库是用 Python 编写的,而且它还能帮助我们快速、整洁地完成机器学习项目。拥有良好的 Python 编程技能可以让您在更短的时间内完成更多工作!
您可以通过三个步骤熟悉用于机器学习的 Python。
- 第一步:学习语言。
- 第二步:学习如何使用该语言。
- 第三步:学习在 Python 生态系统中可以做什么。
您可以在此处查看所有 Python 的文章。但不要错过用于机器学习的 Python(我的书)。以下是一些最受欢迎的教程精选。
基础语言
故障排除
语言技巧
库
理解机器学习算法
机器学习是关于机器学习算法的。
您需要知道对于一个给定的问题有哪些可用的算法,它们是如何工作的,以及如何最大限度地利用它们。
以下是如何开始学习机器学习算法
- 第一步:发现不同类型的机器学习算法。
- 第二步:发现机器学习算法的基础。
- 第三步:了解顶级机器学习算法如何工作。
- 机器学习算法迷你课程
- 精通机器学习算法(我的书)
您可以在此处查看所有机器学习算法的文章。以下是一些最受欢迎的教程精选。
集成算法
如何学习/研究机器学习算法
Weka 机器学习(无代码)
Weka 是一个可以用来开始应用机器学习的平台。
它有一个图形用户界面,这意味着不需要编程,并且它提供了一套最先进的算法。
以下是您如何开始使用 Weka
- 第一步:了解 Weka 平台的特性。
- 第二步:了解如何在 Weka 平台中操作。
- 第三步:了解如何使用 Weka 交付结果。
您可以在此处查看所有 Weka 机器学习的文章。以下是一些最受欢迎的教程精选。
在 Weka 中准备数据
Weka 算法教程
Python 机器学习 (scikit-learn)
Python 是应用机器学习领域发展最快的平台之一。
您可以在模型的开发和操作部署中使用像 pandas 和 scikit-learn 这样的相同工具。
以下是您开始使用 Python 进行机器学习的步骤
- 第一步:了解用于机器学习的 Python
- 第二步:了解 Python 机器学习的生态系统。
- 第三步:了解如何使用 Python 中的机器学习解决问题。
您可以在此处查看所有 Python 机器学习的文章。以下是一些最受欢迎的教程精选。
在 Python 中准备数据
Python 中的机器学习
R 机器学习 (caret)
R 是一个用于统计计算的平台,也是专业数据科学家中最受欢迎的平台。
它之所以受欢迎,是因为有大量的可用技术,以及像强大的 caret 包这样优秀的接口。
以下是如何开始使用 R 进行机器学习
- 第一步:了解 R 平台及其受欢迎的原因。
- 第二步:了解 R 中的机器学习算法。
- 第三步:了解如何使用 R 中的机器学习解决问题。
您可以在此处查看所有 R 机器学习的文章。以下是一些最受欢迎的教程精选。
R 中的数据准备
从零开始编写算法代码 (Python)
通过从零开始编写机器学习算法的代码,您可以学到很多东西。
通过编码学习是许多开发者和工程师偏爱的学习方式。
以下是如何通过从零开始编写所有代码来入门机器学习。
- 第一步:了解从零开始编写算法的好处。
- 第二步:了解从零开始编写算法代码只是一种学习工具。
- 第三步:了解如何用 Python 从零开始编写机器学习算法代码。
- 从零开始的机器学习算法(我的书)
您可以在此处查看所有“从零开始编写算法代码”的文章。以下是一些最受欢迎的教程精选。
时间序列预测简介 (Python)
时间序列预测是商业应用中的一个重要课题。
许多数据集都包含时间成分,但从机器学习的角度来看,时间序列这个主题很少被深入探讨。
以下是如何开始学习时间序列预测
- 第一步:了解时间序列预测。
- 第二步:将时间序列视为监督学习。
- 第三步:了解如何精通时间序列预测并交付成果。
您可以在此处查看所有时间序列预测的文章。以下是一些最受欢迎的教程精选。
数据准备教程
预测教程
机器学习的数据准备 (Python)
您的预测模型的性能取决于您用来训练它的数据。
因此,数据准备可能是您应用机器学习项目中最重要的部分。
以下是如何开始进行机器学习的数据准备
- 第一步:了解数据准备的重要性。
- 第二步:了解数据准备技术。
- 第三步:了解如何精通数据准备并交付成果。
您可以在此处查看所有数据准备的教程。以下是一些最受欢迎的教程精选。
Python 数据科学技术
数据科学是利用数学、统计学和机器学习技术从数据中提取见解。
Python 生态系统中有大量的数据科学工具,其他机器学习项目中的许多技术对数据科学也很有用。
以下是如何开始使用 Python 进行数据科学
- 第一步:管理数据
- 第二步:从基本统计技术中获得见解
- 第三步:从更复杂的模型中获得见解
您可以在此处和此处查看所有数据科学的文章。以下是一些最受欢迎的教程精选。
处理数据中的缺失值
统计检验
回归模型
基于树的模型
Python 中的 XGBoost(随机梯度提升)
XGBoost 是梯度提升决策树的高度优化实现。
它之所以受欢迎,是因为世界上一些最优秀的数据科学家正在使用它来赢得机器学习竞赛。
以下是如何开始使用 XGBoost
- 第一步:了解梯度提升算法。
- 第二步:了解 XGBoost。
- 第三步:了解如何精通 XGBoost 并交付成果。
您可以在此处查看所有 XGBoost 的文章。以下是一些最受欢迎的教程精选。
XGBoost 基础
XGBoost 调优
不平衡分类
不平衡分类指的是某一类别的样本数量远多于另一类别的分类任务。
这类问题通常需要使用专门的性能指标和学习算法,因为标准的指标和方法不可靠或完全失效。
以下是您如何开始学习不平衡分类
- 第一步:了解不平衡分类的挑战
- 第二步:了解类别分布不均衡的直观理解。
- 第三步:了解如何解决不平衡分类问题。
您可以在此处查看所有不平衡分类的文章。以下是一些最受欢迎的教程精选。
深度学习 (Keras)
深度学习是一个迷人而强大的领域。
最先进的成果来自深度学习领域,它是机器学习中不可忽视的一个子领域。
以下是如何开始学习深度学习
- 第一步:了解深度学习的全部内容。
- 第二步:了解最好的工具和库。
- 第三步:了解如何解决问题并交付成果。
您可以在此处查看所有深度学习的文章。以下是一些最受欢迎的教程精选。
背景知识
多层感知器
卷积神经网络
循环神经网络
深度学习 (PyTorch)
除了 Keras,PyTorch 是另一个市场份额巨大的深度学习库。了解 PyTorch 并熟悉其语法非常重要。
以下是如何开始在 PyTorch 中进行深度学习
- 第一步:了解深度学习的全部内容。
- 第二步:了解 PyTorch
- 第三步:了解如何解决问题并交付成果。
您可以在此处查看所有 PyTorch 深度学习的文章。以下是一些最受欢迎的教程精选。
背景知识
多层感知器
模型构建技术
高级网络
OpenCV 中的机器学习
OpenCV 是最流行的图像处理库,但其机器学习模块却鲜为人知。
如果您已经在使用 OpenCV,那么在您的项目中添加机器学习应该是零额外成本的。您可以利用在 scikit-learn 或 Keras 中学到的经验,将您的图像处理项目提升到一个新的水平。
以下是您开始在 OpenCV 中使用机器学习的步骤
- 第一步:复习 OpenCV 提供的功能
- 第二步:了解如何呈现图像以供机器学习模型使用
- 第三步:了解如何在 OpenCV 中使用机器学习
您可以在此处查看所有 OpenCV 机器学习的文章。以下是一些最受欢迎的教程精选。
OpenCV 和图像处理基础
Python 中的机器学习
更好的深度学习性能
虽然定义和拟合深度学习神经网络模型很容易,但在特定的预测建模问题上获得良好性能可能具有挑战性。
您可以使用一些标准技术来改进学习、减少过拟合,并用您的深度学习模型做出更好的预测。
以下是如何开始获得更好的深度学习性能
- 第一步:了解深度学习的挑战。
- 第二步:了解诊断和改进模型性能的框架。
- 第三步:了解可用于提高性能的技术。
您可以在此处查看所有更好的深度学习文章。以下是一些最受欢迎的教程精选。
更好的学习(修复训练)
更好的泛化(修复过拟合)
更好的预测(集成)
技巧、窍门和资源
集成学习
预测性能是许多分类和回归问题上最重要的考量。集成学习算法结合了多个模型的预测,旨在比任何一个成员模型表现得更好。
以下是如何开始获得更好的集成学习性能
- 第一步:了解集成学习。
- 第二步:了解集成学习算法。
- 第三步:了解可用于提高性能的技术。
您可以在此处查看所有集成学习的文章。以下是一些最受欢迎的教程精选。
长短期记忆网络 (LSTMs)
长短期记忆 (LSTM) 循环神经网络专为序列预测问题设计,是解决挑战性预测问题的最先进深度学习技术。
以下是如何在 Python 中开始使用 LSTM
- 第一步:了解 LSTM 的前景。
- 第二步:了解 LSTM 在哪些方面有用。
- 第三步:了解如何在您的项目中使用 LSTM。
您可以在此处查看所有 LSTM 的文章。以下是使用 Python 和 Keras 深度学习库的 LSTM 一些最受欢迎的教程精选。
为 LSTM 准备数据
LSTM 行为
使用 LSTM 建模
用于时间序列的 LSTM
用于自然语言处理 (NLP) 的深度学习
由于自然语言的混乱性,处理文本数据很困难。
文本问题尚未“解决”,但要在具有挑战性的 NLP 问题上获得最先进的结果,您需要采用深度学习方法
以下是如何开始用于自然语言处理的深度学习
- 第一步:了解用于 NLP 的深度学习的全部内容。
- 第二步:了解 NLP 的标准数据集。
- 第三步:了解如何解决问题并交付成果。
您可以在此处查看所有用于 NLP 的深度学习文章。以下是一些最受欢迎的教程精选。
词袋模型
语言建模
文本摘要
文本分类
词嵌入
图片描述
文本翻译
用于计算机视觉的深度学习
由于原始像素与图像含义之间存在鸿沟,处理图像数据很困难。
计算机视觉问题尚未解决,但要在目标检测和人脸识别等具有挑战性的计算机视觉任务上获得最先进的结果,您需要深度学习方法。
以下是如何开始用于计算机视觉的深度学习
- 第一步:了解用于计算机视觉的深度学习的全部内容。
- 第二步:了解计算机视觉的标准任务和数据集。
- 第三步:了解如何解决问题并交付成果。
您可以在此处查看所有用于计算机视觉的深度学习文章。以下是一些最受欢迎的教程精选。
图像数据处理
图像数据增强
图像分类
图像数据准备
卷积神经网络基础
对象识别
用于时间序列预测的深度学习
深度学习神经网络能够自动学习从输入到输出的任意复杂映射,并支持多输入和多输出。
像 MLP、CNN 和 LSTM 这样的方法为时间序列预测带来了巨大的希望。
以下是如何开始使用深度学习进行时间序列预测
- 第一步:了解深度学习在时间序列中的前景(和局限性)。
- 第二步:了解如何开发稳健的基线和可靠的预测模型。
- 第三步:了解如何构建用于时间序列预测的深度学习模型。
您可以在此处查看所有用于时间序列预测的深度学习文章。以下是一些最受欢迎的教程精选。
预测趋势和季节性(单变量)
人类活动识别(多变量分类)
预测用电量(多变量,多步)
模型类型
时间序列案例研究
预测空气污染(多变量,多步)
生成对抗网络 (GANs)
生成对抗网络(简称 GANs)是一种使用深度学习方法(如卷积神经网络)进行生成建模的方法。
GANs 是一个激动人心且快速变化的领域,它通过在各种问题领域(尤其是在图像到图像转换任务中)生成逼真的样本,实现了生成模型的承诺。
以下是如何开始使用深度学习进行生成对抗网络
- 第一步:了解 GANs 在生成建模中的前景。
- 第二步:了解 GAN 架构和不同的 GAN 模型。
- 第三步:了解如何在 Python 中使用 Keras 开发 GAN 模型。
您可以在此处查看所有生成对抗网络的教程。以下是一些最受欢迎的教程精选。
GAN 基础
GAN 损失函数
开发简单的 GAN 模型
用于图像翻译的 GANs
注意力机制与 Transformer
注意力机制是为解决循环神经网络在处理长输入序列时效果不佳的问题而发明的技术。我们了解到,注意力机制本身可以用作神经网络的构建块,因此我们现在有了 Transformer 架构。
注意力机制和 Transformer 模型被证明能够带来惊人的结果,尤其是在自然语言处理领域。有许多例子表明,以某种方式使用 Transformer 模型可以使计算机理解人类语言,并以类似人类的质量执行诸如翻译或总结段落等任务。
以下是如何开始理解注意力机制和 Transformer
- 第一步:了解什么是注意力以及它能做什么。
- 第二步:了解如何在神经网络模型中使用注意力。
- 第三步:学习 Transformer 模型是如何从注意力机制构建的。
您可以在此处查看所有注意力和 Transformer 的教程。以下是一些最受欢迎的教程精选。
注意力基础
Transformer 基础
从零开始构建 Transformer 模型
需要更多帮助吗?
我在这里帮助您在应用机器学习方面变得出色。
如果您仍有问题并需要帮助,您有以下选择
- 电子书:我销售一系列电子书,教您如何快速获得机器学习成果。
- 博客:我在博客上写了很多关于应用机器学习的文章,试试搜索功能。
- 常见问题:我收到的最常见问题及其答案
- 联系:您可以通过联系方式向我提问,但请一次只提一个问题。