为什么选择 Weka 而不是 R 或 Python 等其他工具来进行应用机器学习?
在这篇文章中,您将发现为什么 Weka 是初学者快速掌握应用机器学习的完美平台。
阅读本文后,您将了解
- 为什么开始应用机器学习很难。
- 开始应用机器学习时最重要的关注点。
- 如何在开始应用机器学习时最好地利用 Weka。
通过我的新书《Weka 应用机器学习精通》来启动您的项目,书中包含分步教程和所有示例的清晰截图。
让我们开始吧。

使用 Weka 快速加速应用机器学习的进展
照片由 Jonathan Riddell 提供,部分权利保留。
开始应用机器学习很难
当你开始应用机器学习时,有很多东西要学习。
例如
- 有算法。
- 有数据。
- 有你正在处理的特定问题。
- 有其背后的数学。
- 有你计划使用的工具。
通常你需要学习一种新的编程语言,比如Python,或者更深奥的语言,比如Matlab或R。
情况不必如此。
学好一件事比尝试学习许多新事物(并且可能失败)要容易得多。
在Weka机器学习方面需要更多帮助吗?
参加我为期14天的免费电子邮件课程,逐步探索如何使用该平台。
点击注册,同时获得该课程的免费PDF电子书版本。
专注于学习一件事
开始机器学习时最应该学的东西是如何交付成果。
也就是说,给定一个问题,如何解决它并交付一组预测,或者如何交付一个可以生成预测的模型。
不仅是预测,而且是准确的、可以稳健可靠地交付的预测,你可以用你的名字或公司的名字来保证,并对此充满信心。
这是最重要的技能。
它通常涉及以下步骤:
- 定义你的问题。
- 准备你的数据。
- 评估一套算法。
- 通过调优和集成改进你的结果。
- 确定你的模型并呈现结果。
学习应用机器学习的过程
学习这个过程的最佳工具是Weka机器学习工作台。
有3个主要原因:
- 速度:您可以快速处理问题,从而有更多时间尝试各种想法。
- 专注:只有你和你的问题,工具不会妨碍你。
- 覆盖范围:它提供了许多最先进的算法供您选择。
它使你免于在其他平台中可能遇到的繁琐。
你无需花费数周时间学习新的语言或API,可以专注于学习如何高效有效地解决问题。
你可以专注于你需要学习的一件有价值的事情:应用机器学习的过程和交付结果。之后,你可以学习如何使用更多不同的工具。
如何最好地使用 Weka
有一种特定的方法可以最好地帮助您完成机器学习之旅。
- 在内存中小型数据集上练习。这些数据集包含数百或数千个实例,因此处理速度快,并且是该领域的标准数据集,因此它们是易于理解的。
- 练习不同的问题类型。从各种问题领域中选择标准数据集,例如生物学、物理学和广告,以及各种问题类型,例如二元和多类别分类、回归、不平衡数据集等。
- 通过练习工具的不同部分来学习。在不同的问题上使用各种不同的技术,包括过滤方法、机器学习算法,甚至聚类和关联规则等无监督方法。
这三个简单的原则将帮助您大大加快应用机器学习技能的开发进度。
您的学习将侧重于解决问题并交付一组准确可靠的预测或可以进行持续预测的模型。
这种方法的优势在于,您可以大大超越该领域其他初学者
- 仍然在学习如何从头开始用代码实现算法。
- 仍然在学习如何使用晦涩的编程语言或应用程序编程接口。
- 仍然在学习如何设置他们的环境。
在应用机器学习中,快速、可靠和系统的结果周转比工具的状态更重要。为此以及更多原因,Weka 是您前进的方向。
总结
在这篇文章中,您了解了 Weka 机器学习工作台对于初学者应用机器学习的重要性。
您学到了
- 开始应用机器学习很难,因为需要学习的东西太多了。
- 在应用机器学习中最重要的事情是交付可靠且稳健的结果。
- 通过在标准机器学习数据集套件上练习,可以最好地利用 Weka。
您对 Weka 进行应用机器学习或对本文有任何疑问吗?在下面的评论中提问,我会尽力回答。
我如何下载 Weka 供自己使用?
您可以在这里了解如何下载 Weka。
https://machinelearning.org.cn/download-install-weka-machine-learning-workbench/
既然 Weka 抽象了大量的编码工作,那么 Weka 将是一个用于抽查算法的好工具,对吗?
当然!