从将蘑菇分类为可食用或不可食用的分类中学习随机森林分类器

2023-11-21 09:50

本文主要是介绍从将蘑菇分类为可食用或不可食用的分类中学习随机森林分类器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

There are about 50,000 species of mushrooms and out of which 1 to 2 % of them are poisonous. Predicting whether a mushroom is edible or not is a classic problem in the domain of Machine Learning. A mushroom is classified based on a number of features

大约有50,000种蘑菇,其中有1-2%是有毒的。 预测蘑菇是否可食用是机器学习领域的经典问题。 蘑菇根据许多特征分类

什么是RandomForest分类器? (What is a RandomForest Classifier?)

Image for post

A RandomForest Classifier operates as an ensemble algorithm. An ensemble algorithm is the one that combines two more algorithms to derive better results. A RandomForest Classifier is a combination of number of Decision tress. If you do not have an idea of what a Decision Tree is, please visit my blog on Decision Trees.

RandomForest分类器用作集成算法。 集成算法是一种将两种以上算法组合在一起以得出更好结果的算法。 RandomForest分类器是决策树数量的组合。 如果您不知道什么是决策树,请访问我关于决策树的博客。

From the number of decision trees derived the best are chosen and it is fitted to the model.

从得出的决策树数量中选择最佳,然后将其拟合到模型中。

让我们编码! (Let’s Code!)

Now we are going to build a RandomForest Classifier machine learning model using python and some libraries. Libraries are set of programs already written to make the calculations simpler. If you do not know the common machine learning terminologies like Model, Training, etc. please do visit my article on Basic Terminologies of Machine Learning using this link. Let’s start to code!

现在,我们将使用python和一些库来构建RandomForest分类器机器学习模型。 库是已经编写的一组程序,可以简化计算。 如果您不了解诸如Model,Training等常见的机器学习术语,请使用此链接访问我有关机器学习的基本术语的文章。 让我们开始编码!

Image for post

Here we have imported the necessary libraries and packages for us to perform the simple linear regression. The libraries and packages imported are:

在这里,我们已经导入了必要的库和包,以执行简单的线性回归。 导入的库和软件包为:

  1. Numpy: This is a package that is used for scientific calculations and array calculations in python.

    Numpy:这是一个用于在python中进行科学计算和数组计算的软件包。
  2. Pandas: This is a powerful package that has some functions for Data Analysis and Manipulation.

    熊猫:这是一个功能强大的软件包,具有一些用于数据分析和处理的功能。
  3. Sklearn: This is a free machine learning library that contains many functions and methods that are necessary to build a machine learning model. From Sklearn we have imported three functions LabelEncoder, model_selection, and ensemble. LabelEncoder is used to convert the categorical variables into numerical variables and the Ensemble function contains the built-in package for RandomForestClassifier.

    Sklearn:这是一个免费的机器学习库,其中包含构建机器学习模型所需的许多功能和方法。 从Sklearn,我们导入了三个函数LabelEncoder,model_selection和ensemble。 LabelEncoder用于将分类变量转换为数值变量,并且Ensemble函数包含RandomForestClassifier的内置包。
Image for post

Here we are importing the dataset named “mushrooms.csv” and displaying their values before LabelEncoding. The link to the dataset is here.

在这里,我们将导入名为“ mushrooms.csv”的数据集,并在LabelEncoding之前显示其值。 数据集的链接在这里 。

Image for post

Here, we have dropped or deleted the rows that have null values in them to have better predictions. LabelEncoding is the process of converting the categorical or alphabetical values into numerical values as a computer can understand only numerics. And we have also done LabelEncoding here.

在这里,我们删除或删除了其中具有空值的行,以进行更好的预测。 LabelEncoding是将分类或字母值转换为数字值的过程,因为计算机只能理解数字。 而且我们还在这里完成了LabelEncoding。

Image for post

Here, we are selecting the target variable(y) whether a mushroom is edible or not and the features to predict the target variable in the variable(x) and we are splitting the dataset into train and test sets.

在这里,我们选择蘑菇是否可食用的目标变量(y),以及在变量(x)中预测目标变量的特征,然后将数据集分为训练集和测试集。

Image for post

Here, we are initializing the RandomForestClassifier model with the number of decision trees to be formed as “40”. And we are fitting our data to our model.

在这里,我们要初始化的RandomForestClassifier模型的决策树数为“ 40”。 我们正在将数据拟合到模型中。

40 Decision trees will be formed and the best out of them for the two classes Edible or Not-Edible will be selected as the final model.

将形成40个决策树,并从两个类别的可食用或不可食用中选出最好的作为最终模型。

Image for post

At last, we are predicting using the trained model and we are printing whether a mushroom is edible or not.

最后,我们将使用经过训练的模型进行预测,并打印蘑菇是否可食用。

Here is the link to the full code for you to have a hands-on experience. Any queries please do contact me through LinkedIn. Happy Learning!!!

这是完整代码的链接,可让您获得动手经验 。 如有任何疑问,请通过LinkedIn与我联系。 学习愉快!!!

翻译自: https://medium.com/@dilmihirdil123/learn-randomforest-classifier-from-classifying-mushrooms-as-edible-or-not-edible-15fc0cc67c91


http://www.taodudu.cc/news/show-8330621.html

相关文章:

  • mushroom蘑菇数据集入门
  • JAVA 通过JSON文件获取王者荣耀壁纸
  • 手把手教你从分析到实现,王者荣耀壁纸爬虫!
  • 企业数据接口API
  • 互联网销售如何找到企业名单 销售找企业方法
  • 查询企业信息范例Coding
  • 信封加密与密钥管理实践
  • 教育类的短视频如何做?三种类型分享,总有一个适合你
  • 计算机声音处理说课稿,《数字化声音编辑》说课稿
  • 2023年09月 Scratch(一级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 【API解析】微软edge浏览器大声朗读功能(read aloud)调用步骤
  • 2023年9月 少儿编程 中国电子学会图形化编程等级考试Scratch编程一级真题解析(选择题)
  • 超多热门视频都在用的声音|只要一部手机就能制作的配音神器
  • 《铃芽之旅》:自我救赎的奇幻旅程
  • 档案室空气质量监测系统方案,检测温湿度、二氧化碳、甲醛、TVOC、粉尘、PM2.5等,利用现代化物联网技术
  • android实训培训班,蓝鸥Android培训西安邮电大学Android实训课结业了
  • Android培训班(34)
  • Android培训班(52)
  • Android培训班(49)
  • Android培训班(19)
  • Android培训班 75 Dalvik虚拟机的GetStaticMethodID函数
  • Android培训班 全世界最便宜,还送6410开发板
  • Android培训班(29)
  • Android培训班(4)
  • Android培训班(85)升级到4.0版本
  • Android培训班(46)
  • 华为畅享9系统便签和计算机不小心删掉了,手机便签删了怎么恢复
  • 云上数字化时代,华为云桌面助力政企办公升级
  • 华为云桌面,助您解锁轻松高效办公模式
  • 华为云CDN,带你畅享更快速的上网体验
  • 这篇关于从将蘑菇分类为可食用或不可食用的分类中学习随机森林分类器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



    http://www.chinasem.cn/article/401545

    相关文章

    Java深度学习库DJL实现Python的NumPy方式

    《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

    C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

    《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

    Python中的随机森林算法与实战

    《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

    使用C#如何创建人名或其他物体随机分组

    《使用C#如何创建人名或其他物体随机分组》文章描述了一个随机分配人员到多个团队的代码示例,包括将人员列表随机化并根据组数分配到不同组,最后按组号排序显示结果... 目录C#创建人名或其他物体随机分组此示例使用以下代码将人员分配到组代码首先将lstPeople ListBox总结C#创建人名或其他物体随机分组

    HarmonyOS学习(七)——UI(五)常用布局总结

    自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

    Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

    Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

    基于人工智能的图像分类系统

    目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

    【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

    【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

    学习hash总结

    2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

    认识、理解、分类——acm之搜索

    普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。