sklearn中的编码器LabelEncoder

2024-01-26 00:38

本文主要是介绍sklearn中的编码器LabelEncoder,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

对于不同的feature,每次用都要进行初始化一次,因为特征不同,编码规则肯定也是不同的。

基本上都是按照从小到大来排序的,比如数字,0,2,5,9,编码结果肯定是0,1,2,3

字母的话一般也是如此考虑a,b,c,d啥的,如果你实在不清楚怎么对应的话,我建议你自己提前做成one-hot的形式,自己对应,然后存下这个对应标签。

下面是例子:

>>> xx=[3,2,4,6,9,87,12]
>>> lbe = LabelEncoder()
>>> lbe.fit_transform(xx)
array([1, 0, 2, 3, 4, 6, 5], dtype=int64)
>>> lbe.classes_
array([ 2,  3,  4,  6,  9, 12, 87])

最后一个表示编码的顺序,从0到6对应的什么,下面是字母的编码规则,就是abcd这种顺序

>>> yy=['k','f','m','p','w']
>>> lbe = LabelEncoder()
>>> lbe.fit_transform(yy)
array([1, 0, 2, 3, 4], dtype=int64)
>>> lbe.classes_
array(['f', 'k', 'm', 'p', 

这篇关于sklearn中的编码器LabelEncoder的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/645135

相关文章

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

稀疏自编码器tensorflow

自编码器是一种无监督机器学习算法,通过计算自编码的输出与原输入的误差,不断调节自编码器的参数,最终训练出模型。自编码器可以用于压缩输入信息,提取有用的输入特征。如,[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]四比特信息可以压缩成两位,[0,0],[1,0],[1,1],[0,1]。此时,自编码器的中间层的神经元个数为2。但是,有时中间隐藏层的神经元

【机器学习 sklearn】模型正则化L1-Lasso,L2-Ridge

#coding:utf-8from __future__ import divisionimport sysreload(sys)sys.setdefaultencoding('utf-8')import timestart_time = time.time()import pandas as pd# 输入训练样本的特征以及目标值,分别存储在变量X_train与y_train之中。

【机器学习 sklearn】特征筛选feature_selection

特征筛选更加侧重于寻找那些对模型的性能提升较大的少量特征。 继续沿用Titannic数据集,这次试图通过特征刷选来寻找最佳的特征组合,并且达到提高预测准确性的目标。 #coding:utf-8from __future__ import divisionimport sysreload(sys)sys.setdefaultencoding('utf-8')import timest

TMC5271/TMC5272 支持使用编码器进行闭环位置控制

ADI-Trinamic推出两款新芯片产品,TMC5272和TMC5271。TMC5272是一颗2.1V 至 20V,2 x 0.8ARMS双轴步进驱动芯片。而且封装好小,为36 WLCSP (2.97mm x 3.13mm)封装。它集成Stealthchop、Spreadcycle两种斩波模式;还集成加减速算法,可通过配置寄存器方式控制电机转速、方向、和位移。 应用场合:VR,注射泵输液泵,安防

结合sklearn说一下特征选择

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自己最熟悉或者

【数据应用案例】使用时空自编码器检测视频异常事件

案例来源:@阿里巴巴机器智能 案例地址:https://mp.weixin.qq.com/s/rUuaaBI3McesED3VVVbsBw   1. 目标:识别视频中的异常事件(如车祸)   2. 难点:正例数据量远远小于负例,同时正例之间的差异性很大,因此难以采用有监督方法进行训练。传统解决方法是使用无监督方法为正常视频建模,然后将异常值视为异常事件。   3. 解决思路:

【STM32】通用定时器TIM(编码器接口)

本篇博客重点在于标准库函数的理解与使用,搭建一个框架便于快速开发 目录 前言   编码器接口简介 正交编码器  编码器接口配置 初始化IO口 输入捕获配置 编码器接口初始化 编码器接口测速代码 Encoder.h Encoder.c main.c 前言   建议先阅读这篇博客,理解定时器输入捕获的配置和旋转编码器的使用 【STM32】通用定时器TIM(输

x264 编码器 AArch64汇编系列:quant 量化相关汇编函数

quant x264_quant_init函数中初始化时指向不同的具体实现: 以4x4块量化为例 c 语言版本实现 4x4 块量化:quant_4x4 #define QUANT_ONE( coef, mf, f ) \

07:【江科大stm32】:编码器通过定时器测速

编码器通过定时器测速 编码器的转动方向不同,则输出波形的相位也不同。如下图所示: 编码器标准库的编程接口: ①Encoder.c文件的代码如下: #include "stm32f10x.h" // Device header//使用PA6(TIM3_CH1)和PA7(TIM3_CH2)进行编码器的输入void Encoder_Init(