sklearn中的编码器LabelEncoder

2024-01-26 00:38

文章标签 sklearn 编码器 labelencoder

本文主要是介绍sklearn中的编码器LabelEncoder，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

对于不同的feature，每次用都要进行初始化一次，因为特征不同，编码规则肯定也是不同的。

基本上都是按照从小到大来排序的，比如数字，0，2，5，9，编码结果肯定是0，1，2，3

字母的话一般也是如此考虑a，b，c，d啥的，如果你实在不清楚怎么对应的话，我建议你自己提前做成one-hot的形式，自己对应，然后存下这个对应标签。

下面是例子：

>>> xx=[3,2,4,6,9,87,12]
>>> lbe = LabelEncoder()
>>> lbe.fit_transform(xx)
array([1, 0, 2, 3, 4, 6, 5], dtype=int64)
>>> lbe.classes_
array([ 2,  3,  4,  6,  9, 12, 87])

最后一个表示编码的顺序，从0到6对应的什么，下面是字母的编码规则，就是abcd这种顺序

>>> yy=['k','f','m','p','w']
>>> lbe = LabelEncoder()
>>> lbe.fit_transform(yy)
array([1, 0, 2, 3, 4], dtype=int64)
>>> lbe.classes_
array(['f', 'k', 'm', 'p',

这篇关于sklearn中的编码器LabelEncoder的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/645135。 23002807@qq.com

相关文章

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

系列文章目录监督学习：参数方法【学习笔记】陈强-机器学习-Python-Ch4 线性回归【学习笔记】陈强-机器学习-Python-Ch5 逻辑回归【课后题练习】陈强-机器学习-Python-Ch5 逻辑回归（SAheart.csv）【学习笔记】陈强-机器学习-Python-Ch6 多项逻辑回归【学习笔记及课后题练习】陈强-机器学习-Python-Ch7 判别分析【学

阅读更多...

稀疏自编码器tensorflow

稀疏自编码器tensorflow

自编码器是一种无监督机器学习算法，通过计算自编码的输出与原输入的误差，不断调节自编码器的参数，最终训练出模型。自编码器可以用于压缩输入信息，提取有用的输入特征。如,[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]四比特信息可以压缩成两位,[0,0],[1,0],[1,1],[0,1]。此时，自编码器的中间层的神经元个数为2。但是，有时中间隐藏层的神经元

阅读更多...

【机器学习 sklearn】模型正则化L1-Lasso,L2-Ridge

【机器学习 sklearn】模型正则化L1-Lasso,L2-Ridge

#coding:utf-8from __future__ import divisionimport sysreload(sys)sys.setdefaultencoding('utf-8')import timestart_time = time.time()import pandas as pd# 输入训练样本的特征以及目标值，分别存储在变量X_train与y_train之中。

阅读更多...

【机器学习 sklearn】特征筛选feature_selection

【机器学习 sklearn】特征筛选feature_selection

特征筛选更加侧重于寻找那些对模型的性能提升较大的少量特征。继续沿用Titannic数据集，这次试图通过特征刷选来寻找最佳的特征组合，并且达到提高预测准确性的目标。 #coding:utf-8from __future__ import divisionimport sysreload(sys)sys.setdefaultencoding('utf-8')import timest

阅读更多...

TMC5271/TMC5272 支持使用编码器进行闭环位置控制

TMC5271/TMC5272 支持使用编码器进行闭环位置控制

ADI-Trinamic推出两款新芯片产品，TMC5272和TMC5271。TMC5272是一颗2.1V 至 20V，2 x 0.8ARMS双轴步进驱动芯片。而且封装好小，为36 WLCSP (2.97mm x 3.13mm)封装。它集成Stealthchop、Spreadcycle两种斩波模式；还集成加减速算法，可通过配置寄存器方式控制电机转速、方向、和位移。应用场合：VR，注射泵输液泵，安防

阅读更多...

结合sklearn说一下特征选择

结合sklearn说一下特征选择

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。通常情况下，我们经常不管三七二十一，选择一种自己最熟悉或者

阅读更多...

【数据应用案例】使用时空自编码器检测视频异常事件

【数据应用案例】使用时空自编码器检测视频异常事件

案例来源：@阿里巴巴机器智能案例地址：https://mp.weixin.qq.com/s/rUuaaBI3McesED3VVVbsBw 1. 目标：识别视频中的异常事件（如车祸） 2. 难点：正例数据量远远小于负例，同时正例之间的差异性很大，因此难以采用有监督方法进行训练。传统解决方法是使用无监督方法为正常视频建模，然后将异常值视为异常事件。 3. 解决思路：

阅读更多...

【STM32】通用定时器TIM（编码器接口）

【STM32】通用定时器TIM（编码器接口）

本篇博客重点在于标准库函数的理解与使用，搭建一个框架便于快速开发目录前言编码器接口简介正交编码器编码器接口配置初始化IO口输入捕获配置编码器接口初始化编码器接口测速代码 Encoder.h Encoder.c main.c 前言建议先阅读这篇博客，理解定时器输入捕获的配置和旋转编码器的使用【STM32】通用定时器TIM(输

阅读更多...

x264 编码器 AArch64汇编系列：quant 量化相关汇编函数

x264 编码器 AArch64汇编系列：quant 量化相关汇编函数

quant x264_quant_init函数中初始化时指向不同的具体实现：以4x4块量化为例 c 语言版本实现 4x4 块量化：quant_4x4 #define QUANT_ONE( coef, mf, f ) \

阅读更多...

07：【江科大stm32】：编码器通过定时器测速

07：【江科大stm32】：编码器通过定时器测速

编码器通过定时器测速编码器的转动方向不同，则输出波形的相位也不同。如下图所示：编码器标准库的编程接口： ①Encoder.c文件的代码如下： #include "stm32f10x.h" // Device header//使用PA6（TIM3_CH1）和PA7（TIM3_CH2）进行编码器的输入void Encoder_Init(

阅读更多...