分界点专题

Pandas-高级处理(八):数据离散化【pandas.cut:根据指定分界点对连续数据进行分箱处理】【pandas.qcut:指定箱子的数量对连续数据进行等宽分箱处理】【get_dummies】

Python实现连续数据的离散化处理主要基于两个函数:pandas.cut和pandas.qcut,pandas.cut根据指定分界点对连续数据进行分箱处理,pandas.qcut可以指定箱子的数量对连续数据进行等宽分箱处理(注意:所谓等宽指的是每个箱子中的数据量是相同的) 应用cut、qcut实现数据的区间分组应用get_dummies实现数据的one-hot编码 数据离散化 可以用来减少

【实用】得到三个动态时间点作为分界点

因为周报需要对比上周,所以现在有一个需求,动态生成上周周一的时间点,类似 ‘2023-10-23 00:00:00’ 并将值赋予给time2变量,将time2 减去7天,得到的时间点赋值给time1,将time2 减去7天,得到的时间点赋值给time3,得到三个动态时间点作为分界点; # WEEKDAY函数返回一个日期的工作日索引值,即星期一为0,星期二为1,星期日为6SET @time2 :