pandas的Categorical方法
2023-09-11 14:17:15 时间
对于数据样本的标签,如果我们事先不知道这个样本有多少类别,那么可以对数据集的类别列进行统计,这时我们用pandas的Categorical方法就非常快的实现。
1.说明:
你的数据最好是一个series,之后,pd.Categorical(series),得到分类的对象,使用categories或者codes进行查看
2.操作:
pd.Categorical( list ).codes 这样就可以直接得到原始数据的对应的序号列表,通过这样的处理可以将类别信息转化成数值信息 ,这样就可以应用到模型中去了
代码:
1 import tensorflow 2 import lightgbm as lgb 3 import pandas as pd 4 5 6 class Deng(object): 7 def __init__(self): 8 pass 9 10 def main(self): 11 temp = ['a', 'a', 'b', 'c', 'c'] 12 st = pd.Categorical(temp) 13 print(st) 14 # [a, a, b, c, c] 15 # Categories(3, object): [a, b, c] 16 17 # 遍历temp指出temp中每个字符所属类别的位置索引 18 st2 = st.codes 19 print(st2) 20 # [0 0 1 2 2] 21 22 23 if __name__ == '__main__': 24 obj = Deng() 25 obj.main()
相关文章
- python pandas ---Series,DataFrame 创建方法,操作运算操作(赋值,sort,get,del,pop,insert,+,-,*,/)
- volley基本使用方法
- 学习新方法:加强探索性测试技能
- 混沌测试在加密方法改造项目中的实践
- 《用户至上:用户研究方法与实践(原书第2版)》一 1.2 以用户为中心的设计
- C# 中对象与JSON字符串相互转换的三种方法
- MFC-创建模态对话框和非模态对话框的方法
- 查看 Linux 内核以及系统版本的几种方法
- Pandas的loc方法
- Pandas的concat方法
- pandas的replace方法
- pandas的merge方法
- 数据科学必备Pandas数据预处理方法汇总
- 使用 Pandas 和 SQL 进行实用数据分析,让我们用 pandas 和 SQL 进行数据分析并实际理解它们(教程含数据csv)
- java高级用法之:无所不能的java,本地方法调用实况
- Spark Streaming中空batches处理的两种方法(转)
- 关于Cocos2d-x中类与类之间调用彼此方法的机制
- Struct2_定义拦截器并使用注解方式作用在Action的方法中
- svn使用方法
- [Python] 列表操作及方法总结