DataFrame(4):DataFrame的创建方式
2023-03-20 14:40:10 时间
1、利用字典生成DataFrame
① 第一种方式:列表组成的字典
stu = {
"name":["张三","李四","王燕"],
"age":[18,20,22],
"sex":["男","男","女"]
}
df = pd.DataFrame(stu)
display(df)
结果如下:
② 第二种方式:上述方式的一般形式
person = {
"name":"Tom",
"age":20,
"subject":["Python","Java","Excel"]
}
df = pd.DataFrame(person)
display(df)
结果如下:
③ 列表组成的列表
x = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
df = pd.DataFrame(data)
display(df)
结果如下:
④ 字典组成的列表
data = [
{"one":1,"two":2},
{"one":5,"two":10,"three":15}
]
df = pd.DataFrame(data)
display(df)
结果如下:
⑤ 字典组成的字典
data = {
"张三":{"Java":90, "Python":89, "Hive":78},
"李四":{"Java":82, "Python":95, "Hive":96},
"王五":{"Java":85, "Python":94}
}
df = pd.DataFrame(data)
display(df)
data = {
"Java":{"张三":90,"李四":82,"王五":85},
"Python":{"张三":89,"李四":95,"王五":94},
"Hive":{"张三":78,"李四":96}
}
df = pd.DataFrame(data)
display(df)
结果如下:
注意:对于上述两个DataFrame,我们直接可以使用data.T进行DataFrame行、列之间的转换。
⑥ 由Series或ndarray组成的字典
data = {
"Java":pd.Series(np.random.randint(70,100,5)),
"Python":np.random.randint(80,100,5)
}
df = pd.DataFrame(data)
display(df)
结果如下:
2、自定义列、索引、数据生成DataFrame
column = ["Python","Java","Excel"]
dates = pd.date_range("20200202",periods=5)
df = pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)),
index=dates,columns=column)
display(df)
结果如下:
注意:这里有两个知识点需要掌握,一个是pd.date_range(),一个np.random.randint(),知道怎么用就行了,详细说明请自行百度。
3、利用二维数组生成DataFrame(常用)
x = np.arange(1,21).reshape(4,5)
index = list("abcde")
df = pd.DataFrame(x,index=index)
display(df)
结果如下:
4、将不同的列表转化为tuple,生成DataFrame
movie = ["战狼2","哪吒之魔童降世","流浪地球","红海行动"]
piapofang = [str(x)+"亿" for x in [56.39,49.34,46.18,36.22]]
list_to_tuple = list(zip(movie,piaofang))
df = pd.DataFrame(list_to_tuple,columns=["movies","piaofang"])
display(df)
结果如下:
5、通过读取sql,csv,excel等文件生成DataFrame
以后工作中都是利用已有的文件,进行数据分析。最好的方式就是将文件读取成DataFrame方式,然后利用各种方式进行数据处理。由于文件格式众多,这里不细说,你需要读取哪一种文件,就自行百度学习一下,即可。
相关文章
- 金融服务领域的大数据:即时分析
- 影响大数据、机器学习和人工智能未来发展的8个因素
- 从0开始构建一个属于你自己的PHP框架
- 如何将Hadoop集成到工作流程中?这6个优秀实践必看
- SEO公司使用大数据优化其模型的5种方法
- 关于Web Workers你需要了解的七件事
- 深入理解HTTPS原理、过程与实践
- 增强分析:数据和分析的未来
- PHP协程实现过程详解
- AI专家:大数据知识图谱——实战经验总结
- 关于PHP的错误机制总结
- 利用数据分析量化协同过滤算法的两大常见难题
- 怎么做大数据工作流调度系统?大厂架构师一语点破!
- 2019大数据处理必备的十大工具,从Linux到架构师必修
- OpenCV中的KMeans算法介绍与应用
- 教大家如果搭建一套phpstorm+wamp+xdebug调试PHP的环境
- CentOS下三种PHP拓展安装方法
- Go语言HTTP Server源码分析
- Go语言HTTP Server源码分析
- 2017年4月编程语言排行榜:Hack首次进入前五十