您现在的位置是：首页 > 后端

当前栏目

Python 保存数据的方法：

Python 方法数据保存

2023-09-14 08:59:25 时间

open函数保存

使用with open()新建对象

写入数据(这里使用的是爬取豆瓣读书中一本书的豆瓣短评作为例子)

import requests
from lxml import etree
 
#发送Request请求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在写代码的时候可以将读取的内容打印一下
 
#保存数据open函数
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f
    for i in comments:
        print(i)
        f.write(i+'\n')#写入数据，文件保存在上面指定的目录，加\n为了换行更方便阅读

　　这里指的注意的是： open函数的打开模式

参数	用法
r	read只读。若不存在文件会报错。
w	write只写。若不存在文件会自动新建。
a	apend附加到文件末尾。
rb, wb, ab	操作二进制
r+	读写模式打开

pandas包保存

说道Pandas不得不说一下与之相关的两个数据分析工具包（注意：pandas 、numpy和matplotlib都需要事先安装，详细安装可见之前的博文关于pip方式安装包）

numpy： (Numerical Python的简称)，是高性能科学计算和数据分析的基础包
pandas：基于Numpy创建的Python包，含有使数据分析工作变得更加简单的高级数据结构和操作工具
matplotlib：是一个用于创建出版质量图表的绘图包（主要是2D方面）

1

2

3

import pandas as pd #导入pandas

import numpy as np #导入numpy

import matplotlib.pypolt as plt #导入matplotlib

接下来就演示pandas保存数据到CSV和Excel

#导入包import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(10,4))#创建随机值
 
#print(df.head(2))#查看数据框的头部数据，默认不写为前5行，小于5行时全部显示；也可以自定义查看几行
print(df.tail())##查看数据框的尾部数据，默认不写为倒数5行，小于5行时全部显示；也可以自定义查看倒数几行
 
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpy.csv')#存储到CSV中
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpy.xlsx')#存储到Excel中(需要提前导入库 pip install openpyxl)

实例中保存豆瓣读书的短评代码如下：

import requests
from lxml import etree
 
#发送Request请求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在写代码的时候可以将读取的内容打印一下
 
'''
#保存数据open函数
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f
    for i in comments:
        print(i)
        f.write(i+'\n')#写入数据，文件保存在上面指定的目录，加\n为了换行更方便阅读
'''
 
#保存数据pandas函数   到CSV 和Excel
import pandas as pd
df = pd.DataFrame(comments)
#print(df.head())#head()默认为前5行
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpyCSV.csv')
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpyEx.xlsx')

猜你喜欢

sleep、yield、wait、join的区别(阿里)
自动化测试框架如果总结成这样，人人都能学好
【时间管理】猴子理论 ”monkey-on-the-back” Analogy
Django实现数据传递
linux - mysql - 卸载：使用rpm方式安装的mysql
680. 验证回文串 II-先删后验
重温网络编程(一)
【STM32H7的DSP教程】第38章 STM32H7的FIR高通滤波器实现（支持逐个数据的实时滤波）
控制台打印二叉树
SAP ABAP实用技巧介绍系列之如何创建Maintenance view
go modules 问题 proxy
使用wsl安装kali-linux（包含安装xfce4时需要的kali.sh脚本内容）
[Grunt] Cleaning your build folder with grunt-contrib-clean
Network slimming
java使用javax.mail进行免费的邮件发送
Bug2算法的实现（RobotBASIC环境中仿真）
系统架构设计师考试简介
RTL8195AM开发板使用
[转]TOMCAT配置多端口
ubuntu 20.04 安装谷歌中文输入法
Maven项目POM.xml详解
三极管和MOS管驱动电路的正确用法

相关主题

python模块
Python OS 模块
h5 Python_python做h5网站
Python len() 方法

zl程序教程

当前栏目

Python 保存数据的方法：

open函数保存

pandas包保存

相关文章