python数据分析实操练习III¶ Pandas数据载入与预处理¶ 读/写文本文件¶ 1.文本文件读取¶ 文本文件是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。 txt文件:是Windows操作系统上附带的一种文本格式,文件以.txt为后缀。 CSV文件:是Comma-Separated Values的缩写,用半角逗号(’,’)作为字段值的分隔符。 Pandas中使用read_table来读取文本文件: pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None) Pandas中使用read_csv函数来读取CSV文件: pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None) 2. 文本文件的存储¶ 文本文件的存储和读取类似,结构化数据可以通过pandas中的to_csv函数实现以CSV文件格式存储文件。 DataFrame.to_csv(path_or_buf = None, sep = ’,’, na_rep, columns=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 读/写Excel文件¶ 1. Excel文件的读取¶ Pandas提供了read_excel函数读取“xls”和“xlsx”两种excel文件,其格式为: pandas.read_excel(io, sheetname, header=0, index_col=None, names=None, dtype) read_excel函数和read_table函数的部分参数相同, 2. Excel文件的存储¶