背景介绍
为了统计本地文件中的销售额数据,我们需要使用Python的pandas库来读取CSV文件并进行统计分析。该脚本的核心目标是:
1. 读取指定路径的CSV文件;
2. 计算销售额的统计信息;
3. 将结果保存为文本文件。
思路分析
- 读取CSV文件:使用pandas的
pandas.read_csv函数读取指定路径的CSV文件,确保数据格式正确; - 计算统计信息:统计销售额数据中的总销售额、最低销售额、平均销售额和最大销售额;
- 输出结果:将统计结果保存为文本文件,格式为示例所示。
代码实现
import pandas as pd
def annual_sales_report(file_path, output_path):
# 读取本地CSV文件
df = pd.read_csv(file_path)
# 计算统计信息
total_sales = df['销售额'].sum()
min_sales = df['销售额'].min()
average_sales = df['销售额'].mean()
max_sales = df['销售额'].max()
# 输出结果
with open(output_path, 'w') as f:
f.write("总销售额:$%0.f\n" % total_sales)
f.write("最低销售额:$%0.f\n" % min_sales)
f.write("平均销售额:$%0.f\n" % average_sales)
f.write("最大销售额:$%0.f\n" % max_sales)
print("统计结果已保存到 %s 文件中。" % output_path)
# 示例调用
file_path = "data/annual_sales.csv"
output_path = "results/annual_sales_summary.txt"
annual_sales_report(file_path, output_path)
总结
通过上述代码实现,我们可以实现以下功能:
– 读取指定路径的CSV文件;
– 计算销售额的统计信息;
– 保存统计结果为文本文件。
该脚本确保了文件读取的正确性,统计信息的准确性,以及结果的格式化输出。运行时只需在终端执行代码即可完成统计任务。