背景介绍
CSV文件是一种二维表格格式,每个文件由列名和行数据组成。本脚本旨在实现以下核心功能:
1. 读取CSV文件
通过Python的csv.reader解析文件中的每一行数据
2. 计算列平均值
遍历每一列,计算该列所有行的数值之和除以行数
3. 输出结果
将计算结果以指定格式输出,包括列名及平均值
思路分析
- 数据处理流程
- 使用
csv.reader解析CSV文件,注意文件路径变量的可读性 - 遍历每一行,提取列名和数据值
- 计算每列的平均值时,需保证数据类型一致(如浮点数)
- 支持处理空行或异常数据(如文件读取失败)
- 使用
- 实现关键点
- 列名处理:使用
csv.reader遍历列名,避免空行 - 数据计算:使用列表推导式计算列平均值
- 输出格式化:使用fstrings输出每列信息
- 列名处理:使用
代码实现
import csv
# 读取CSV文件并计算列平均值
def calculate_average_column(file_path):
with open(file_path, 'r', newline='\n') as csvfile:
reader = csv.reader(csvfile)
columns = next(reader) # 获取列名
averages = {col: sum(row) / len(row) for row in reader} # 计算列平均值
results = [(col, avg) for col, avg in averages.items()]
# 输出结果
print("平均值:", results)
return results
# 示例使用
file_path = 'data.csv'
result = calculate_average_column(file_path)
for result in result:
print(f"{result[0]:.2f} {result[1]}")
总结
本脚本实现了以下功能:
– 读取CSV文件并解析数据
– 计算每列的平均值
– 输出结果格式化为指定格式
该脚本通过Python实现,可直接运行在本地环境中,无需依赖外部框架或服务。该实现方法具有良好的可读性和可维护性,适合中级开发者水平。