# 读取CSV文件并计算列平均值的Python脚本实现


背景介绍

CSV文件是一种二维表格格式,每个文件由列名和行数据组成。本脚本旨在实现以下核心功能:
1. 读取CSV文件
通过Python的csv.reader解析文件中的每一行数据
2. 计算列平均值
遍历每一列,计算该列所有行的数值之和除以行数
3. 输出结果
将计算结果以指定格式输出,包括列名及平均值

思路分析

  1. 数据处理流程
    • 使用csv.reader解析CSV文件,注意文件路径变量的可读性
    • 遍历每一行,提取列名和数据值
    • 计算每列的平均值时,需保证数据类型一致(如浮点数)
    • 支持处理空行或异常数据(如文件读取失败)
  2. 实现关键点
    • 列名处理:使用csv.reader遍历列名,避免空行
    • 数据计算:使用列表推导式计算列平均值
    • 输出格式化:使用fstrings输出每列信息

代码实现

import csv

# 读取CSV文件并计算列平均值
def calculate_average_column(file_path):
    with open(file_path, 'r', newline='\n') as csvfile:
        reader = csv.reader(csvfile)
        columns = next(reader)  # 获取列名
        averages = {col: sum(row) / len(row) for row in reader}  # 计算列平均值
        results = [(col, avg) for col, avg in averages.items()]
        # 输出结果
        print("平均值:", results)
    return results

# 示例使用
file_path = 'data.csv'
result = calculate_average_column(file_path)
for result in result:
    print(f"{result[0]:.2f} {result[1]}")

总结

本脚本实现了以下功能:
– 读取CSV文件并解析数据
– 计算每列的平均值
– 输出结果格式化为指定格式

该脚本通过Python实现,可直接运行在本地环境中,无需依赖外部框架或服务。该实现方法具有良好的可读性和可维护性,适合中级开发者水平。