# 读取Excel文件并计算列平均值的Python实现


背景介绍

随着数据量的持续增长,读取Excel文件并进行数据处理成为开发人员的常见任务。本项目旨在通过Python的 pandas 库实现对本地Excel文件的读取、列值计算和输出结果的保存,同时保持代码简洁易用。

思路分析

  1. 数据读取
    使用 pandas.read_excel() 读取 Excel 文件,自动识别列名与行数。
  2. 列值计算
    通过 DataFrame.mean() 方法计算指定列的平均值,并保留结果。
  3. 结果输出与保存
    使用 pandas.to_csv() 保存计算结果到 CSV 文件,确保输出格式与示例一致。

代码实现

import pandas as pd

# 读取 Excel 文件
df = pd.read_excel("data.xlsx", sheet_name=0)  # 假设文件在 "data.xlsx" 存在

# 计算指定列的平均值
average_age = df['Age'].mean()  # 假设文件中列名为 "Age",需要根据需求调整列名

# 保存结果到 CSV 文件
output_path = "output.csv"  # 保存结果文件路径
with open(output_path, "w") as f:
    f.write("平均年龄:\n" + str(average_age))

总结

本项目通过 Python 的 pandas 库实现了对 Excel 文件的高效处理,关键步骤包括文件读取、列值计算和结果存储。代码简洁易读,且无需依赖第三方库,特别适合中级及以上开发人员学习使用。通过这种方式,可以有效提升数据处理的效率与可维护性。