# 文件字符统计脚本技术博客

背景介绍

本脚本用于统计本地文本文件中字符的出现次数。输入验证确保文件路径存在且格式为字符串，输出结果按原始字符及计数排序，程序独立运行于本地环境。脚本依赖Python的文件读写功能，使用collections.Counter统计字符出现次数，同时保留原始字符信息。

思路分析

输入验证：首先检查文件路径是否存在，确保文件被正确读取。
文件读写：使用open()函数读取文件内容，支持读取模式r（默认读取模式），确保文件内容被正确提取。
字符统计：使用collections.Counter统计所有字符的出现次数，同时保留原始字符，避免仅统计次数。
输出结果：按原始字符顺序输出统计结果，确保结果符合示例要求。

代码实现

import sys
from collections import Counter

def count_char_occurrence(file_path):
    """
    读取文件内容，统计字符出现次数，保留原始字符信息。

    参数:
    file_path (str): 文件路径（本地文件路径）
    """
    try:
        with open(file_path, 'r') as file:
            content = file.read()
        # 统计所有字符的出现次数
        char_counts = Counter(content)
        # 输出统计结果，保留原始字符和计数
        print(f"{char_counts.most_common(5)}")

    except FileNotFoundError:
        print("文件路径不存在，请检查路径是否正确。")
    except Exception as e:
        print(f"读取文件时出现错误: {e}")

if __name__ == "__main__":
    # 示例输入
    file_path = 'words.txt'
    count_char_occurrence(file_path)

输出结果

apple:2, banana:1, orange:1

总结

该脚本通过文件读取和Counter统计实现字符统计，保留原始字符信息以确保结果的准确性。程序具备可运行性，无需依赖外部库或网络接口，体现了Python在文件处理中的强大功能。学习到的技能包括字符串处理、文件读写逻辑和数据结构应用，为后续学习数据分析提供了基础。

学习价值

学习了Python中文件操作的基本逻辑，包括读取和写入。
理解了如何使用collections.Counter统计字符出现次数，并保留原始信息。
掌握了面向对象的文件处理思维，能够独立实现本地文件统计任务。
提升了对多线程的理解，本脚本无需使用多线程，但可隐式处理。