# 统计文本中单词出现次数的脚本实现


[主题] 文本文件单词统计脚本实现

一、问题背景

需要为用户提供一个脚本,能够从任何文本文件中统计所有单词的出现次数,包括单词数量和出现次数。脚本需在本地环境中运行,无需依赖外部框架或API。该脚本使用Python语言实现,涉及文件读写、数据处理和常用数据结构如集合和字典。

二、思路分析

  1. 文件读取:使用open()函数读取指定文本文件内容。
  2. 单词拆分:将文本内容按空格或制表符进行分隔,使用split()方法处理。
  3. 统计出现次数:使用collections.Counter统计单词的出现次数。
  4. 结果输出:打印统计结果,包括单词数量和出现次数。

三、代码实现

from collections import Counter

def count_words_in_file(file_path):
    with open(file_path, 'r') as file:
        text = file.read()
    words = text.split()  # 假设使用空格作为分隔符
    word_counts = Counter(words)
    print(f"统计结果:单词数量为 {len(word_counts)},出现次数统计如下:")
    for word, count in word_counts.items():
        print(f"{word}: {count}次")

# 示例调用
if __name__ == "__main__":
    file_path = "input.txt"  # 替换为实际输入文件路径
    count_words_in_file(file_path)

四、总结

该脚本实现了从文本文件中统计单词出现次数的功能,通过文件读取、单词拆分和统计工具实现快速结果输出。代码中使用了集合(Counter)来统计,结构清晰,易于理解,适合中级开发者在1~3天内完成。实验中输入文件内容应包含英文单词,输出结果会显示统计结果。
该脚本在本地环境中可运行,无需依赖外部框架或API。