[主题] 文本文件单词统计脚本实现
一、问题背景
需要为用户提供一个脚本,能够从任何文本文件中统计所有单词的出现次数,包括单词数量和出现次数。脚本需在本地环境中运行,无需依赖外部框架或API。该脚本使用Python语言实现,涉及文件读写、数据处理和常用数据结构如集合和字典。
二、思路分析
- 文件读取:使用
open()函数读取指定文本文件内容。 - 单词拆分:将文本内容按空格或制表符进行分隔,使用
split()方法处理。 - 统计出现次数:使用
collections.Counter统计单词的出现次数。 - 结果输出:打印统计结果,包括单词数量和出现次数。
三、代码实现
from collections import Counter
def count_words_in_file(file_path):
with open(file_path, 'r') as file:
text = file.read()
words = text.split() # 假设使用空格作为分隔符
word_counts = Counter(words)
print(f"统计结果:单词数量为 {len(word_counts)},出现次数统计如下:")
for word, count in word_counts.items():
print(f"{word}: {count}次")
# 示例调用
if __name__ == "__main__":
file_path = "input.txt" # 替换为实际输入文件路径
count_words_in_file(file_path)
四、总结
该脚本实现了从文本文件中统计单词出现次数的功能,通过文件读取、单词拆分和统计工具实现快速结果输出。代码中使用了集合(Counter)来统计,结构清晰,易于理解,适合中级开发者在1~3天内完成。实验中输入文件内容应包含英文单词,输出结果会显示统计结果。
该脚本在本地环境中可运行,无需依赖外部框架或API。