背景介绍
本程序用于统计文本文件中单词的出现频率,通过读取文件内容并进行频率统计,输出结果。该程序采用Python语言实现,支持独立运行,无需依赖外部框架或服务。该实现要求将文本文件内容分割为单词,统计每个单词的出现次数,并输出结果。
思路分析
- 文件读取:使用Python的
open()函数读取指定文件,确保文件路径正确且可读。 - 单词分割:通过
split()方法将文件内容分割为单词列表,自动处理换行符和空格。 - 频率统计:使用字典统计每个单词的出现次数,支持键值对的自动统计。
- 结果输出:将统计结果输出为键值对形式,按键值对排序后逐个打印,方便查看频率。
代码实现
import sys
def count_frequency(file_path):
with open(file_path, 'r') as f:
content = f.read()
words = content.split()
freq = {}
for word in words:
freq[word] = freq.get(word, 0) + 1
sorted_words = sorted(freq.items())
for word, count in sorted_words:
print(f"{word}: {count}")
if __name__ == "__main__":
file_path = input("Enter file path: ")
count_frequency(file_path)
示例输出
"Hello": 1
"World": 1
总结
该程序实现了文本文件频率统计的功能,通过读取文本内容并分割为单词列表,统计每个单词的出现次数,并输出结果。程序的核心思想是利用Python的文件读取和字典统计技术,确保程序的高效性和可读性。该实现可以在1-3天内完成,符合题目要求,并提供明确的输出示例。