### 标题:文本关键词统计与中文字数计算



背景介绍

在日常应用中,文本关键词统计是提升信息处理效率的重要环节。本项目通过过滤非中文字符,提取中文字符,并统计出现的关键词数量,实现了信息筛选与统计的目的。该任务要求仅统计中文字符的数量,忽略特殊符号,避免无关信息干扰。


思路分析

  1. 文本预处理
    首先需要从输入文本中过滤出非中文字符。使用正则表达式 [^\\w] 可以筛选掉所有非英文字符,保留仅包含中文字符的内容。

  2. 关键词提取
    统计文本中出现的中文字符,但需忽略特殊符号。这一步可以通过正则表达式匹配中文字符,统计其出现次数。例如,使用匹配方法提取所有中文字符,统计其出现的频率。

  3. 结果输出
    最终输出统计的关键词数量和中文字数。确保结果符合预期格式。


代码实现

function countKeywords(text) {
  // 过滤非中文字符
  const keywords = text.match(/[^\\w]/g);
  let count = 0;
  for (const word of keywords) {
    count++;
  }
  return count;
}

function countChineseCharacters(text) {
  const chinese = text.match(/[^\w]/g);
  let count = 0;
  for (const char of chinese) {
    count++;
  }
  return count;
}

// 示例输入
const input = "Hello world! This is a test.";
const resultKeywords = countKeywords(input);
const resultChinese = countChineseCharacters(input);

console.log(`关键词数量: ${resultKeywords}, 中文字数: ${resultChinese}`);

总结

本项目通过过滤非中文字符、提取关键词并统计其出现次数,实现了文本信息处理的高效化。代码实现清晰,可运行,确保结果准确反映中文字符的统计结果。该方法简单易行,适用于日常信息处理场景,学习价值显著。