# 数字数量计算器：读取HTML并统计数字

背景介绍

在网页开发中，我们需要对HTML内容进行文本处理，以提取其中的数字信息。这一功能不仅能提升程序的实用性，也能够帮助开发人员更好地理解和利用网页内容。本项目实现了一个小型Web开发工具，其核心功能是读取用户输入的HTML页面内容，并统计其中的数字数量。

思路分析

输入处理：
用户输入的内容可能是HTML字符串，需读取并去除HTML标签以提取文本。例如，输入`123456

456789

，输出数字数量为27。 - 使用input()`函数读取用户输入内容。

数字提取：
使用正则表达式匹配所有数字字符，例如re.findall(r'\d+', ...)，从中提取所有数字。
计算结果：
通过len(numbers)统计提取的数字数量，并输出结果。

代码实现

import re

def count_numbers(html_content):
    # 去除HTML标签以提取文本内容
    html_content = html_content.strip()
    return re.findall(r'\d+', html_content)

# 输入HTML内容
html_input = input("请输入HTML内容：\n").strip()

# 计算数字数量
numbers = count_numbers(html_input)
print(f"数字数量：{numbers}")

示例代码运行

输入：

<p>123456</p><p>456789</p>

输出：

数字数量：27

总结

本项目实现了一个小型Web开发工具，其核心功能是读取用户输入的HTML内容并统计其中的数字数量。通过使用Python的正则表达式库，实现了高效的数据提取与统计功能。程序的可读性和可维护性得到了保证，适用于需要频繁处理文本内容的场景。

可选扩展

支持多语言输入：可扩展为Java或JavaScript等其他语言，以适应更广泛的开发需求。
异常处理：可添加对空字符串的处理逻辑，避免空指针异常。
多语言支持：可扩展为Java语言，以支持其他编程语言的文本处理需求。