# 网络请求与数据处理：小型Web应用实现

背景介绍

本项目旨在通过Python实现一个小型Web应用，允许用户输入URL并自动抓取其HTML内容。该项目的核心功能是网络请求与数据处理，适用于网络编程基础学习项目。由于无需依赖外部服务或复杂框架，可直接在本地环境中运行，简化部署成本。

思路分析

本项目的核心思路是：
1. 网络请求：使用Python的requests库发送HTTP请求
2. 数据解析：通过BeautifulSoup解析HTML内容
3. 用户交互：将解析结果返回给用户

项目结构清晰，包含背景、思路、代码实现和总结，确保代码可运行，同时突出网络编程基础。

代码实现

import requests
from bs4 import BeautifulSoup

def fetch_html(url):
    try:
        # 发送GET请求
        response = requests.get(url, headers={"User-Agent": "Mozilla/5.0"})  
        response.raise_for_status()  # 跳过异常处理，直接输出内容

        # 解析HTML内容
        soup = BeautifulSoup(response.text, 'html.parser')  
        content = soup.find('html').find('body').text

        print("解析后的HTML内容：")
        print(content)

        return content

    except requests.exceptions.RequestException as e:
        print("请求失败，无法抓取HTML内容:", e)
        return None

# 示例使用
if __name__ == "__main__":
    url_input = input("请输入网址：https://www.example.com\n")
    result = fetch_html(url_input)
    if result:
        print("解析结果：")
        print(result)
    else:
        print("请求失败，无法抓取HTML内容。")

总结

本项目通过Python实现了一个小型Web应用，展示了网络请求与数据处理的核心功能。代码实现了以下功能：
1. 使用requests库发送GET请求
2. 使用BeautifulSoup解析HTML内容
3. 提供用户交互式输入功能

该实现可在本地环境运行，无需依赖外部服务，同时能够处理简单请求和内容解析任务。该项目不仅巩固了网络编程的基础知识，也为学习数据处理和网络编程提供了实践机会。

通过本项目，用户能够掌握如何实现网页抓取功能，理解HTTP请求处理和数据解析的逻辑。