Python 爬取与反爬取

最新推荐文章于 2025-03-17 11:59:19 发布

小浪浪、

最新推荐文章于 2025-03-17 11:59:19 发布

阅读量694

点赞数 1

分类专栏： educoder 算法竞赛 python 文章标签： python 网络爬虫

本文链接：https://blog.csdn.net/xiaolanglang_/article/details/123839984

版权

算法竞赛同时被 3 个专栏收录

70 篇文章

订阅专栏

educoder

27 篇文章

订阅专栏

python

6 篇文章

订阅专栏

任务描述

本关任务：编写一个爬虫，实现对知乎 - 有问题，就会有答案该网址所有信息的爬取，并将结果保存在 step3/result.txt 中。

编程要求

请仔细阅读右侧代码，结合相关知识，在 Begin-End 区域内进行代码补充，实现对知乎 - 有问题，就会有答案该网址所有信息的爬取，并将结果保存在 step3/result.txt 中。

测试说明

平台会对你编写的代码进行测试：

预期输出：
采集成功

import urllib.request
def spider():
    url="https://www.zhihu.com/"
    # ********** Begin **********#
    # 构建opener
    opener = urllib.request.build_opener()
    # User-Agent设置成浏览器的值
    User_Agent = (
        'User-agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')
    # 将UA添加到headers中
    opener.addheaders = [User_Agent]
    urllib.request.install_opener(opener)
    data = urllib.request.urlopen(url).read().decode("utf-8", "ignore")
    with open('step3/result.txt', 'a') as fp:
        fp.write(data)
    # ********** End **********#
    return data