(源自《实用数据分析》(原书第2版),网站更新后原文代码不能用了所以自己写了个小爬虫)
1.网页分析
开发人员工具(F12)用自带的元素定位

查看到该内容的两个标签 <class="asset ask"> 和 <class="value">
2.代码部分
2.1 导入资料库
from bs4 import BeautifulSoup
import urllib.request
from time import sleep
from datetime import datetime
1.Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.

本文通过Python的BeautifulSoup和urllib.request库,实现了从网站https://www.gold.org/抓取黄金现货价格。首先进行网页分析,确定目标标签,然后编写代码伪装浏览器请求,查找并提取数据,最后将获取的价格信息写入文件,并设置为每分钟更新一次。

最低0.47元/天 解锁文章
793

被折叠的 条评论
为什么被折叠?



