python如何爬取网页图片
要使用Python爬取网页图片,可使用requests库来发送HTTP要求,然后使用beautifulsoup库还是正则表达式来解析网页内容,最后使用urllib库来下载图片。
下面是一个简单的示例代码,可以爬取指定网页的所有图片并保存到本地:
```python
import requests
from bs4 import BeautifulSoup
import urllib
# 发送HTTP要求
response = requests.get('http://example.com')
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的图片标签
img_tags = soup.find_all('img')
# 下载图片
for img_tag in img_tags:
# 获得图片URL
img_url = img_tag['src']
# 下载图片并保存到本地
urllib.request.urlretrieve(img_url, 'image.jpg')
```
需要注意的是,上述代码只能下载网页中第一个图片,并且没有对毛病进行处理。在实际利用中,可能需要处理多张图片和异常情况,例如使用循环来下载所有图片,添加异常处理等。
另外,还可使用第三方库如Scrapy来更方便地实现图片爬取功能。
TOP