用python爬取图片的代码_python列表

激活谷笔记 • 2026-04-12 09:10 • 阅读 28

爬取图片上的数据通常意味着从网页中提取图片的URL，然后下载这些图片。以下是使用Python进行图片爬取的基本步骤和示例代码：

导入所需库

python

import requests

import os

import urllib.request

发送HTTP请求获取网页内容

python

response = requests.get（url）

html = response.text

解析HTML内容找到图片URL

可以使用正则表达式或HTML解析库（如BeautifulSoup）来查找图片的URL。

下载图片并保存到本地

python

for image_url in image_urls:

image_name = os.path.basename（image_url）

save_path = os.path.join（save_dir, image_name）

urllib.request.urlretrieve（image_url, save_path）

完整示例代码

python

import requests

import os

import urllib.request

def download_image（url, save_dir）:

发送HTTP请求，获取网页内容

response = requests.get（url）

html = response.text

解析HTML内容，找到图片URL

这里可以使用正则表达式或BeautifulSoup库

假设找到的图片URL存储在一个列表中

image_urls = [

'http://example.com/image1.jpg',

'http://example.com/image2.jpg'

]

创建保存图片的文件夹

if not os.path.exists（save_dir）:

os.makedirs（save_dir）

下载图片并保存到本地文件夹

for image_url in image_urls:

image_name = os.path.basename（image_url）

save_path = os.path.join（save_dir, image_name）

urllib.request.urlretrieve（image_url, save_path）

使用第三方库

例如，使用`icrawler`库可以简化图片爬取过程：

python

from icrawler.builtin import BaiduImageCrawler, BingImageCrawler, GoogleImageCrawler

创建爬虫实例

baidu_crawler = BaiduImageCrawler（storage_path='./images', log_level=0）

开始爬取

baidu_crawler.start（）

请注意，在进行网页爬取时，应遵守网站的`robots.txt`文件规定，并尊重版权和隐私法律。此外，频繁的请求可能会给网站服务器带来负担，因此请合理控制爬取频率

用python爬取图片的代码_python列表

导入所需库

发送HTTP请求获取网页内容

解析HTML内容找到图片URL

下载图片并保存到本地

完整示例代码

使用第三方库

相关推荐