python爬取照片_爬虫抓取图片

激活谷笔记 • 2025-01-01 09:12 • 阅读 22

要使用Python爬虫获取图片，你可以按照以下步骤操作：

安装必要的库

确保你已经安装了`requests`和`Pillow`库。如果没有安装，可以使用以下命令进行安装：

 pip install requests pip install Pillow

导入库

在Python脚本中导入所需的库：

 import requests from bs4 import BeautifulSoup from PIL import Image from io import BytesIO

获取网页内容

使用`requests`库获取目标网站的HTML内容：

 url = 'https://example.com' 替换为你的目标网站URL response = requests.get（url） html_content = response.text

解析HTML

使用`BeautifulSoup`解析HTML内容，找到图片的URL：

 soup = BeautifulSoup（html_content, 'html.parser'） image_urls = [img['src'] for img in soup.find_all（'img'） if 'src' in img.attrs]

下载图片

遍历找到的图片URL，使用`requests`库下载图片，并将它们保存到本地存储中：

 for image_url in image_urls: image_response = requests.get（image_url） image_data = image_response.content image_name = image_url.split（'/'）[-1] 获取图片文件名 with open（f'images/{image_name}', 'wb'） as f: f.write（image_data）

显示图片（可选）：

使用`Pillow`库从二进制数据创建图像对象，并使用`show（）`方法在屏幕上显示图像：

 for image_url in image_urls: image_response = requests.get（image_url） image_data = image_response.content image = Image.open（BytesIO（image_data）） image.show（）

请注意，在爬取图片时，要遵守目标网站的`robots.txt`文件规定，并尊重版权和隐私法律。此外，有些网站可能需要你设置合适的`User-Agent`和可能包含`Cookie`信息来模拟浏览器访问。

python爬取照片_爬虫抓取图片

安装必要的库

导入库

获取网页内容

解析HTML

下载图片

相关推荐