西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 电脑软件 安卓软件 电脑游戏 安卓游戏 排行榜 专题合集

python爬取半次元图片源码

  • python爬取半次元图片源码
  • 软件大小:1KB
  • 更新时间:2019-07-24 16:41
  • 软件语言:中文
  • 软件厂商:
  • 软件类别:国产软件 / 免费软件 / 源码相关
  • 软件等级:3级
  • 应用平台:WinXP, Win7, win8
  • 官方网站:暂无
  • 应用备案:
好评:50%
坏评:50%

本类精品

软件介绍

python爬取半次元图片源码,由大神自制的python爬取工具,本源码针对半次元图片平台,可以爬取最新的网站图片资源,支持自定义保存目录,非常方便,需要requests库的支持,想要相关源码资源的朋友们不要错过哦!

python爬取半次元图片源码

python爬取半次元图片源码说明:

需要安装requests库,在运行脚本的文件夹下新建一个img文件夹

源码也可供大家学习和参考。

python爬取半次元图片源码一览:

import requests

import re

url = 'https://bcy.net/coser/toppost100'  # 要进行抓取的url

web_url = "https://bcy.net"  # 官方网站

file = 'img/'  # 文件的保存路径最后加反斜杠

headers = {

    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'

}

# 获取抓取数据页面

data = requests.get(url, headers=headers).text

wi_url_id = re.findall('<a href=".*?class="db posr ovf"', data)

# 对抓取图片单独页面url进行遍历

for s in wi_url_id:

    wi_id = web_url + s.lstrip('<a href="').rstrip('" class="db posr ovf"')

    n_data = requests.get(wi_id, headers=headers).text  # 获取单独的图片页面数据

    json_data = re.findall('"{.*?}"', n_data)[0].lstrip('"').rstrip('}}"')

    n_http = re.findall('"path.*?w650', json_data)

    # 对图片url进行遍历

    for b in n_http:

        try:

            img_data = b.lstrip('"path\\":\\"s') + '.image'

            img_url = 'https:/' + img_data.replace('u002F', '').replace('\\\\', '/')

            img = requests.get(img_url, headers=headers).content  # 获取图片数据

            img_name = img_url.rstrip('.jpg~tplv-banciyuan-w650.image')[-31:]  # 获取图片名

            # 对图片进行保存

            with open(file + img_name + '.jpg', 'wb') as f:

                f.write(img)

                print('以保存,图片url:' + img_url)

        except:

            print('保存失败')

python爬取相关视频:

软件截图

python爬取半次元图片源码

其他版本下载

发表评论

昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
TOP
软件下载