无忧启动论坛

标题: 已删除 [打印本页]

作者: 杨即心    时间: 2020-2-19 21:00
标题: 已删除
本帖最后由 杨即心 于 2021-1-23 09:09 编辑

已删除
作者: 横冲直撞520    时间: 2020-2-19 21:29
这样的美女看多了···
作者: gych    时间: 2020-2-19 22:26
很漂亮的壁纸,喜欢!感谢楼主持续分享美女与花儿系列!
作者: 小腿蚂蚁    时间: 2020-2-20 08:52
感谢楼主分享。
作者: 不落的太阳    时间: 2020-2-20 09:22
i vb rhf kc
作者: dszsdyx    时间: 2020-2-20 10:54
欧洲人的身材讲真。真的比东方女孩儿要好的多。但这身上的味儿实在是太大了。
作者: 神渔风之彩    时间: 2020-2-20 11:37
感谢分享。
作者: dvs909    时间: 2020-2-20 12:13
import requests
from lxml import etree


# 设计模式 --》面向对象编程
class Spider(object):
    def __init__(self):
        # 反反爬虫措施,加请求头部信息
        self.headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36",
            "Referer": "https://www.mzitu.com/xinggan/"
        }

    def start_request(self):
        # 1. 获取整体网页的数据 requests
        for i in range(1, 204):
            print("==========正在抓取%s页==========" % i)
            response = requests.get("https://www.mzitu.com/page/"+ str(i) + "/", headers=self.headers)
            html = etree.HTML(response.content.decode())
            self.xpath_data(html)

    def xpath_data(self, html):
        # 2. 抽取想要的数据 标题 图片 xpath
        src_list = html.xpath('//ul[@id="pins"]/li/a/img/@data-original')
        alt_list = html.xpath('//ul[@id="pins"]/li/a/img/@alt')
        for src, alt in zip(src_list, alt_list):
            file_name = alt + ".jpg"
            response = requests.get(src, headers=self.headers)
            print("正在抓取图片:" + file_name)
            # 3. 存储数据 jpg with open
            try:
                with open(file_name, "wb") as f:
                    f.write(response.content)
            except:
                print("==========文件名有误!==========")


spider = Spider()
spider.start_request()
作者: 杨即心    时间: 2020-2-20 12:24
dvs909 发表于 2020-2-20 12:13
import requests
from lxml import etree

哥,有问题?
作者: gtc    时间: 2020-2-20 14:41
赏心悦目!
作者: hfxiang    时间: 2020-2-20 14:49
爱美之心人皆有之
作者: 皈依    时间: 2020-2-20 14:53
不错,感谢分享!
作者: tyhsg    时间: 2020-2-20 15:33
哈哈,感谢分享
作者: yanglinman    时间: 2020-2-20 15:56
谢谢分享,赏心悦目呀,少了点 !
作者: 西门庆歌    时间: 2020-2-20 16:11




作者: 时光漫步    时间: 2020-2-20 16:17
谢谢分享!
作者: 鲧尧    时间: 2020-2-20 17:31
谢谢分享
作者: 小狐丸    时间: 2020-2-21 14:28

谢谢分享,资源真不错!
作者: dvs909    时间: 2020-2-24 19:53
杨即心 发表于 2020-2-20 12:24
哥,有问题?

兄弟你发的图太好了,高清不占空间,我也贡献下私藏的趴图的python代码
作者: woaiwodelaopo    时间: 2020-3-30 11:16
谢谢分享
作者: ahwwy    时间: 2020-3-30 11:59
dszsdyx 发表于 2020-2-20 10:54
欧洲人的身材讲真。真的比东方女孩儿要好的多。但这身上的味儿实在是太大了。

啥味?骚味重?




欢迎光临 无忧启动论坛 (http://wuyou.net/) Powered by Discuz! X3.3