亚洲 国产精品 日韩-亚洲 激情-亚洲 欧美 91-亚洲 欧美 成人日韩-青青青草视频在线观看-青青青草影院

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > Scrapy與Selenium完美結合獲取小紅書漲粉榜單

Scrapy與Selenium完美結合獲取小紅書漲粉榜單

來源:千鋒教育
發布人:wjy
時間: 2022-06-07 09:51:00 1654566660

  Scrapy框架與Selenium我們前面都介紹過,本次給大家分享的是兩者如何配合使用。

  本次我們獲取千瓜的數據:http://www.qian-gua.com/rank/category/

Scrapy與Selenium完美結合獲取小紅書漲粉榜單111

 

  不好意思!接下來這個頁面你會很郁悶!

Scrapy與Selenium完美結合獲取小紅書漲粉榜單133

 

  我們想獲取更多的日榜達人的數據怎么操作?借助selenium哦!為了獲取更多我們結合Scrapy完成此次的爬蟲任務。

  任務要求:

  Python3環境

  Scrapy框架

  Selenium 可以參照https://selenium-python-zh.readthedocs.io/en/latest/

  谷歌瀏覽器+ChromeDriver

  ChromeDriver的下載地址:https://chromedriver.storage.googleapis.com/index.html

  首先我們創建項目:scrapy startproject qiangua_spider

  然后進入qiangua_spider目錄下,執行:scrapy genspider qiangua qian-gua.com

  在Pycharm中打開創建的項目,目錄結構如下:

Scrapy與Selenium完美結合獲取小紅書漲粉榜單510

 

  修改settings.py文件ROBOTSTXT_OBEY 為 False

  編寫items.py文件內容如下:

Scrapy與Selenium完美結合獲取小紅書漲粉榜單569

 

  代碼如下:

import scrapy

class QianguaSpiderItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    level = scrapy.Field()
    fans = scrapy.Field()
    likeCollect = scrapy.Field()

  編寫spider.py爬蟲文件,如果不登陸我們是無法看的更多的小紅書達人們的賬號排行、漲粉等信息。如果想看的更多則需要登陸才可以。

  流程與思路:

  先進入http://www.qian-gua.com/rank/category/

  點擊右上角的登陸(此過程需要有千瓜的賬號才可以)

  有兩種登陸方式,我們可以選擇微信掃碼登陸,或者手機登陸(本案例采用手機登陸)

  獲取登陸的Cookies

  保存Cookies并訪問

  http://api.qian-gua.com/Rank/GetBloggerRank?pageSize=50&pageIndex=頁碼數&dateCode=20211104&period=1&originRankType=2&rankType=2&tagId=0&_=時間戳

  得到json數據并解析數據

  在上述的流程中1-4,我們都是結合selenium完成的。

  代碼如下

import json
import time
import scrapy
from selenium import webdriver
from qiangua_spider.items import QianguaSpiderItem


class QianguaSpider(scrapy.Spider):
    name = 'qiangua'
    allowed_domains = ['www.qian-gua.com']
    # start_urls = ['http://www.qian-gua.com/rank/category/']

    headers = {
        'Origin': 'http://app.qian-gua.com',
        'Host': 'api.qian-gua.com',
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Safari/605.1.15'
    }

    def start_requests(self):
        driver = webdriver.Chrome()
        url = 'http://www.qian-gua.com/rank/category/'
        driver.get(url)
        driver.implicitly_wait(5)
        driver.find_element_by_xpath('//div[@class="loggin"]/a').click()
        time.sleep(2)
        driver.find_element_by_xpath('//div[@class="login-tab"]/span[2]').click()
        driver.find_element_by_xpath('//input[@class="js-tel"]').send_keys('15010185644')
        driver.find_element_by_xpath('//input[@class="js-pwd"]').send_keys('qiqining123')
        driver.find_element_by_xpath('//button[@class="btn-primary js-login-tel-pwd"]').click()
        time.sleep(2)
        cookies = driver.get_cookies()
        driver.close()

        jsonCookies = json.dumps(cookies)  # 通過jsoncookies寫入文件
        with open('qianguaCookies.json', 'w') as f:
            f.write(jsonCookies)
        print(cookies)
        with open('qianguaCookies.json', 'r', encoding='utf-8') as f:
            listcookies = json.loads(f.read())  # 獲取cookies

        cookies_dict = dict()
        for cookie in listcookies:
            # 在保存成dict時,我們其實只要cookies中的namevalue,而domain等其他都可以不要
            cookies_dict[cookie['name']] = cookie['value']
# 更多的數據需要開通會員才可以,我們當前獲取了top30的數據
        for page in range(1, 2):
            t = time.time()
            timestamp = str(t).replace(".", '')[:13]
            data_url = "http://api.qian-gua.com/Rank/GetBloggerRank?pageSize=50&pageIndex=" + str(
                page) + "&dateCode=20211104&period=1&originRankType=2&rankType=2&tagId=0&_=" + timestamp

            yield scrapy.Request(url=data_url, cookies=cookies_dict, callback=self.parse, headers=self.headers)

    def parse(self, response):
        rs = json.loads(response.text)
        if rs.get('Msg')=='ok':
            blogger_list = rs.get('Data').get("ItemList")
            for blogger in blogger_list:
                name = blogger.get('BloggerName')
                level = blogger.get('LevelName','')
                fans = blogger.get('Fans')
                likeCollect = blogger.get('LikeCollectCount')
                item = QianguaSpiderItem()
                item['name'] = name
                item['level'] = level
                item['fans'] = fans
                item['likeCollect'] = likeCollect
                yield item

  最后我們添加pipelines.py保存解析的數據,我們是將數據保存到csv文件中

  代碼如下:

import csv
from itemadapter import ItemAdapter


class QianguaSpiderPipeline:
    def __init__(self):
        self.stream = open('blogger.csv', 'w', newline='', encoding='utf-8')
        self.f = csv.writer(self.stream)

    def open_spider(self, spider):
        print("爬蟲開始...")

    def process_item(self, item, spider):
        data = [item.get('name'), item.get('level'), item.get('fans'), item.get('likeCollect')]
        self.f.writerow(data)

    def close_spider(self, spider):
        self.stream.close()
        print('爬蟲結束!')

  務必記得將settings.py中pipelines部分的代碼注釋取消掉

ITEM_PIPELINES = {
   'qiangua_spider.pipelines.QianguaSpiderPipeline': 300,
}

  執行爬蟲

  scrapy crawl qiangua

  結果很令我們滿意

Scrapy與Selenium完美結合獲取小紅書漲粉榜單4773

 

更多關于python培訓的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓服務經驗,采用全程面授高品質、高體驗培養模式,擁有國內一體化教學管理及學員服務,助力更多學員實現高薪夢想。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
草草影院CCYYCOM| 久拍国产在线观看| 国内少妇毛片视频| 啊灬啊灬啊灬啊灬高潮了| 五月天天爽天天狠久久久综合| 久别的草原在线看视频免费| 中央气象台1一7天降水量预报图| 欧美黑人成人www在线观看| 当着老公的面被别人欺负该怎么办 | 亚洲真人无码永久在线观看| 免费韩国漫画网站观看| 国精品午夜福利视频不卡| 成人欧美一区二区三区视频| 中国农村熟妇性视频| 无码热综合无码色综合| 人人人澡人人人妻人人人精品| 国内精品视频在线观看九九| 德国FREE性VIDEO极品| 一二三四在线视频社区8| 亚洲AV成人网人人蜜臀| 三个医生换着躁我一个| 久久超碰97人人做人人爱| 国产精品免费观看调教网| 成人艳情一二三区| 中文字幕一区二区三区日韩精品 | 国产AV熟女一区二区三区 | 秋霞在线看片无码免费| 乱老熟女成熟50ⅩXXX小| 久久精品国产9久久综合| 国产JIZZJIZZ麻豆全部免| 777琪琪午夜理论电影网| 主人给我戴上奶牛榨乳器调教| 野花香高清视频在线观看免费 | 亚洲性无码AV在线DVD| 亚洲免费成人av| 亚洲AV婷婷五月产AV中文| 无码专区6080YY电影| 午夜亚洲AⅤ无码高潮片苍井空| 人人妻人人澡人人爽人人精品电影| 欧美 日韩 国产 亚洲 色| 欧美A片XⅩX黑人性受| 女人被男人吃奶到高潮| 欧美 狠狠操 888| 日本无人区码一二三区别| 肉色超薄丝袜脚交一区二区| 欧美性大战久久久久久久| 日本护士毛茸茸高潮| 欧美三级一区二区| 女人两腿扒开图片大全| 美丽人妻被按摩中出中文字幕| 好爽好紧好大的免费视频国产 | 麻豆文化传媒精品观看网站| 人与善交XUANWEN18| 亚州少妇无套内射激情视频| 用舌头去添高潮无码视频| 被老外添嫩苞添高潮NP电影| 国内精品一线二线三线黄| 欧美精品久久天天躁| 午夜影视免费观看2023| 综合图区亚洲另类偷窥| 国产精品人人做人人爽人人添| 浪荡受NP纯肉公共场合BL男男| 少妇高潮喷水惨叫久久久久电影 | 精品国模一区二区三区| 强伦姧人妻三上悠亚中文字幕| 性 偷窥 间谍 tube| JAPANESE娇小侵犯| 激情影视乱码AV| 搡老女人老91妇女老熟女oo| 一区二区三区AV高清免费波多| 国产VIVODESHD精品| 欧美午夜性春猛交ⅩXXX| 亚州v不卡ww在线| JAPANESE VISA教师| 久久99精品久久久久久秒播| 午夜AV无码福利免费看网站 | 欧妇女乱妇女乱视频| 亚洲成AV成人片在线观看| 豆奶视频在线观看免费高清版| 鲁一鲁一鲁一鲁一澡| 亚洲AV无码一区二区二三区我 | 強暴強姦AV正片一区二| 亚洲国产成人久久精品软件| 国产成人MV在线播放| 欧美群妇大交乱视| 又嫩又紧欧美12P| 精品国产一区二区三区吸毒| 四虎影库最新地址| FREE性欧美18ⅩXOO极品| 精品亚洲AⅤ无码午夜在线| 无码人妻精品一区二区桃蜜| 宝宝把腿抬起来靠墙上C | 夜夜爽一区二区三区精品| 国产另类TS人妖一区二区| 少妇侧入内射一区二区| GOGO全球高清大尺度视频| 蜜桃视频一区二区三区| 一区二区伊人久久大杳蕉| 精产国品一二三产区区| 亚洲精品美女久久久久99| 和人妻隔着帘子按摩中字| 亚洲国产精品成人网址天堂| 国产在线无码精品电影网| 无码字幕AV一区二区三区| 国产亚洲欧美精品一区| 天天AV天天翘天天综合网| 高H乱好爽要尿了潮喷了| 少妇性饥渴VIDEOS| 国产99网站免在线观看| 日韩中文高清在线专区| 啊~用力CAO我CAO死我视频| 欧美性猛交XXXX乱大交| 7777精品伊人久久久大香线蕉| 久久天堂AV综合合色蜜桃网| 亚洲欧美黑人深喉猛交群| 久久综合噜噜激激的五月天| 无码一区18禁3D| 国产A级三级三级三级| 少妇被粗大的猛烈的进出69影院| 余生请多指教在线观看免费全集| 免费无码成人AV在线播放| YY111111少妇影院无码老司机 | GOGO高清大胆全人艺术| 色老板在线永久免费视频| 国产成人18黄网站| 他将头埋进双腿间吮小核| 白嫩白嫩BBBBBBBBB-| 精品高朝久久久久9999| 天码人妻一区二区三区| 八戒八戒神马2021| 女人18片毛片60分钟完整版| 曰韩亚洲AV人人夜夜澡人人爽| 狠狠久久亚洲欧美专区| 无码精品人妻一区二区三区影院| JAZZJAZZJAZZ日本| 男j插女p无遮挡100%| 永久免费AV网站| 免费A级毛片无码免费视频首页| 亚洲女久久久噜噜噜熟女| 国产无人区码一码二码三MBA| 丝袜美腿一区二区三区| 处 女 开 破视频处CT开| 日韩精品卡2卡3卡4卡5| JIZZYOU中国少妇高潮| 青青草原精品99久久精品66| 77777亚洲午夜久久多人| 内射极品少妇一区二区AV| 中文精品久久久久国产| 老外粗猛长爽的视频| 国产高潮刺激叫喊视频| 无码超乳爆乳中文字幕久久| 久久97久久97精品免视看| 99国产精品自在自在久久| 男男av在线播放| 中国孕妇变态孕交XXXX| 九九99久久精品国产| 亚洲AV无码成人精品区毛片| 国产精品亚洲综合一区在线观看| 无码av无码免费一区二区毛片| 国产成人综合在线观看不卡| 无套内谢孕妇毛片免费看看| 国精产品一区一区三区糖心| 亚洲丰满熟女一区二区V| 久99久热爱视频精品免费37| 已婚少妇美妙人妻系列| 亚洲丰满熟妇浓毛XXXX| 无码人妻久久一区二区三区免费 | 国产又黄又爽胸又大免费视频| 亚洲色成人一区二区三区| 欧美噜噜久久久XXX| 国产成人拍精品视频午夜网站 | YY111111少妇影院理论片| 玩弄丰满熟妇XXXXX性HD| 精品久久人人爽人人玩人人妻 | 亚洲一线产区二线产区区别在哪里 | 国产成A人亚洲精V品无码| 亚洲人成绝费网站色WWW吃脚| 欧美和日本操逼视频| 国产精品99久久久久久宅男小说 | 亚洲AV无码成人精品区蜜桃| 蜜臂无码AV在线| 国产成人无码AV| 亚洲自偷自拍另类小说| 日韩欧美国产精品亚洲二区| 精品人妻在线一区二区三区 | 人与动人物XXXXAV片| 国内少妇高潮嗷嗷叫在线播放| 24种男女插秧法| 无码人妻久久久一区二区三区免费 | 精品毛卡卡1卡2卡3麻豆| WWW久久无码天堂MV| 亚洲AV日韩AV无码污污网站| 欧美VIDEO性欧美熟妇| 国产放荡对白视频在线观看| 伊人久久大香线蕉午夜AV| 熟妇人交VIDEOS复古| 乱中年女人伦AV二区| 国产精品无码久久久久久久久久| 中文字幕AV无码不卡免费| 无遮无挡爽爽免费毛片|