实现某东商城某商品评论数据的爬取（评论数据不少于100条，包括评论内容、时间和评分）-哆哆盘-网站源码、建站教程、各类软件、网络资讯!

84bfb77877b84c5cb8823ec40abddd7a.png 实现某东商城某商品评论数据的爬取（评论数据不少于100条，包括评论内容、时间和评分） nbsp page score 第1张

源码：

import requests
import csv
from time import sleep
import random

item_id = input("请输入商品ID：")
def main(page,f):
    url = 'https://club.jd.com/comment/productPageComments.action'
    params = {
        'productId': item_id,
        'score': 0,
        'sortType': 5,
        'page': page,
        'pageSize': 10,
        'isShadowSku': 0,
        'fold': 1
    }
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.35 Safari/537.36',
        'referer': 'https://item.jd.com/'
    }
    resp = requests.get(url,params=params,headers=headers).json()
    comments = resp['comments']
    for comment in comments:
        content = comment['content']
        content = content.replace('\n','')
        comment_time = comment['creationTime']
        score = comment['score']
        print(score,comment_time,content)
        csvwriter.writerow((score,comment_time,content))
    print(f'第{page+1}页爬取完毕')
 
if __name__ == '__main__':
    with open('04.csv','a',encoding='utf-8',newline='')as f:
        csvwriter = csv.writer(f)
        csvwriter.writerow(('评分','评论时间','评论内容'))
        for page in range(2):#（）内为采集页数
                main(page,f)
                sleep(5+random.random())

相关推荐