Python爬虫完整代码拿走不谢

1天前 • Python

对于新手做Python爬虫来说是有点难处的，前期练习的时候可以直接套用模板，这样省时省力还很方便。

使用Python爬取某网站的相关数据，并保存到同目录下Excel。

直接上代码：

import re
import urllib.error
import urllib.request

import xlwt
from bs4 import BeautifulSoup


def main():
    baseurl ="http://jshk.com.cn"

    datelist = getDate(baseurl)
    savepath=".\\jshk.xls"
    saveDate(datelist,savepath)

    # askURL("http://jshk.com.cn/")

findlink = re.compile(r'')
findimg = re.compile(r' 
   "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36"}
    request=urllib.request.Request(url,headers=head)
    html=""
    try:
        response=urllib.request.urlopen(request)
        html=response.read().decode("utf-8")
        # print(html)
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

    return html

def saveDate(datalist,savepath):
    workbook = xlwt.Workbook(encoding='utf-8')
    worksheet = workbook.add_sheet('电影',cell_overwrite_ok=True)
    col =("电影详情","图片","影片","评分","评价数","概况")
    for i in range(0,5):
        worksheet.write(0,i,col[i])
    for i in range(0,250):
        print("第%d条" %(i+1))
        data=datalist[i]
        for j in range(0,5):
            worksheet.write(i+1,j,data[j])

    workbook.save(savepath)



if __name__ == '__main__':
    main()
    print("爬取完毕")

直接复制粘贴就行。

若要更改爬取网站，则需要更改URL以及相应的html格式（代码中的“item”）。

本文来自网络，不代表协通编程立场，如若转载，请注明出处：https://net2asp.com/1b701b9fa5.html

python 开发语言爬虫爬虫入门爬虫基础

赞 (0)

YOLOv8（n/s/m/l/x）&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5（n/s/m/l/x）不同模型参数/性能对比（含训练及推理速度）

« 上一篇 1天前

干货文：在 Mac 中卸载 Python 的方式

下一篇 » 1天前

Can AI Assistants Know What They Don‘t Know?

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决的问题是：AI助手（基于大型语言模型LLMs）在面对知识密集型任务时，如何能够识别并表达它们不知道的问题。具体来说，论文探讨…

人工智能 1天前
人工智能

对话极睿科技创始人武彬：AI赋能时代，电商品牌如何拥抱新科技?

“ 今年的（市场规模）量级大概能翻 3 倍 ” 整理 | 圣雄编辑 | 小白出品｜极新 2023年，中国电商领域AI生成内容的市场规模已达4亿元，预计2024年还将保持3-…

1天前
算法结构

第十章 STM32+ESP8266接入机智云实现小型IOT智能家居项目

前言最近有不少小伙伴私信留言，想要我推出一章能够通过APP进行远程控制并获取传感器信息的实验教程。说实话在嵌入式毕设里边，这算是中等偏上水平的了。刚好我也有兴趣写写。全篇4700…

1天前
算法结构

初学stm32单片机可以做什么简单的小作品？

已从事单片机开发十几年，刚开始接触单片机时，感觉挺有意思。可以用自己的思维写程序，控制硬件去实现一些智能化的操作。刚点亮第一个LED，就开始幻想以后能做任何自己想要的产品，那感…

1天前
算法结构

蓝桥杯单片机零基础到国二经验分享

我参加的是第十三届蓝桥杯大赛，从最开始的零基础，毫无头绪，到拿下国二，颇有体会，在这里将我的备赛经验分享给大家,希望可以帮到一些正在备赛的蓝桥杯er 目录一. 蓝…

1天前
算法结构

一文读懂OTA【赠书活动｜第12期《一书读懂物联网：基础知识+运行机制+工程实现》】

2020年，特斯拉发布过一次OTA更新，车主可以通过这次系统更新获得座椅加热功能。当时，这则新闻震惊了车圈和所有车主，彼时的大家还没有把汽车当作可以“升级”的智能设备。如今3年过…

1天前
算法结构

【物联网】手把手完整实现STM32+ESP8266+MQTT+阿里云+APP应用——第3节-云产品流转配置

本节目标：本节目标是进行云产品流转配置为后面实际的手机APP的接入做铺垫。云产品流转配置的目的是为了后面能够让后面实际做出来的手机APP可以控制STM32/MCU，STM32/MC…

1天前
算法结构

开启物联网的魔法之门 – 深入探索发布/订阅模式

文章目录 MQTT 发布/订阅模式 MQTT 发布/订阅中的消息路由 MQTT 与 HTTP 请求响应 MQTT 与消息队列 Paho Java 使用示例结语 MQTT 发布/订…

1天前
算法结构

【好书推荐-第一期】《一书读懂物联网：基础知识+运行机制+工程实现》

😎 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公…

1天前
算法结构

Windows Server 2003 DNS服务器搭建

系列文章目录目录系列文章目录文章目录前言一、DNS服务器是什么？二、配置服务器 1.实验环境搭建 2.服务器搭建 3)安装Web服务器和DNS服务器 4)查看安装是否…

1天前