爬虫实例(一) —— 5行 Python 代码爬取

再度Miren
2023-03-06 / 0 评论 / 219 阅读 / 正在检测是否收录...


大家好,我是 Enovo飞鱼,今天分享一个爬虫小案例,小白或者爬虫入门的小伙伴推荐阅读,加油💪。

目录

前言

基本环境配置

爬取目标网站

爬取内容?

实现代码

后面我会继续更新爬虫实例,与大家共同学习!希望可以得到大家的支持🙇?



前言

入门爬虫很容易,几行代码就可以,可以说是学习 Python 最简单的途径。

刚开始动手写爬虫,你只需要关注最核心的部分,也就是先成功抓到数据,其他的诸如:下载速度、存储方式、代码条理性等先不管,这样的代码简短易懂、容易上手,能够增强信心。


基本环境配置

  • 版本:Python3

  • 系统:Windows

  • 相关模块:pandas、csv


爬取目标网站

爬取内容?

?


实现代码

配置好所需环境后,直接复制即可

import pandas as pd

for i in range(1,178):  # 爬取全部页
    tb = pd.read_html('http://s.askci.com/stock/a/?reportTime=2017-12-31&pageNum=%s' % (str(i)))[3]
    tb.to_csv(r'1.csv', mode='a', encoding='utf_8_sig', header=1, index=0)

运行代码结束,至此,3000+ 上市公司的信息,安安静静地躺在 Excel 中

A. Pycharm内打开

?


B. 根据路径打开excel


当然,如果你对 Excel 很熟悉的话 ,在 excel 内部也可以很简单的完成爬取上市公司企业数据。即,目前所被讨论的excel自动化,在这篇文章中,就不再讲述其他问题了,多多学习爬虫知识就好!💪

后面我会继续更新爬虫实例,与大家共同学习!希望可以得到大家的支持🙇?

34

评论 (0)

取消