rzaimx的gravatar头像
rzaimx 2019-03-02 23:02:30

python爬取前程无忧招聘网站数据及可视化分析

项目描述

从前程无忧招聘网站上进行网页抓取,提取各项数据,数据包含多个维度,分别是城市、岗位名称、公司名字、公司规模、公司类型、经验要求、学历要求、专业要求、福利待遇和所属行业等。对爬取的数据进行数据清洗及标准化后,实现数据分析和可视化。最后实践apriori算法,进行频繁项集提取及关联分析。

运行环境

python3.7  PyCharm

项目技术(必填)

python爬虫和可视化技术

是否原创(转载必填原文地址)

项目截图(必填)

python爬取前程无忧招聘网站数据及可视化分析

运行截图(必填)

python爬取前程无忧招聘网站数据及可视化分析python爬取前程无忧招聘网站数据及可视化分析

python爬取前程无忧招聘网站数据及可视化分析

python pi7.py

python爬取前程无忧招聘网站数据及可视化分析

python pi11.py

python爬取前程无忧招聘网站数据及可视化分析

python pi12.py

python爬取前程无忧招聘网站数据及可视化分析

注意事项

Traceback (most recent call last):
  File "pi1.py", line 11, in <module>
    from pyecharts import Geo  #地理图
ImportError: cannot import name 'Geo' from 'pyecharts' (D:\Program Files (x86)\Python 3.8.1\lib\site-packages\pyecharts\__init__.py)

python爬取前程无忧招聘网站数据及可视化分析

修改为

from pyecharts.charts import Geo  #地理图

最新抓取的解析方式有问题导致没法得到数据,请自行根据html dom格式解析


打赏

文件名:python爬虫.zip,文件大小:3733.17K 下载
  • /
      • /python爬虫
        • /python爬虫/apridata.csv
        • /python爬虫/data.csv
        • /python爬虫/datamining.csv
        • /python爬虫/test5.py
        • /python爬虫/test5_2.py
        • /python爬虫/test5_3.py
        • /python爬虫/test6.py
          • /python爬虫/清洗及可视化
            • /python爬虫/清洗及可视化/data.csv
最代码最近下载分享源代码列表最近下载
大神程序员  LV23 6月15日
chenranr  LV10 6月13日
zuidama_suche  LV1 5月15日
求学的熊猫  LV11 1月21日
tianshi  LV7 1月4日
淡凉123456  LV9 1月1日
KAIzx11  LV7 2023年12月24日
yyyy11  LV1 2023年12月16日
Yskysan  LV1 2023年12月6日
zcx12345678  LV6 2023年11月16日
最代码最近浏览分享源代码列表最近浏览
ilovecode521  LV3 8月4日
hychristo 6月27日
暂无贡献等级
chensir_ 6月25日
暂无贡献等级
时光海  LV2 6月23日
aslsjsjhdh 6月17日
暂无贡献等级
大神程序员  LV23 6月15日
chenranr  LV10 6月13日
mengmeng12323423  LV4 5月25日
fgfgh656 5月16日
暂无贡献等级
顶部 客服 微信二维码 底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友