相关动态
最全Python爬虫入门教程28:爬取微博热搜榜并做动态数据展示(1),2024年最新渣本逆袭大厂面经分享
2024-11-10 16:54

(1)Python所有方向的学习路线(新版

最全Python爬虫入门教程28:爬取微博热搜榜并做动态数据展示(1),2024年最新渣本逆袭大厂面经分享

这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

最近我才对这些路线做了一下新的更新,知识体系更全面了。

在这里插入图片描述

(2)Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

(3)100多个练手项目

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。

在这里插入图片描述

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导,让我们一起学习成长

PS:如有需要 以及 的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

基本开发环境💨


  • Python 3.6

  • Pycharm

相关模块的使用💨


import requests

import parsel

import csv

import time

安装Python并添加到环境变量,pip安装需要的相关模块即可。

💥需求数据来源分析


在这里插入图片描述

热搜榜数据, 每次刷新上面的热度数值都是会发生边改变,每隔一段时间可以爬取一下榜单数据,然后可以做一个数据展示。

热搜榜数据内容还是比较好爬的, 因为是静态网页数据内容, 如果大家有认真看过之前的问题,那么这个网站还是很好爬取的。

在这里插入图片描述

💥代码实现


每一分钟爬取一次数据内容

import requests

import parsel

import csv

import time

f = open(‘热榜.csv’, mode=‘a’, encoding=‘utf-8’, newline=‘’)

csv_writer = csv.DictWriter(f, fieldnames=[

‘时间’,

‘排名’,

‘标题’,

‘热度’,

])

csv_writer.writeheader()

while True:

now_time = int(time.time())

timeArray = time.localtime(now_time)

date = time.strftime(“%Y-%m-%d %H:%M:%S”, timeArray)

url = ‘https://s.weibo.com/top/summary?cate=realtimehot’

headers = {

‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36’,

}

response = requests.get(url=url, headers=headers)

selector = parsel.Selector(response.text)

trs = selector.css(‘#pl_top_realtimehot tbody tr’)[:11]

for tr in trs:

num = tr.css(‘td.td-01.ranktop::text’).get()

if num:

if num.isdigit():

title = tr.css(‘.td-02 a::text’).get()

hot = tr.css(‘.td-02 span::text’).get()

dit = {

‘时间’: date,

‘排名’: num,

‘标题’: title,

‘热度’: hot,

}

print(dit)

csv_writer.writerow(dit)

time.sleep(60)

💥动态数据展示


tl = Timeline()

for i in range(20):

bar = (

Bar()

.add_xaxis(list(data[‘标题’])[i10:i10+10][::-1])

.add_yaxis(“微博热搜榜”, list(data[‘热度’])[i10:i10+10][::-1])

.reversal_axis()

.set_global_opts(

title_opts=opts.TitleOpts(“{}”.format(list(data[‘时间’])[i*10]),pos_right=‘0%’,pos_bottom=‘15%’),

xaxis_opts=opts.AxisOpts(

splitline_opts=opts.SplitLineOpts(is_show=True)),

yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True),

axislabel_opts=opts.LabelOpts(color=‘#FF7F50’)),)

.set_series_opts(label_opts=opts.LabelOpts(position=“right”,color=‘#9400D3’))

)

grid = (

Grid()

.add(bar, grid_opts=opts.GridOpts(pos_left=“25%”,pos_right=“0%”))

)

tl.add(grid, “{}年”.format(i)) #设置标签

tl.add_schema(

最后

🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。 🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。 🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。 🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

    以上就是本篇文章【最全Python爬虫入门教程28:爬取微博热搜榜并做动态数据展示(1),2024年最新渣本逆袭大厂面经分享】的全部内容了,欢迎阅览 ! 文章地址:http://dh99988.xhstdz.com/news/897.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://dh99988.xhstdz.com/mobile/ , 查看更多   
最新文章
百度营销黑帽seo【百度seo营销公司】
在当今数字化的时代,搜索引擎优化(SEO)已经成为了企业网站推广的重要手段,百度作为中国(黑帽seo)的搜索引擎,拥有庞大的用户
1000亿美元!微软与OpenAI的“AI超级霸权”野心
财联社及科创板日报旗下产品——未来已来,AI前沿,独家、深度、专业!
Wordpress哪个主题对SEO和页面速度友好,谷歌排名高?
在我多年的网站建设与优化实践中,我发现选择一个合适的WordPress主题对于网站的SEO表现和页面速度至关重要。特别是在谷歌这样的
'智能AI文案助手:一键快速生成创意内容的软件工具'
随着人工智能技术的不断发展在各个领域的应用日益广泛。在内容创作领域一键生成文案的软件逐渐崭露头角成为众多创意工作者的得力
Rank Math新手教程指南:最佳Wordpress排名插件2024
Rank Math是一款功能强大的WordPress SEO插件,旨在帮助网站管理员和博主优化他们的网站以提高在搜索引擎中的排名。它提供了全面
数字艺术革命:3D虚拟展览,为艺术爱好者打开新世界
nbsp;nbsp;nbsp;nbsp;便利性:无界限的艺术探索,3D虚拟艺术展览通过高质量的3D扫描技术,将实体艺术品转化为
AI智能营销领域的卓越引领者
作为 AI 智能营销业务的先锋企业,专注于为客户打造智能化的营销解决方案,助力其在激烈的市场竞争中脱颖而出。我们的核心优势在
百度蜘蛛池收录:揭秘蜘蛛池做排名解析技巧,助力网站快速崛起
揭秘蜘蛛池收录技巧,解析如何利用蜘蛛池快速提升网站排名,助力网站快速崛起。本文目录导读:了解蜘蛛池蜘蛛池做排名解析技巧随
网站排名优化,专治周a斯受欢迎的秘诀
网站排名优化是提升网站在搜索引擎中排名的关键。针对周a斯受欢迎的秘诀,关键在于提供高质量、有价值的内容,同时注重网站结构
相关文章