博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
374名10万+知乎大V(一):相互关注情况
阅读量:6670 次
发布时间:2019-06-25

本文共 989 字,大约阅读时间需要 3 分钟。

一、前言

两个月前,今日头条签约了300多名知乎大V,随后引发广大关注和讨论,具体可见:
现在虽然热度已消逝,但一些困惑依然存在,到底知乎有多少大V(此处以“10万关注为标准”),他们都是谁?彼此的关注情况如何?存不存在亲疏远近,乃至抱团的情况......
正所谓有人的地方就有江湖,挖掘下上述数据,或许能窥见到不一样的知乎大V生态圈。

二、爬虫思路

本回以知乎第一大V张佳玮为种子ID,爬取其关注的85名用户,再依次爬取各自的关注列表,几层下去,获得几十万用户ID及相互关注情况,其中10万以上关注数的共有374人,1万以上关注数的有4139人。下图便是张公子所关注的用户:
继续用 绘制成“跳棋”样:
两个月前也爬取过知乎数据: ,本回发现反爬变得严格多了,此处先不做展开。

三、Gephi绘制关注图谱

获取得到374名知乎大V和25090条关注的数据后,依旧选择用开源网络分析和可视化神器“Gephi”来绘制大V们的关注图谱。
由于此前已用过一次,操作过程基本与上回相同,不再赘述,可按照英文操作一步步进行:
虽然本次研究从1万+小V的16万条关注情况,聚焦到10万+大V的2.5万条关注情况,但由于总共就374名大V,人均有67条关注,还是有点密集。
运行算法后网络图谱有所分离,但最后的成果图依旧和上次一样不算很满意。闲言少叙,多图预警。
先来个GIF动图,看看大V们在一开始是如何的如胶似漆、厮混作一团的:
运行老半天后,图形不再有明显变化:
看到最后成果是这么一团网络也是一口老血吐在上面:
所有的节点情况:
一小部分节点和边,轮子哥 已经出现,求带逛:
一步步增加节点和边:
中心区域,关注情况(边的数量)逐渐加重:
一眼看到了在上面的程浩:伯爵在城堡。R.I.P.:
底部的还有:
最终的成果图差不多就是这样。由于关注和被关注混在了一起;网络也不够分散,后续可能需要继续筛选出更精华、更少的数据,来绘制更直观的图谱,本次先简单的放放图,具体的解读,可以大家自行进行。还是能看到平时互相点赞的大V确实在图谱里非常靠近的。
另外绘制了七种颜色的图谱,大概是又一次被Gephi搞得吐血,只能填几个色,安慰自己了。逃...就不放图坑流量了。

四、小结

没有分析,没有解读,没有小结,放完图就跑了。想要知乎数据、想要Gephi(薛定谔的官网下载)、想要图表的......

转载地址:http://jilxo.baihongyu.com/

你可能感兴趣的文章
CheckException和RuntimeException
查看>>
文件读取与转换
查看>>
标签嵌套规则
查看>>
类的内建函数和用来定制类的特殊方法
查看>>
flash sin~~
查看>>
作业三(雷松)
查看>>
ireport如何拼接sql?
查看>>
Redis集群架构
查看>>
POJ3617 Best Cow Line【水题】
查看>>
B00005 函数atoi()(去空格,带符号)
查看>>
Bootstrap 简介: 创建响应式、移动项目的工具
查看>>
gulp的流与执行顺序
查看>>
8_任意系统命令执行
查看>>
分享讨论
查看>>
java~springboot~h2数据库在单元测试中的使用
查看>>
Nuget~管理自己的包包
查看>>
基础才是重中之重~你是否真正在用MVC路由功能~续
查看>>
sql 学习
查看>>
Javascript模块化编程(三)require.js的用法及功能介绍
查看>>
微信小程序云开发项目实战进阶 - 诗词大全&成语接龙
查看>>