热搜词公众号截流数据挖掘

公众号截流,关键词的竞争度,直接决定能否截流成功。

注册此类关键词的公众号越多,排名第一的时间和成本也越高。

所以,在一堆热搜关键词中,获知这批词,在微信公众号中有多少个搜索结果,是判断竞争度的关键手段,<=10个基本就是没竞争了,流量白捡的。

获取这个数据,最准确的,自然是抓微信客户端的数据,but,微信的风控使我劝退,账号被封了就尴尬了。

有一些曲线救国的方法:

01

搜狗微信搜索

But,搜狗公众号搜索最多只有193个搜索结果

比如SEO,大约接近400个公众号(我人肉挨个数了),这数据就不全。

那么,还有另外两个数据源

02

新榜

新榜有JS反爬措施

第一,必须登录才能获取数据,需要将cookie中的token传上去,才能返回正常结果

第二,post的参数中,每次请求xyz和nonce是不同的,这两个参数是通过两段js函数生成,逻辑不复杂,可用过python来生成这两个参数

03

清博大数据

从爱站工具包的热词挖掘中导出关键词(才2000多….),包含PC和mobile的搜索量,再配合上面3个数据源的公众号搜索结果数,便可快速判断哪个词,可以优先截流。

04

哪个数据更准确?

本渣人肉检查了十几个词,其实都不是绝对准确。

搜狗和新榜的数据,会略小于真实的搜索数量,清博会出现数值大于实际值的情况,估计是把被删除的账号也算进去了。

总之,建议主要靠搜狗和新榜两个数据综合来看,这两个数据,更接近真实情况。

05

三个平台的反爬措施

  • 搜狗有严格的IP反爬,需要准备大量代理IP
  • 新榜有JS+Cookie反爬,但我快速抓了4000个词,账号也没啥事,不知道被封的阈值在哪里
  • 清博大数据,佛系
教程

参加线下聚会正确的“姿势”应该是怎么样的?

2020-11-23 21:19:48

教程

网站被K了怎么恢复,如何百度重新收录

2020-11-24 16:32:13

⚠️
水源智库上的部份代码,资源及教程来源于互联网,仅供网友学习交流,版权归作者所有。所有项目皆为分享思路,仅供参考!
若您的权利被侵害,请联系站长 QQ: 或 点击客服私信反馈,我们将第一时间处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧