0°

用Python获取公众号评论并生成词云图证明抖音无罪

内容预览:
  • 原文始发于微信公众号(Python绿色通道):用Python获取公众号评论并生...~
  • 发现获取评论的接口是用Get请求方式~
  • 这个请求路径包含了一堆用户身份信息,这个不必深究,看看就好. self.ba...~

原文始发于微信公众号(Python绿色通道):用Python获取公众号评论并生成词云图证明抖音无罪

点击上方“Python绿色通道”,选择“置顶公众号”,属于你的文章第一时间送达!


近期为Python社会贡献了一份力量 Python社区越来越强大了,Python氛围越来越好了!希望每个人都能贡献自己的力量

大家都说抖音有毒,于是我就找了一篇关于抖音有毒的10w+阅读量的文章被抖音毁掉的中国年轻人 ,得到的结论就是:大家都认为软件无罪,人心有罪,抖音好坏完全看人!

词云效果图如下:

用Python获取公众号评论并生成词云图证明抖音无罪用Python获取公众号评论并生成词云图证明抖音无罪

实现流程:不清楚抓包的同学可以先看看前面的文章

Python抓取公众号文章并生成pdf文件保存到本地

用Python抓取某大V的公众号文章

抓取得到App音频数据

首先打开Charles ,然后在微信客户端打开文章。发现获取评论的接口是用Get请求方式。这个请求路径包含了一堆用户身份信息,这个不必深究,看看就好.

self.base_comment_url = 'https://mp.weixin.qq.com/mp/appmsg_comment?action=getcomment&scene=0&__biz=MjM5NjA5NDczMg==&appmsgid=2652274724&idx=1&comment_id=303303606155886594&offset=0&limit=100&uin=MTIyOTkzMzgyMA%253D%253D&key=984e4c80c8bc7843fbc3177a66f8024c086af6b59a7ac97026e9f4db88fc49d0c26ce660040b865a3294ae651150d40227980433f1a5106b5a15261ad20d564aad1e8c6aa2dfda74fdd515af0bc77f1e&pass_ticket=xrtIeEFSb9ktVwLWcuMpduZ%25252BBV6DrxwtLp5fn4E62xXSwYvNEvJQYumUDKuzbMA%25252F&wxtoken=777&devicetype=Windows%26nbsp%3B10&clientversion=6206021f&appmsg_token=961_V5yXdClt1VInI19BnECwzmgi95G9e44nyElITVL5rKcbKbGDkLSLzLuTrUTO-TL3Zo_qNKEVSclPd8LG&x5=0&f=json'

然后再看一下Headers

   self.base_comment_header = {
            'Host''mp.weixin.qq.com',
            'Connection''keep-alive',
            'Accept''*/*',
            'CSP''active',
            'User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 MicroMessenger/6.5.2.501 NetType/WIFI WindowsWechat QBCore/3.43.691.400 QQBrowser/9.0.2524.400',
            'X-Requested-With''XMLHttpRequest',
            'Referer''https://mp.weixin.qq.com/s?__biz=MjM5NjA5NDczMg==&mid=2652274724&idx=1&sn=ad0bbb4461e20cdb5bb1563e6d20639d&chksm=bd0c56478a7bdf51db287ab8a6e054284f0a6aa9b475a3597e2f02c1a28a9ac0f085dab1820e&mpshare=1&scene=1&srcid=0603ZskndK5clppsBTw7kWWW&key=8799423f74e5608e8fddceb78f6442677bcc4589977665cb4aaf92376ab0b3acbf903998bd87428c0a2b8f8a724ce746d59882f43021889961664fd26aa68e05492d96213e1addea8cee62b98b6ebb76&ascene=1&uin=MTIyOTkzMzgyMA%3D%3D&devicetype=Windows+10&version=6206021f&lang=zh_CN&pass_ticket=xrtIeEFSb9ktVwLWcuMpduZ%2BBV6DrxwtLp5fn4E62xXSwYvNEvJQYumUDKuzbMA%2F&winzoom=1',
            'Accept-Encoding''gzip, deflate',
            'Accept-Language''zh-CN,zh;q=0.8,en-us;q=0.6,en;q=0.5;q=0.4',
            'Cookie''rewardsn=; wxuin=1229933820; devicetype=Windows10; version=6206021f; lang=zh_CN; pass_ticket=xrtIeEFSb9ktVwLWcuMpduZ+BV6DrxwtLp5fn4E62xXSwYvNEvJQYumUDKuzbMA/; wap_sid2=CPyZvcoEElxMa0JKOS1tWHpPMFBlWFduNGRJbE9aUGFvNU9ja0poVXpKanpFSnVIQXpxbVUyVWNuZXlqQ2I3cDFvUmxlUGFIX2lFUDVGZ0dBTDBHRFFremh6Ml9vc0VEQUFBfjCikIrZBTgNQAE=; wxtokenkey=777'
        }

注意这个urlheaders会因为个人信息不同,时间不同而不同,所以不能完全照用我的信息,自己要自行替换.

拿到这两个信息后,然后我们去构建request请求

    def request_comment_data(self):
        response = requests.get(self.base_comment_url, headers=self.base_comment_header)
        if 200 == response.status_code:

然后可以通过Charles来查看返回的数据,再解析数据,这里我就直接给出代码

def parse_comment_data(self, response_data):
        all_datas = json.loads(response_data)
        if 0 == all_datas['base_resp']['ret']:
            all_comments = all_datas['elected_comment']
            with open('抖音毁掉.txt''a', encoding='utf-8'as f:
                for comments in all_comments:
                    name = comments['nick_name']
                    content = comments['content']
                    print(name, content)
                    try:
                        f.write(content + "n")
                    except Exception as e:
                        print(e)
                        continue
            self.create_word_cloud('抖音毁掉')
        else:
            exit('数据抓取出错:' + all_datas['errmsg'])

效果图:

用Python获取公众号评论并生成词云图证明抖音无罪

代码就这么多,但你以为这样就完了吗? 如果直观的看出评论者的留言态度呢,这个需要我们需要来做一个词云,更直观的看到评论者对抖音的态度

    def create_word_cloud(self,file_name):
        d 
= path.dirname(__file__)  # __file__ 为当前文件,
        text = open(path.join(d, '{}.txt'.format(file_name)), encoding='utf-8').read()
        back_coloring = imread(path.join(d, 'douyin_bg.png'))  # 设置背景图片
        wc = WordCloud(background_color="white",
                       font_path='C:WindowsFontsmsyhl.ttc',
                       max_words=5000,
                       mask=back_coloring,
                       # 设置有多少种随机生成状态,即有多少种配色方案
                       random_state=30)
        # generate word cloud
        wc.generate(text)
        # store to file
        wc.to_file(path.join(d, "alice.png")) #这个是最后保存的图片.

原本词云图一般就是矩形,这里我做了一下抖音标识,看起来更有意思. 这里主要是上传了一张抖音背景图,然后根据这个轮廓图生成形状如抖音的词云图.

用Python获取公众号评论并生成词云图证明抖音无罪

大部分人认为软件无罪,有心有罪!

完整代码:公众号回复 抖音评论代码

推荐阅读

一起来做Python项目实战吧!

Python抓取公众号文章并生成pdf文件保存到本地

用Python抓取某大V的公众号文章

抓取得到App音频数据

高级爬虫(一):Scrapy爬虫框架的安装

高级爬虫(二):Scrapy爬虫框架初探

高级爬虫(三):使用Scrapy爬取拉勾网数据并写入数据库


的Python之旅

用Python获取公众号评论并生成词云图证明抖音无罪

长按,识别二维码,关注公众号



目前50000+人已关注加入我们

用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪

用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪 用Python获取公众号评论并生成词云图证明抖音无罪


公众号回复:Flask ,爬虫,数据分析,可获得电子书


和大佬一起学习网络安全知识

以上就是:用Python获取公众号评论并生成词云图证明抖音无罪 的全部内容

本站部分内容来源于互联网和用户投稿,如有侵权请联系我们删除,谢谢^^
Email:[email protected]


0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论