西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 电脑软件 安卓软件 电脑游戏 安卓游戏 排行榜 专题合集

python词云图生成源码

  • python词云图生成源码
  • 软件大小:1KB
  • 更新时间:2019-07-11 08:02
  • 软件语言:中文
  • 软件厂商:
  • 软件类别:国产软件 / 免费软件 / 源码相关
  • 软件等级:3级
  • 应用平台:WinXP, Win7, win8
  • 官方网站:暂无
  • 应用备案:
好评:50%
坏评:50%

本类精品

软件介绍

python词云图生成源码,用python来实现的一个词云图生成代码,可以生成某个论坛版块的词云图数据,使用python编译环境即可编译该程序,让你轻松获得想要的词云图数据。本次放出python词云图生成源码资源下载,感兴趣的朋友们不妨试试吧!

python词云图生成源码

python词云生成代码说明:

由吾爱论坛大神制作

输入序号即可生成相关板块的词云信息

python词云图代码演示:

import requests

from lxml import etree

import  jieba

import numpy as np

import matplotlib.pyplot as plt

import time

from PIL import Image

from wordcloud import WordCloud

 

def GetData(forumdata):

    for j in forumdata:

        url = 'https://www.52pojie.cn/forum-x-1'

        url = url.split('-')

        nurl = url[0] + '-' + j + '-' + url[2]+'.html'

        html = requests.get(nurl)

        ehtml = etree.HTML(html.text)

        forumname=''.join(ehtml.xpath('//*[@id="ct"]/div/div[1]/div[1]/h1/a/text()')).replace('『','').replace('』','')

        print(forumname)

        pagenum = ehtml.xpath('//*[@id="fd_page_top"]/div/label/span/text()')

        pagenum = pagenum[0].replace(' / ', '').replace(' 页','')

        txt=''

        for i in range(1,int(pagenum)+1):

            nurl = url[0] + '-' + j + '-' + str(i) + '.html'

            html = requests.get(nurl)

            ehtml = etree.HTML(html.text)

            #pltxt = ' '.join(ehtml.xpath('//*[@id="threadlisttableid"]/tbody/tr/td[2]/cite/a/text()'))#获取帖子作者

            pltxt = ' '.join(ehtml.xpath('//*[@class="s xst"]/text()')) #帖子标题

            txt = txt + pltxt

            time.sleep(1) # 给服务器留些喘气的时间

        cut_text =txt

        wordcloud = WordCloud(

            font_path='simhei.ttf',

            background_color='white',

            width=800,

            height=500

        ).generate(cut_text)

        wordcloud.to_file('c:\\'+forumname+'.png')

        plt.imshow(wordcloud, interpolation="bilinear")

        plt.axis("off")

        plt.show()

 

if __name__ == '__main__':

    forumdata=[

        "2",  # 原创发布区 0

        "5",  # 脱壳破解区 1

        "65",  # 移动安全区 2

        "59",  # 软件调试区 3

        "24",  # 编程语言区 4

        "6",  # 动画发布区 5

        "4",  # 逆向资源区 6

        "16",  # 精品软件区 7

        "8",  # 悬赏问答区 8

        "32",  # 病毒分析区 9

        "50",  # 病毒救援区 10

        "41"#安全工具区 11

    ]

    print('开始获取,请稍候...')

    GetData(forumdata)

python词云图相关视频:

软件截图

python词云图生成源码

其他版本下载

发表评论

昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
TOP
软件下载