CSDN博客提取器通过分析CSDN博客源码来生成一些必要的数据,可能在以后使用当中出现爬取不了的情况,可能是CSDN的源码结构修改了。由于生成PDF的时候需要依赖字库,所以在打包程序的时候把一些必要的字库已经放到程序中去了。可能在生成一些PDF文件的时候出现乱码问题,那是因为里面缺少需要的字库。
CSDN博客提取器使用教程:
1、在用户名中输入需要提取的博客的用户名
2、点击“打开”,设置保存目录
3、点击“分析博客”
4、选择需要下载的博文,再选择需要保存文件的格式
5、点击“下载”,下载博文。
程序功能:
1、支持输入CSDN博客用户名针对性下载
2、支持选择保存下载的文件
保存的结构目录为:
选择的保存路径\CSDN用户名\img 该用户的头像保存路径
选择的保存路径\CSDN用户名\pdf 生成的PDF文件保存路径
选择的保存路径\CSDN用户名\doc 生成的DOC文件保存路径
选择的保存路径\CSDN用户名\txt 生成的TXT文件保存路径
3、支持获取用户博客信息
4、支持显示用户所有的帖子列表
5、可以自己选择需要下载的帖子,有全选、反选、重置按钮
6、支持下载的文件保存为 pdf、doc、txt三种格式
7、生成的pdf、doc文件支持图片
8、支持进度显示