CSDN文章获取器可以用来帮助我们打开CSDN网站中的各种文章,并把它们提取出来,可以直接获取csdn文章并转换为markdown格式。CSDN文章获取器的功能还是比较实用,对于需要这些文章的人来说很有效。
软件介绍
需要先创建一个parsel.Selector对象
from parsel import Selector
html 可以是请求某个网页的源码,也可以是html,xml格式的字符串
selector = Selector(html)
创建Selector对象之后就可以开始使用了
tags = selector.css(’.content’)
我们平时使用的css中,对某一个标签进行修饰时,使用的是 .class_attr
在这里也是如此
.content 就是指查询所有 class 为 content 的标签
查询的结果是一个特殊的对象,不能直接得到需要的数据
将css()函数查询到的结果转换为字符串或者列表,需要使用一个函数
如何转载
用浏览器加载文章地址,打开文章
F12打开Developer Tools,并打开Elements页面
这里写图片描述
将文章开头部分的文字作为关键字在Elements界面搜索
以此文为例:http://blog.csdn.net/aggressive_snail/article/details/54375876
搜索找了好久关键字
这里写图片描述
向上选则div元素,一个一个查看,直到要转载的原文变成被选取状态,如下图,
这里写图片描述
复制该div元素
这里写图片描述
粘贴到自己的博客编辑器里(markdown编辑器)
把div源代码,直接复制到编辑器里