如何从网页内提取文章列表?
在“知微” RSS 阅读器中,有项功能是可以写规则,来抓取不支持 RSS 的网站。 对于不懂 Html, CSS Selector 的小白用户来说,该功能很有门槛。 那能否自动识别出用户想要抓取列表?就像识别文章全文的 Readability 一样? 最初我觉得不...
在“知微” RSS 阅读器中,有项功能是可以写规则,来抓取不支持 RSS 的网站。 对于不懂 Html, CSS Selector 的小白用户来说,该功能很有门槛。 那能否自动识别出用户想要抓取列表?就像识别文章全文的 Readability 一样? 最初我觉得不...
这篇文章是我自己发表在知乎上的,在这里也重新发一下。 忽然 2020 年也过去了,去年 RSS 领域不太平静,众多知名 RSS 阅读器被迫下架,不过欣慰的是还有很多的国产 RSS 阅读器在推出。 转眼 2019 都快过去了,很多被推荐的阅读器都...
喜欢用 RSS 的人都知道,如果遇到个想订阅的网站,要找它的 RSS 链接是比较痛苦的。得瞪大了眼睛,在页面上找那个 RSS 标志。 而且有些网站不显示这个标志,甚至是不提供 RSS 服务,像微博,知乎,简书,BiliBili 这种你...
许多精选源网上随便一搜就有很多,我就不赘述了。 就写一些不常见的、优秀的源吧。 软件资讯&资源 异次元软件世界(提供全文) 小俊(分享去广告的软件,比较实用) 三千院雨(应该是个萌妹子,除了分享自制去广告/破解的软件外...
【给任意网站制作 RSS】 feed43.com(4星推荐:需懂一点页面代码,就能很好的控制输出的 RSS) createfeed.fivefilters.org(3星推荐:虽然还算简单,但总体不怎么好用) 【给知名网站制作 RSS】 注:重点推荐下 RSSHub 项目,这群...
著名的“老司机”平台——汤不热(Tumblr),一直支持 RSS 输出。不过其中输出的图片尺寸是缩小版的。所以自制了这个简单的脚本,可将RSS中的小图网址替换为大图的网址,再输出。喜欢的朋友可以将这个 php 脚本放到自己的 php 虚拟主机中,...
「更新时间」2018-4-25 截至到目前我自己订阅的源数量已经超过1.8k了,在这里分享给大家。 链接: http://pan.baidu.com/s/1sljPFx7 密码: 82vw
项目 Gibhub 地址 本程序是一个比较简陋的,制作 RSS 输出的小爬虫。 在针对不同网站写好抓取规则后,随便丢进一个 PHP 空间就能给使用。 然后 PHP 空间绑定的域名 + 这个文件的名字,例如:project-user.rhcloud.com/rssfile.php ,...