公众号单篇文章下载永久保存其实并不难,藏藏推荐过无数次的浏览器扩展 Singlefile 就能实现
关键在于这个扩展在安卓(👈点击查看安卓端装浏览器扩展教程)、iOS端(👈直接 App Store 搜索Singlefile)都能使用
比较难的问题其实在于如何批量下载某个公众号的文章?
之前介绍过的半个python的 wechatdown 开始收费、蠢太的 WeChatDownload 单篇下载还能用但批量下载失效、一番码客的公众号下载工具也失效…
时过这么久,到底有没有新的工具可以使用呢,这段时间藏藏就替大家又好好研究了下这个问题
1
wechatDownload
wechatDownload 是始于今年 1 月的一个小众、开源微信公众号文章下载工具,目前仅有几十个星标
软件完全免费,持续更新维护中,你可以在 Github 免费下载:https://github.com/xiaoguyu/wechatDownload
软件使用也是相当简单:单篇文章下载直接输入链接即可下载,不过批量下载功能需要开启代理
如果需要批量下载,初次需要安装证书,依次打开设置中心 » 打开证书路径 » 双击打开 rootCA.crt 文件
安装证书时,存储位置选「当前用户」,后续将证书放入「受信任的根证书颁发机构」,最后一直下一步并确定直至弹窗提示证书导入安装成功
然后批量下载和单篇下载略有不同:你需要先在设置中心设置好下载范围,如果需要下载评论和评论的回复的话也需要提前勾选(这里建议将下载到本地,否则如果原文被删,就都会失效)
再回到软件主页面直接点击批量下载,接着在微信客户端,打开你想下载的公众号的任意一篇文章,等待软件自动识别到公众号弹出确认弹窗
这款软件的缺点是会丢失掉一些原文排版(仅保留文字加粗等效果,文字颜色等都会丢失,同时都会变成居中显示)
但优势是文章评论都能保存,别人的楼中楼回复也都能点开查看
最后说下保存形式:这款软件是以文件夹的形式的保存每一篇文章,均下载到了本地,不担心原文失效后导致本地网页的也失效
2
WeChat_Article
这也是一款开源在 Gituhb 的免费公众号批量下载工具,代码首次提交于2019年2月,还是很有点历史了
相比之下就小有名气了,目前快近500的星标,同样你可以在 Github 上免费下载到软件:https://github.com/1061700625/WeChat_Article
不过这款软件的使用前提是你得有一个自己的微信公众号,因为这款软件的工作原理借助到了微信公众号后台文章编辑的「超链接」功能来扒取文章历史链接
▲公众号文章链接
好在公众号每个人都可以免费注册,几分钟注册一个「个人订阅号」即可:https://mp.weixin.qq.com
有了公众号那使用这款软件就简单了,填写你想批量下载的公众号名称,再填写你的个人公众号账号&密码(时间范围、过滤词这些按需设置)
然后点击启动,会弹出浏览器窗口让你扫码登录微信公众号网页,之后软件就会开始自动扒取下载文章了
下载的文章存放在软件目录的 spider 文件夹里面,html 和 文件存放于同一个文件夹,文章排版大致都能保留,缺点是目前不支持获取留言
最后说下保存形式:这款软件也是以文件夹的形式的保存每一篇文章,也均下载到了本地,具体文件结构如下图
3
wxArticleCatcher
这是吾爱破解论坛上@侃遍天下无二人老哥自制的微信文章批量下载工具,也是主打一个完全免费
3.1
单篇下载
在如今的版本,软件已经支持自动嗅探文章链接,所以我们双击打开软件之后,只需要再在微信上打开你需要下载的文章,然后注意是复制一点文章内容(比如标题),随后切换回软件主页面回车即可进行单篇文章下载
3.2
公众号历史消息链接
而如果想要实现批量下载,我们首先需要获取到公众号的历史消息链接
不过疑似微信为了限制第三方爬虫工具,现版本的微信中已经直接将这个入口给砍了
虽然入口没了,但历史消息页面还是能获取并访问的,方法一是下载3.4.5以下的旧版本的电脑微信,方法二是安装这个油猴脚本:https://greasyfork.org/zh-CN/scripts/445178(电脑装油猴脚本看这篇)
安装好之后再在浏览器打开任意公众号文章页面,就会出现【显示历史消息URL】按钮,点击即可获取对应公众号的历史消息链接(自行复制)
方法三是打开这个网站,粘贴公众号的任意文章链接,即可获取到公众号的历史消息链接:https://www.weixinzg.cn/getHomeUrl.html
3.3
批量下载
有了公众号的历史消息链接之后,发送给任意微信好友(文件传输助手),在微信内把页面打开
接下来就需要手动设置一下各项参数了:
-n 指定下载文章的数量,为整数,0表示不下载(无意义),负值表示全部下载,默认值-1
-p 用于指定下载路径,默认为下载到当前工作目录,路径需要用引号包裹
-off 表示偏移量,指定偏移量后程序会跳过一定数量的文章,直接从后面开始下载,默认值0
-t 表示线程数,在一般情况下等价于允许同时下载的文章数,默认值10
-o 表示开启原创校验,只有号主的原创文章会被下载(默认)
-O 表示关闭原创校验,下载范围内所有能正常浏览的文章都会被下载
-css 表示输出评论区的css样式文件,若没有此文件评论区格式会出错
-keep 表示保留未购买的付费文章,不加此参数未购买的付费文章不会被保存到本地,防止覆盖从他人处获取的已购文章
-updc 表示更新现有文章的评论,用于抢救已被删除的文章的评论区,注意只有20220423及更新版本下载的文章或者原本没有下载评论的文章才能被更新,因为旧版本中没有引入定位评论区的标记,更新评论要求复制公众号历史主页的文字,以传递更新密钥
-blocked-author 表示作者黑名单,在黑名单内的作者的文章不会被下载,能用于过滤广告。此选项需要跟上至少两个参数,第一个表示作者数量 n ,随后的 n 个参数是作者名的字符串,建议用英文引号包裹
但如果你想下载某个公众号的所有文章,藏藏建议最好还是分批次一点点下载,否则可能会导致你的账号被限制
但这里有个坑就是 -n 和 -off 这两个参数必须同时使用(作者也没说,藏藏自己研究老半天才明白)
就比如说我首次使用,可以输入 -n 10 -off 3,然后复制历史消息页面的任意文字,接着切换回软件按下回车即可开始下载
然后请留意软件显示的信息:这里给出了-off 的值,意味着下次再用这款软件进行下载时,就可以用 -n -off 28 接着下载后十篇文章了
这款软件的优点是可以完美保存原文章的排版、支持下载已购买的付费文章,同时也支持保存文章留言
但目前有个BUG:就是留言区作者的首条回复都会被重复保存一遍(其他人的或者后续的回复则不会),另外一个缺点是一个楼层至多能保存200条留言
最后是这款软件的缺点:并没有对进行转存下载到本地,即是直接引用的微信平台的链接,意味着假如原文被删,你保存的文章的也都会失效
4
wechat_down
还有一种下载情况可能是这种,就是公众号作者有在一篇文章里整理好历史文章的目录
如果想要把这种目录里面的所有文章一次性批量下载下来,公众号@苏生不惑开发了一款公众号文章批量下载器,可以在下载一篇文章的同时将文章内所有引用到的其他文章一并下载(除了,同时会下载文章内的音频)
还有微信现在不是有一个话题功能吗,他另外也有开发一款专门用于批量下载微信话题的工具,也没有任何使用难度,打开软件粘贴话题页面链接即可(同时这款软件也会同时下载文章内的音频)
这款软件的优点是能完美保存原文的排版,甚至音频也都能一齐下载到本地不担心失效,缺点是并不支持保存文章留言
最后还是说下保存形式:文章的封面、插图、音频都会被分别保存到对应文件夹,html 文件则是单独一个文件夹,
上述4款软件都存在一个很明显的缺点,就是不像藏藏原来介绍过的@蠢太大佬开发的 WeChatDownload 以 Base64 的形式将直接内嵌进网页文件中,保存、分享文件都显得非常不方便
若想要解决此问题,可以再用 Singlefile 保存一遍本地网页(右键扩展图标,扩展选项中勾选允许访问文件 URL 就可以对本地 html 文件使用了),再保存一遍的话 Singlefile 会将转为 Base64 格式内嵌于 html 文件中
如果你是想要批量转换,可以选中多个 html 文件之后,右键打开,这样可以一次性在浏览器打开多个本地 html 文件
然后右键 Singlefile 扩展,选择保存所有标签页,最后耐心等待即可
保存本地网页会比保存在线网页快的多,同时也不需要像保存在线网页一样打开网页后手动翻看全文让都正确加载,所以总的来说这个方法还是挺方便的,几十个几十个网页转换没有问题
当然大家如果有更好的批量转换方案,欢迎在评论区分享
如果你想把 html 转换为PDF,用之前藏藏介绍过的 PDF24 Tools 就可以实现免费批量转换
历史上的今天:
- 2024: 微语录精选:可以顺便帮我关灯吗?
- 2024: 软件推荐[Android]静读天下app v9.5.0(905000)静读天下专业版
- 2023: 微语录精选:23年出生的小孩可以活到3000年
- 2023: Steam 喜加一:经典游戏《世嘉钓鱼高手》免费领
- 2022: [前方高能]红楼梦最终章