Global Feed Post Login
Replying to Avatar CXPLAY

在思考如何存档 #酷安 上的文章. 目前通过携带 sharekey 参数可以做到网页预览, 但是这是在暴露分享者身份的前提下做到的. 此外酷安的 WAF 似乎还屏蔽了海外 IP, archive.ph 和 12ft 都无法直接代理查看.

或许可以用 SingleFileZ 转储网页后再上传到一个临时 Web 服务器, 把 Web 服务器路径里的 HTML 再喂给 archive.ph, 存档完成后就删除 Web 服务器里的文件. 也可以同时喂给 web.archive.org, 不过可能它们的爬虫后端不支持这种含有自解压资源的 HTML, archive.ph 爬虫用的是无头 Chromium, 也许能用.

Avatar
CXPLAY 1y ago

如果只是临时托管 HTML, 那可选的办法很多. 但是需要尽量保留原始文章 URL 的结构到临时 Web 服务器, 便于未来关键词查找.

Reply to this note

Please Login to reply.

Discussion

Avatar
CXPLAY 1y ago

演示: https://archive.is/k7PsO

原文: https://www.coolapk.com/feed/53998735

Avatar
CXPLAY 1y ago

当然我也知道 coolapk1s.com, 但是发现今天我要存档的文章恰好用不了, 没办法.

> https://www.coolapk1s.com/feed/53998735

Avatar
CXPLAY 1y ago

怎么又能用了?! 怎么会事呢, 忘记存档错误页面了!😡

Thread collapsed
Thread collapsed
Thread collapsed