资讯专栏INFORMATION COLUMN

为什么看博客的时候里面的链接总是 404

daryl / 1263人阅读

摘要:为什么看博客的时候里面的链接总是作为一个野路子程序员,看大牛的博客是学习,进步的很重要的一个信息来源。博主大多数的博主并不是通过写博客盈利赚钱,所以不可能定期去检查以前博文中的链接是否有效。在检测的全面性和精准度方面还不做保证。

为什么看博客的时候里面的链接总是 404

作为一个野路子程序员,看大牛的博客是学习,进步的很重要的一个信息来源。
作为一个信息的汇聚点,博客中总会引用些其他的经典文章,或是某开源项官方文档中的重要部分。
然而由于更新博客是很低频率的事件,所以随着时间推移,很可能发生的情况是:大牛引用的另一篇文章
已经被删除,或者干脆域名到期,引用的博客关门大吉;由于开源项版本升级,原先的文档已经不适用因而
官方删除了。
So, 404...

现状

尝试测试了 阮一峰(http://www.ruanyifeng.com/blog/), 王垠(http://www.yinwang.org/) 等知名博主的博客,发现几乎都有链接失效的问题。
可见此问题很常见。

博主

大多数的博主并不是通过写博客盈利赚钱,所以不可能定期去检查以前博文中的链接是否有效。
话说回来,即便真的是通过写博客盈利赚钱,那么多的博文,也不太可能定期去检查以前博文中的链接是否有效吧。。

读者

虽然对我很不友好,破坏了上下文和文章的完整性,但是
习惯了。。认了吧。。。凑合看吧。。

中国特色

由于众所周知的原因,中国读者遇到引用链接不可访问的情况更多,并且不可访问的链接越来越多。

作为一个独立开发者,用了若干个第三方服务,CDN 等。天有不测风云风云,保不齐哪天哪个服务商就黄了,或者哪个 CDN
又被墙了。。。

尝试解决

一个可能的解决方法 link doctor

https://doctor.dry.ninja/

博主(站长)在网站注册后,系统尝试定期(每6小时1次,可设定)对网站进行一次分析,找出失效的引用的链接,或是失效的引用的资源(js, css),
并将分析结果发送给博主(站长)。

目前刚刚有想法做这个东西,并做了个简单的 Demo。
在检测的全面性和精准度方面还不做保证。如果真的有博主有这个需求,请收藏、标星。如果没有人有需求的话,就弃坑了。。
或者有什么好的建议的话,欢迎提个 issue。

github 地址在此:
https://github.com/FingerLiu/...

待解决问题

爬虫被 ban

由于国内和国内网络环境不同,分别部署不同的服务器

什么需要检测什么不需要

对引用的链接进行备份(snapshot)。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41075.html

相关文章

  • 织梦网站如何设置404错误页面?

    摘要:或者及,一般来说,个人博客网站网页的后缀用的都是这三种。第二步中添加在给织梦设置错误页面之前,根目录是没有文件的,那么我们就要创建一个或者利用在线工具生成一个,只需要添加进去,然后直接生成下载,出来是,上传之后再根目录里面修改一下就可以了。首先在网上搜索织梦系统404错误页面的一个网页或者也可以自己编辑,然后在通过网页编辑器编辑一下这个404网页,然后把里面的网址改为自己的网址,佐言用的是 ...

    lijy91 评论0 收藏0
  • web前端(4)—— 常用标签1

    摘要:需要注意的是,代码中的所有连续的空行换行也被显示为一个空格常用的特殊字符内容代码空格版权注册好的,常用标签暂且到此标题标签h1~h6 顾名思义,这些就是把字体设置为大字体的,就如博客园的这个编辑器里的格式: 不信的话我们自己设置看看:好的,从本篇文章开始,我们需要动手了 test 标题 标题 标题 标题 标题 ...

    番茄西红柿 评论0 收藏0
  • 使用Nuxt+Vue+Node构建SSR博客项目

    摘要:通过对客户端服务端基础架构的抽象组织,主要关注的是应用的渲染。文件名的名称将成为中间件名称将成为中间件。登陆成功的标志就是校验合法,然后下一步操作。校验失败就直接返回,前端根据响应跳转到登陆页面。 以前的博客使用的是Ghost,不过被攻击了,勒索我几百美元,还是算了吧,顺便说一句,数据备份很重要!前段时间学了Vue.js,以前看的Node还能记起来点,主要为了锻炼自己吧,这次的博客没有...

    zhigoo 评论0 收藏0
  • 前端——影子杀手篇

    摘要:前言对于一个影子杀手而言,总能杀人于无形。前端也有影子杀手,它总是防不胜防地危害着你的网站本篇打算介绍一些前端的影子杀手们和。影子杀手们,由来已久,几乎伴随着整个互联网的发展。 前言 对于一个影子杀手而言,总能杀人于无形。前端也有影子杀手,它总是防不胜防地危害着你的网站 本篇打算介绍一些前端的影子杀手们——XSS和CSRF。或许,你对它恨之入骨;又或者,你运用的得心应手。恨之入骨,可能...

    李世赞 评论0 收藏0
  • Django搭建个人博客:在博文中发表评论

    摘要:确认创建成功后,记得在中注册因为我们想显示发表评论的时间,修改时区设置为上海的时区。处理错误请求发表评论仅接受请求。返回到一个适当的中即用户发送评论后,重新定向到文章详情页面。总结本章实现了发表评论展示评论的功能。 在没有互联网的年代,我们用日记来记录每天的心得体会。小的时候我有一个带锁的日记本,生怕被别人看见里面写了啥,钥匙藏得那叫一个绝。 现在时代变了,网络版的日记本:博客,却巴不...

    Jinkey 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<