哔哩哔哩弹幕屏蔽规则

放到了Github上,第一次玩git,研究了好久。。。详细列表见List.md

为什么会想到写这么一个屏蔽列表呢?引用在ReadMe.md里写的:

为什么会有这个屏蔽列表呢?因为B站弹幕质量每况日下,在2011年年中时基本无法在新番区看番了,就慢慢着手做一个适合自己的屏蔽列表,结果越做越大,也各种混乱,在今年6月份甚至花了好几天把所有不欣赏人全部都拉黑了,这直接导致了我每次看片都需要卡1分钟左右,熬了几天后放弃先前列表,从头开始分类搞,就是现在你看到的这个。

这个是适合我自己的列表,不可能完全适合你,所以需要自己调整。

很多在一般人看来属于「吐槽」的弹幕,在我看来就是垃圾,发的人就是傻逼。打个比方:

当一个视频没有BGM或者非常轻的的时候,总有一群自认为「幽默感很强」、「懂得吐槽」的傻逼大学生在那刷「BGM好燃」、「求BGM」等。

当发这种弹幕的人比较少时我觉得这是吐槽,但是满屏幕、连绵不绝,就像大姨妈一样充斥整个视频的时候,这就大幅降低了弹幕质量、观看心情。就不得不屏蔽,这个规则里的新番一般视频的分类里半数都是这类弹幕,在没办法设定显示比例的情况下,我只能将其全部屏蔽。

认识我的人可能知道我是一个国际主义战士,所以人身攻击列表里出现的广东粤语河南新疆等词必然不是歧视,而是当视频里出现这些地名的时候有很大的机率会出现地域攻击、歧视等,所以眼不见为净,全部屏蔽了。

因为哔哩哔哩播放器对正则的处理相当奇怪,很多明明符合规则的弹幕,却还是放行了;无法屏蔽单条多行相同的弹幕,更无法处理多条一模一样的弹幕。另外对单条规则貌似有长度限制,所以这个时候你需要把单个屏蔽列表拆成多条,注意不要在屏蔽列表里留下空白的|,否则会全部屏蔽。

其实本来写个列表不用费什么脑子,但问题是很多人发弹幕不会按照语文考试格式,经常出现错别字、谐音、近型字,当出现很明显的会被屏蔽的词时,中间加空格,或者无意义的干扰词等,采用一行一个字,甚至一条弹幕一个字等恶心办法。。。特别无奈,还有人就是喜欢用繁体字来发,还有些明明就不会繁体,偏要用大陆的输入法打繁体字,各种错。都大大地加重了写屏蔽列表的难度,更何况还得考虑可能会导致正常弹幕误屏蔽的情况,又得细化规则。咱总不能跟GFW一样,采取不管三七二十一一刀切全部屏蔽的办法。


最后修改于 2012-10-14