列表网认为所有信息都有它的价值所在,垃圾信息也不例外。列表网的使命就是让所有合法的真实的信息以便于检索的方式呈现在受众面前而最大地实现其价值。
垃圾信息是人们对所有令人反感的不合时宜的信息的一个称谓。那么什么样的信息令人生厌呢?个人认为:所有强迫人们接受的信息、大量地重复地出现的信息及所有出现在不该出现的地方的信息都会使人生厌。垃圾信息降低了人们对网站的体验。一个充满垃圾信息的网站最终将失去人们对这个网站的信赖。
很不幸,现在的分类信息网站成了垃圾信息的重灾区。为什么?其主要原因是因为分类信息网站发布信息的随意性及很多分类信息网站不能人工的审核信息造成的。这样就造成了大量的垃圾信息泛滥。很多分类信息网站看似有很多信息,但是真正对读者有用的信息很少。
那么作为一个分类信息网站,怎样才能尽可能的杜绝垃圾信息呢?
首先,在技术上要尽可能的避免用户重复的错误的发布信息,并对垃圾信息制造者要有一定的惩罚。 比如,列表网在技术上进行了发布数量的限制:非注册用户每天只能发布3条信息,且10天内只能发布10条;注册用户每天只能发布5条,无隔日限制。这是一个发布数量的限制。为了惩罚垃圾信息发布者,我们还设置了一个罚则:如果某个用户在最近一个月之内被5次恶评,该用户将被限制发布信息,直到自动解除该限制。所谓“恶评”是用户使用列表网的信息评判系统对信息作出的一个评判。用户评判一个信息并不一定准确,但是如果若干个人给出同一个不好的评判的话,该信息就自动被“恶评”。
其次,分类信息网站的分类要合理。一个笼统的分类容易滋生垃圾信息,有用的信息和垃圾信息混在一起。与其这样不如把分类作细点,尽量把个人信息和商家信息分开,让那些所谓的“垃圾信息”发布在它该发布的分类中变成对人们有用的信息。有需求的人自然会到这个分类中索取他想要的信息。
第三,如果财力允许,分类信息网站可以聘请信息审核人员来人工地对信息进行筛选。
当然还有其他的方法,比如垃圾信息自动识别技术,其原理跟防止垃圾邮件的方法差不多,一般是算出各种算法的加权值,如果超过某个阈值就被定义为垃圾信息。常用的算法是贝叶斯算法。
当然,像craigslist这种以社区为根基的分类信息网站,我想更多的还是依赖于craigslist的忠诚用户贡献的对信息的评判来扫除垃圾信息的。