首页 > 网站建设 >

网站建设公司浅析常用的信息过滤手段

发布时间:2020-10-09 作者:网站建设

  网站建设公司浅析常用的信息过滤手段,我国的信息过滤技术是走在世界前列的,尽管如此,在各种社区网站和个人邮箱中,广告和垃圾信息仍然屡见不鲜、泛滥成灾。常用的信息过滤与反垃圾手段有以下几种。
1.文本匹配
  文本匹配主要解决敏感词过滤的问题。通常网站维护一份敏感词列表,如果用户发表的信息含有列表中的敏感词,则进行消毒处理(将敏感词转义为***)或拒绝发表。
2.分类算法
  对如此海量的信息进行人工审核是不现实的,对广告贴、垃圾邮件等内容的识别比较好的自动化方法是采用分类算法。分类算法除了用于反垃圾,还可用于信息自动分类,门户网站可用该算法对采集来的新闻稿件进行自动分类,分发到不同的频道。邮箱服务商根据邮件内容推送的个性化广告也可以使用分类算法提高投送相关度。
3.黑名单
  对于垃圾邮件,除了用分类算法进行内容分类识别,还可以使用黑名单技术,将被报告的垃圾邮箱地址放入黑名单,然后针对邮件的发件人在黑名单列表中查找,如果查找成功,则过滤该邮件。黑名单也可用于信息去重,如将文章标题或者文章关键段落记录到黑名单中,以减少搜索引擎收录重复信息等用途。深圳博纳网站建设公司编辑整理关于“网站建设公司浅析常用的信息过滤手段”的知识就介绍分享到这里,谢谢关注。
文章标题:网站建设公司浅析常用的信息过滤手段
本文地址:https://www.198bona.com/news/7562.html
如果您觉得案例还不错请帮忙分享:

网站建设

网络推广

解决方案

域名主机

建站行业资讯