怎样审核大量网站数据?
发布日期:2023-03-23浏览量:123
无论是赶集网、58同城平分类信息网站,仍是慧聪网、1688等大型b2b电子商务网站,天天更新的数据都是海量的。赶集网淘宝相干地位招聘页面,地域仅一天发布的淘宝相干地位就有20页之多,要寄托人工审核每条数据是不行能完成的。
这就需求建立一个壮大的机审规则来替代人工审核事情量。详细操纵步调以下:
(1)短信验证码确认发布。行使短信验证码可以有用制止机械发布海量渣滓内容,若是有短信验证码,就能确定是人为发布。
(2)建立犯禁词库。网民发布信息的内容不行控,能够会触及到黄赌毒等法令法例禁止的相干内容,因而需求犯禁词库来做初级挑选屏障相干内容。当网民发送的内容包罗犯禁词库
信息时,自动触发删除或者人工审核程序。犯禁词库应按照法令法例政策和时代变革一直不竭地更新、添加内容,在最初设计时需求有足够多的容量和算法来包管短期能完成这个审核。
(3)ugc网站内容页普通都设有投诉举报入口。当有其余用户投诉举报该信息时,当即触发人工审核机制,对该信息从头审核。
网站制作seo职员在优化ugc网站时,想要疾速审核海量数据,可以参考上述要领。
相关文章: