色视频综合无码一区二区三区,国产色综合天天综合网,久久激情五月丁香伊人,chinasex喷白浆videos自慰
020-81959520
首頁
網站建設
速成網站
案例展示
新聞動態(tài)
關于我們
聯(lián)系我們
網站問題集錦
網站問題集錦
新聞動態(tài)
網站問題集錦
模板網站
星洋網站優(yōu)化案例
分類信息網站應怎樣防范垃圾信息
發(fā)布時間:2018-06-03
來源:本站
點擊數:
4
百度把搜索不公正歸于垃圾信息,而Google 則反唇相譏,說靠機器、技術手段來反垃圾已經成為通行法則,百度的說法僅僅是一個借口而已。不管誰對誰錯,一個不爭的事實是垃圾信息已經成為如今的信息時代的公敵。...
方法一通過提取信息里的聯(lián)系方式,建立聯(lián)系方式黑名單
垃圾信息制造者不管IP如何變、內容如何變,但是聯(lián)系方式是不變的。我們可以根據這一點來建立聯(lián)系方式黑名單數據庫。目前中國用戶用的最多的聯(lián)系方式有:電話號碼、QQ號、網址、Email地址等。這些聯(lián)系方式都有一定的特征,很容易通過正則表達式提取出來。那么具體如何建立黑名單呢?列表網的做法是:如果一條信息被用戶惡評五次,那么該信息自動標記為惡評狀態(tài)并隱藏。經確認的被用戶投訴的信息也被置于惡評狀態(tài)。當一條信息被置于惡評的時候,該惡評信息里的所有聯(lián)系方式均被存入黑名單數據庫中,并且出現(xiàn)頻率字段加1。這樣我們就有了聯(lián)系方式黑名單數據庫了,該數據庫有聯(lián)系方式的出現(xiàn)頻率及最新出現(xiàn)時間等信息。所有這些操作除了用戶投訴需要人工辨別外,其他的都是機器自動完成的。
方法二鑒別并刪除異地商家信息
分類信息網站的特點之一就是本地性,本地用戶到分類信息網站上來看的就是本地的租房、交友、服務等信息。因此如果信息里面出現(xiàn)異地的電話號碼的話則應該作為垃圾信息處理。這個可以通過手機屬地數據庫及電話區(qū)號數據庫來判斷。并不是所有的類目都適用這條方法的,像交友、尋人類目就不應該采用這種方法。但是像二手車類目、服務類目則完全可以采用這種方法過濾掉異地信息。
方法三限制某些類目同一天內一個用戶只能發(fā)布一條信息
重復的信息太多了,對用戶的體驗也不好。在這里重復信息的定義是:同一個用戶或商家(包括商家聘請的信息發(fā)布者)發(fā)布的內容相同或相似的信息。這些類目包括:生活服務、商務服務、培訓、交友、車輛等。那么如何避免重復信息的發(fā)布呢?列表網的做法是:在這些類目中用戶一天內發(fā)布的所有信息中只保留最近發(fā)布的信息,其他信息則刪除。
方法四關鍵字過濾
最后不要忘了關鍵字過濾。一些有害的、敏感的關鍵字是肯定需要過濾的。
以上是分類信息網站可以采納的反垃圾信息的簡單的行之有效的幾種方式。如果能配合貝葉斯算法過濾垃圾信息那就更完美了。
文章均為力洋網絡專注網站建設,廣州網站建設的廣州網站建設公司原創(chuàng),轉載請注明來自https://www.www.zhongguoqian.com/FAQ/4783.html
上一篇:
響應式網站建設的優(yōu)缺點分析
下一篇:
行業(yè)網站搜索優(yōu)化與網站建設的四個特殊點
熱門資訊
百度愛采購,商家入駐及推廣的費用是多少
商家如何在百度愛采購推廣
企業(yè)網站大揭秘之加密技術的重要性
貨架廠做網站,如何規(guī)劃網站內容和欄目
手把手教您一步到位的網站詳情頁設計攻略
微信小程序為什么這么火,建設小程序對營銷有哪些好處?
ASCII文章在優(yōu)化搜索引擎方面能起到什么關鍵作用
更高端的企業(yè)網站建設應該遵循哪些原則?
首頁
銷售熱線
郵箱
聯(lián)系