http://cloudapi.info/ 本来是个很小很小的应用,是我给小宝宝的礼物,web站点我也就随手用rails搭起来,放上去才几天,没想到马上就被垃圾信息注册机器人给盯上了.于是我决定,给cloudapi.info 提供的下一个接口即是垃圾信息判别. 一些想法:

cloudapi 提供垃圾评论判别接口的想法

1.首先得建IP黑名单库,邮箱黑名单库,网址黑名单库,User-agent黑名单库,只要在黑名单库里,立刻杀无赦;

2.将 评论包含的网址,评论作者,评论内容等放入bayes中学习;

3:提供如下API:

其中$comment变量均是Hash(PHP中的数组也是hash),比如:

$comment=array(

“word”=>”…..我们都是好同志”,

“ip”=>”127.0.0.1”,

“email”=>”aaa@example.com“,

“author”=>”一米六二”,

“url”=>”http://www.162cm.com/",

“ua”=>”Mozilla/Firefox(3.6)”

);

//将当前评论记录为垃圾评论,让系统学习;

api_learn_spam($database,$comment)

//将当前评论记录为非垃圾评论,让系统学习;

api_learn_ham($database,$comment)

//跟上两个相反的操作;

api_unlearn_spam($database,$comment)

api_unlearn_ham($database,$comment)

//分别将ip,url,某个单词和某个特定的UserAgent加入黑名单

api_push_ip_blacklist($database,$ip)

api_push_url_blacklist($database,$url)

api_push_word_blacklist($database,$word)

api_push_ua_blacklist($database,$ua)

//上面四个的反向操作;

api_unpush_ip_blacklist($database,$ip)

api_unpush_url_blacklist($database,$url)

api_unpush_word_blacklist($database,$word)

api_unpush_ua_blacklist($database,$ua)

//让系统来判定当前评论是不是垃圾评论;

api_classify($database,$comment);

cloudapi 提供垃圾评论判别接口的想法 1.首先得建IP黑名单库,邮箱黑名单库,网址黑名单库,User-agent黑名单库,只要在黑名单库里,立刻杀无赦; 2.将 评论包含的网址,评论作者,评论内容等放入bayes中学习; 3:提供如下API: 其中$comment变量均是Hash(PHP中的数组也是hash),比如: $comment=array( “word”=>”…..我们都是好同志”, “ip”=>”127.0.0.1”, “email”=>”aaa@example.com“, “author”=>”一米六二”, “url”=>”http://www.162cm.com/", “ua”=>”Mozilla/Firefox(3.6)” ); //将当前评论记录为垃圾评论,让系统学习; api_learn_spam($database,$comment) //将当前评论记录为非垃圾评论,让系统学习; api_learn_ham($database,$comment) //跟上两个相反的操作; api_unlearn_spam($database,$comment) api_unlearn_ham($database,$comment) //分别将ip,url,某个单词和某个特定的UserAgent加入黑名单 api_push_ip_blacklist($database,$ip) api_push_url_blacklist($database,$url) api_push_word_blacklist($database,$word) api_push_ua_blacklist($database,$ua) //上面四个的反向操作; api_unpush_ip_blacklist($database,$ip) api_unpush_url_blacklist($database,$url) api_unpush_word_blacklist($database,$word) api_unpush_ua_blacklist($database,$ua) //让系统来判定当前评论是不是垃圾评论; api_classify($database,$comment);