项目主页: http://tokyocabinet.sourceforge.net/dystopiadoc/ 介绍: Tokyo Dystopia 是一个全文检索系统,你可以搜索包含某短语的一系列记录,它的特性如下: 1.搜索的高效。 2.目标文标的高可靠性 3.N-gram 法的高召回率 (我加的,原文中没有:召回率是搜索引擎中对搜索结果能否全面的量化,召回率越高,搜索结果中包含相关文档越多,同时一般来说搜索结果越不精确,精确率越低。) 4.短语匹配,前缀匹配,后缀匹配搜索. 5.Unicode下多语种支持。 6.API的分层架构支持。 值得一提的是,印象中Tokyo Dystopia好像在日本国内社交网站老大mixi.jp上应用了。
我发现你文章的TAG有意思啊,每篇都是用那么多
啊 这个是生成的 不是我取的
怎么你的blog还有分词的功能啊?
有一阵了 用的很老的hightman版的纯php的分词库。
132213321
Name (required)
Mail (will not be published) (required)
Website