2008-8
17
项目主页:
http://tokyocabinet.sourceforge.net/dystopiadoc/
介绍:
Tokyo Dystopia 是一个全文检索系统,你可以搜索包含某短语的一系列记录,它的特性如下:
1.搜索的高效。
2.目标文标的高可靠性
3.N-gram 法的高召回率 (我加的,原文中没有:召回率是搜索引擎中对搜索结果能否全面的量化,召回率越高,搜索结果中包含相关文档越多,同时一般来说搜索结果越不精确,精确率越低。)
4.短语匹配,前缀匹配,后缀匹配搜索.
5.Unicode下多语种支持。
6.API的分层架构支持。
值得一提的是,印象中Tokyo Dystopia好像在日本国内社交网站老大mixi.jp上应用了。
我发现你文章的TAG有意思啊,每篇都是用那么多
我发现你文章的TAG有意思啊,每篇都是用那么多
啊 这个是生成的 不是我取的
怎么你的blog还有分词的功能啊?
有一阵了 用的很老的hightman版的纯php的分词库。
132213321
132213321