正在加载...

项目主页:
http://tokyocabinet.sourceforge.net/dystopiadoc/
介绍:
Tokyo Dystopia 是一个全文检索系统,你可以搜索包含某短语的一系列记录,它的特性如下:
1.搜索的高效。
2.目标文标的高可靠性
3.N-gram 法的高召回率 (我加的,原文中没有:召回率是搜索引擎中对搜索结果能否全面的量化,召回率越高,搜索结果中包含相关文档越多,同时一般来说搜索结果越不精确,精确率越低。)
4.短语匹配,前缀匹配,后缀匹配搜索.
5.Unicode下多语种支持。
6.API的分层架构支持。
值得一提的是,印象中Tokyo Dystopia好像在日本国内社交网站老大mixi.jp上应用了。

: http://www.162cm.com/archives/683.html

本文相关评论 - 才 7 条评论
2008-08-20 22:54:32

我发现你文章的TAG有意思啊,每篇都是用那么多

2008-08-20 22:55:02

我发现你文章的TAG有意思啊,每篇都是用那么多

2008-08-21 18:34:25

啊 这个是生成的 不是我取的

2008-08-22 22:57:34

怎么你的blog还有分词的功能啊?

2008-08-22 23:48:57

有一阵了 用的很老的hightman版的纯php的分词库。

匿名
2008-11-28 11:03:47

132213321

xyz
2008-11-28 11:04:45

132213321