<?xml version="1.0" encoding="UTF-8"?><!-- generator="WordPress/2.5.1" -->
<rss version="0.92">
<channel>
	<title>互联网，请记住我</title>
	<link>http://www.162cm.com</link>
	<description>一米六二的北漂生活</description>
	<lastBuildDate>Tue, 08 Jul 2008 10:17:34 +0000</lastBuildDate>
	<docs>http://backend.userland.com/rss092</docs>
	<language>en</language>
	
	<item>
		<title>Linux 声卡设置(喇叭和耳机同时出声的解决)</title>
		<description>本本声卡比较新，windows下装上官方驱动才能使，在linux倒是有声，就是音箱和耳机一起响，上班时没法听音乐。后来终于解决了这个问题，记录一下过程:


1:
运行lsmod&#124;grep snd,结果是:
snd_hda_intel         457780  4 
snd_usb_audio         100608  0 
snd_usb_lib            24960  1 snd_usb_audio
snd_rawmidi          ...</description>
		<link>http://www.162cm.com/archives/661.html</link>
			</item>
	<item>
		<title>Spread学习系列[1]-SP_receive函数说明</title>
		<description>接在Spread 简介(试译)之后，我跟啃骨头一样一点点儿地把SP_receive的man文档看完了。
这是我做的笔记，基本就是原文翻译，但是我英文太差，翻得太烂了点:(
SP_receive
NAME
       SP_receive, SP_scat_receive - Receive message from Spread

SYNOPSIS
       #include 

       int     SP_receive(     mailbox     mbox,     service ...</description>
		<link>http://www.162cm.com/archives/660.html</link>
			</item>
	<item>
		<title>团购蜂蜜</title>
		<description>提起大熊猫的故乡，很多人首先想到的是卧龙，那里是人工养殖大熊猫的基地。可是你们知道吗？在四川省西北部岷山深处，有一块四万公顷的原始森林，其间坐落着唐家河大熊猫自然保护区，那里生活着60多只野生的大熊猫和众多的国家一级、二级保护动物。阿里巴巴赈灾重建小组考察发现，由于5.12地震, 唐家河道路损毁、山体严重坍塌、众多珍贵野生动植物遭到毁灭性破坏.这对当地民众的生产生活造成了严重的影响.其中,原本不愁销路的天然蜂蜜积压了4吨无法销售出去,这些可都是养蜂人辛苦劳作的结晶啊! 为帮助唐家河大熊猫自然保护区解决这一问题.我们决定团购这4吨的蜂蜜.我们团购蜂蜜的价格也很优惠哦，单价是15元/斤，和超市的蜂蜜比起来，便宜很多呢，而且是纯天然的没有经过掺杂的蜂蜜哦！

ID    规格                单价       运费         总价（元）
16斤桶装蜂蜜 90595
24斤桶装蜂蜜     60       ...</description>
		<link>http://www.162cm.com/archives/659.html</link>
			</item>
	<item>
		<title>社区全文检索引擎Hyper Estraier 学习笔记[3]</title>
		<description>经过摸索，我决定给HyperEstraier加上由Hightman写的scws支持，使之支持中文分词。
实地看了代码之后，发现Hyperestraier的结构划分并不好，这可能决定了他只能是某些Hacker的心血之作，而不适用多人协作开发，大规模推广应用。这是旁话。
既然找到分词默认是使用的estraier.c的est_break_text函数，那我的目标就是改造这个函数,现在这个函数被我改成了:

scws_t seg;
/* Break a sentence of text and extract words. */
void est_break_text(const char *text, CBLIST *list, int norm, int tail){
// hack by renlu.xu
  CBLIST *words;
  const unsigned char *word, *next;
  unsigned char *utext;
  char *tmp;
  int i, j, k, size, cc, wsiz, nsiz, tsiz;
  ...</description>
		<link>http://www.162cm.com/archives/658.html</link>
			</item>
	<item>
		<title>社区全文检索引擎Hyper Estraier 学习笔记[2]</title>
		<description>hyperestraier是在前文已经介绍过一的一个开源搜索引擎程序。
	分词:采用N-gram,char_category等来分词，良好地支持中文等东亚文字。
	分词程序在:estraier.c中
		est_break_text
		est_break_text_perfng
		est_break_text_chrcat
	等分法。
	相关的函数有
  276 static int est_char_category(int c);
  277 static int est_char_category_perfng(int c);
  278 static int est_char_category_chrcat(int c);
等


分词默认采用est_break_text
	当创建数据库时采用 estcmd create dbname -apn 时，采用est_break_text_perfng来分词
	当创建数据库时是用 estcmd create dbname -acc 时，用est_break_text_chrcat来分词
	采用est_break_text来分词时，结果这样样的:
今天	天突	突然	然想	想起	起霍	霍炬	炬曾	曾告	告诉	诉过	过我	我的	的一	一个	个日	日本	本人	人开	开发	发的	的全	全文	文检	检索	索引	引擎	擎,	,	于是	是找	找他	他问	问了	了,
	是双字连着的分词法，这样会占用多至少一倍的检索空间，同时精确度差一点（但是精确度比按字分词好一点)。

系列文章:
社区全文检索引擎Hyper Estraier 学习笔记[1]
社区全文检索引擎Hyper Estraier 学习笔记[2]
社区全文检索引擎Hyper Estraier 学习笔记[3]
 </description>
		<link>http://www.162cm.com/archives/657.html</link>
			</item>
</channel>
</rss>
