Welcome![Sign In][Sign Up]
Location:
Search - ChineseTokenizer

Search list

[MultiLanguagesiuying_segment

Description: 「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
Platform: | Size: 1672077 | Author: 李利华 | Hits:

[JSP/JavaChineseTokenizer

Description: 中文分词源程序,用java开发的,内容比较详细。
Platform: | Size: 1003568 | Author: 朱红权 | Hits:

[MultiLanguageChineseTokenizer

Description: 用C#写的中文分词程序,还没有编译,有需要的编译一下吧
Platform: | Size: 1037587 | Author: 蔡报忠 | Hits:

[Other resourceChineseTokenizer20060426

Description: 分词文件,是一个比较简单词库.简单的说就是个强大的搜索-word document is a relatively simple thesaurus. Simply means that the powerful search
Platform: | Size: 1005568 | Author: 杨占成 | Hits:

[MultiLanguagesiuying_segment

Description: 「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
Platform: | Size: 1672192 | Author: 李利华 | Hits:

[JSP/JavaChineseTokenizer

Description: 中文分词源程序,用java开发的,内容比较详细。-Chinese word segmentation source, using java development, content in more detail.
Platform: | Size: 1003520 | Author: 朱红权 | Hits:

[MultiLanguageChineseTokenizer

Description: 用C#写的中文分词程序,还没有编译,有需要的编译一下吧-With C# Written in Chinese word segmentation process, has not yet compiled, there is a need to compile yourself
Platform: | Size: 1037312 | Author: | Hits:

[MultiLanguageChineseTokenizer

Description: 中文分词演示程序,可以对字符串进行按照词义分词。在搜索技术中有广泛应用。-Chinese Segmentation demo program can be carried out in accordance with the meaning of the string segmentation. In the search technology has wide application.
Platform: | Size: 966656 | Author: 老农 | Hits:

CodeBus www.codebus.net