自动中文分词功能,提取关键字_火车采集器V2010帮助文档

自动中文分词功能,提取关键字

在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。 注意,可以对多个标签进行联合分词.

最下边的自动分词,可以按词频对标签内的内容进行关键字提取。 我们打开辅助工具里的‘中文分词效果’测试“,看下具体的过程。

我们可以点击上边的编辑用户词库和编辑禁用词库来实现更多的分词效果。如果需要设置关键词的词性,请打开选项->自动分词设置,即可以有选择性的获取某些词性的关键字。