文档简介
标签:
中文文本体裁分类中特征选择的研究
针对文本体裁自动分类在特征选择和权重计算方面的特殊性,提出文本的内容类别信息,改进传统特征选择方法CHI以及权重计算公式tf.idf,并运用支持向量机在含5类体裁的语料上进行中文文本体裁自动分类。实验结果表明,该方案是可行的。关键词:中文信息处理;体裁分类;特征项选择;支持向量机
评论
加载更多
推荐下载
查看更多
精选文集
推荐帖子