页面树结构
转至元数据结尾
转至元数据起始

文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。从这个意义上讲,文本数据挖掘是数据挖掘的一个分支。文本挖掘有三个独特的关键步骤:一是分词,通过分词可以将非结构化数据转化为结构化数据;二是情感分析,定义情感强度,从文本中挖掘作者的情绪或者从评论中挖掘用户的满意度或者观点;三是去噪,即从分出的众多词中剔除干扰的无用的词,提升数据质量。下面结合一个小的案例演示文本挖掘的实现过程。工作流:

  • 无标签