情感分析节点的功能是定义文本的情感强度和情感分类。文本情感分析又称意见挖掘。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。例如,由于基于产品评论的情感分析可以帮助用户了解某一产品在大众心目中的口碑,因此受到很多消费者和商业网站的青睐。而基于新闻评论的情感分析多用于舆情监控和信息预测中,是国内外评测中重要的评测任务。
情感信息抽取是情感分析的最底层的任务,它旨在抽取情感评论文本中有意义的信息单元。其目的在于将无结构化的情感文本转化为计算机容易识别和处理的结构化文本,继而供情感分析上层的研究和应用服务。情感信息分类则利用底层情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒、贬两类或者其他更细致的情感类别(如喜、怒、哀、乐等)。按照不同的分类目的,可分为主客观分析和褒贬分析;按照不同的分类粒度,可分为词语级、短语级、篇章级等多种情感分类任务。
对话框选项
对象
情感分析是面向研究对象的,可以是每条记录,也可以是文档类别,也可以是文本的作者。因此,需要选择分析的对象,情感分析会按照选择的分析对象计算每个对象的情感强度,进而计算情感分类。这一项不是必选项,如果不选,则程序会把每条记录当作一个分析对象。
分词
由于情感分析需要根据文本中词判断词的情感,进而计算每个研究对象的所有文本整体的情感强度,即为该研究对象的情感强度。因此,在做情感分析之前需要使用分词节点对文本进行分词(有时还需要对分词进行噪声词过滤)。因此,此处需要选择一个之前已经处理好的分词字段。
频数
这一项是指定情感分析的权重,可以选择一个数值型字段作为权重。此项也非必选,如果不选,则权重默认相同。
端口
输入端口
0 |
文本输入表 |
输出端口
0 |
情感分析表 |