文档信息提取节点的功能是将一个文档的元信息提取并保存到数据列中,如文档标题、摘要、文本、文档正文、作者、作者列表、类别、类别列表、参考、参考列表、类型、出版日期、文件路径、字数和文档概要。该节点将每一类提取信息保存在一个字段中,并追加到输出表中。
对话框选项
文档字段
选择要使用的文件字段。
信息提取
将要提取的信息类别添加到右侧列表中。每个信息类别将会以一个字段输出,追加到输出表中,字段的名称就是信息类别。
端口
输入端口
0 |
包含文档字段的表 |
输出端口
0 |
文档信息表 |