采集PDF表格数据
# 场景概述
由于PDF具有许多其他电子文档格式无法相比的优点,因此在生产生活中具有广泛的应用,进而读取PDF中的数据成为处理数据的基本需求。本文以读取PDF文件中的表格数据,并将获取数据写入指定Excel为例,为您介绍壹沓RPA平台在PDF数据采集方面的功能。业务逻辑如下所示:
- 打开PDF并提取指定表格中的数据。
- 打开或新建要写入数据的Excel。
- 将数据写入Excel。
# 操作步骤
本操作步骤涉及组件的高级设置与错误处理均保持默认设置,仅对常规设置进行配置。
- 提取PDF文件表格中的数据。
配置项 | 说明 |
---|---|
待读取文件路径 | 待操作PDF文件的来源,本文以直接打开本地PDF文件为例。 |
表格所在页面 | 表格所在页面的页码,本示例为1,即PDF文件的第一页。 |
表格位置序号 | 表格在当前页面内的位置序号,本示例为1,即第一页中的第一个表格。 |
结果暂存为 | 将获取到的PDF中的表格数据(数据表)暂存为变量并命名,名称可自定义,默认命名为PDF中的数据表。 |
- 打开或新建Excel文件,用于存储提取的PDF表格中的数据。
配置项 | 说明 |
---|---|
打开以下地址中的Excel | 待操作的Excel文件的来源,本文以直接打开本地已有Excel文件为例。 |
结果暂存为 | 将打开的Excel对象暂存为变量并命名,名称可自定义,默认命名为Excel文件。 |
- 将从PDF文件表格中读取的数据写入已打开的Excel文件中。
配置项 | 说明 |
---|---|
待写入数据 | 待写入数据的来源,本文为步骤1中暂存的数据PDF中的数据表。 |
写入方式 | 写入数据的方式,本文选择从指定单元格开始向右向下写入。 |
目标起始单元格 | 写入数据的起始位置,本文为步骤2中暂存的Excel文件Sheet1中的A1单元格。 |
# 流程展示
# 相关组件
最近更新时间: {
"value": "2023-02-16",
"effect": true
}