帮助中心
采集PDF表格数据

# 场景概述

由于PDF具有许多其他电子文档格式无法相比的优点,因此在生产生活中具有广泛的应用,进而读取PDF中的数据成为处理数据的基本需求。本文以读取PDF文件中的表格数据,并将获取数据写入指定Excel为例,为您介绍壹沓RPA平台在PDF数据采集方面的功能。业务逻辑如下所示:

  1. 打开PDF并提取指定表格中的数据。
  2. 打开或新建要写入数据的Excel。
  3. 将数据写入Excel。

# 操作步骤

本操作步骤涉及组件的高级设置与错误处理均保持默认设置,仅对常规设置进行配置。

  1. 提取PDF文件表格中的数据。

配置项 说明
待读取文件路径 待操作PDF文件的来源,本文以直接打开本地PDF文件为例。
表格所在页面 表格所在页面的页码,本示例为1,即PDF文件的第一页。
表格位置序号 表格在当前页面内的位置序号,本示例为1,即第一页中的第一个表格。
结果暂存为 将获取到的PDF中的表格数据(数据表)暂存为变量并命名,名称可自定义,默认命名为PDF中的数据表
  1. 打开或新建Excel文件,用于存储提取的PDF表格中的数据。

配置项 说明
打开以下地址中的Excel 待操作的Excel文件的来源,本文以直接打开本地已有Excel文件为例。
结果暂存为 将打开的Excel对象暂存为变量并命名,名称可自定义,默认命名为Excel文件
  1. 将从PDF文件表格中读取的数据写入已打开的Excel文件中。

配置项 说明
待写入数据 待写入数据的来源,本文为步骤1中暂存的数据PDF中的数据表
写入方式 写入数据的方式,本文选择从指定单元格开始向右向下写入
目标起始单元格 写入数据的起始位置,本文为步骤2中暂存的Excel文件Sheet1中的A1单元格。

# 流程展示


# 相关组件

最近更新时间: { "value": "2023-02-16", "effect": true }