rpa_pdf_open

打开PDF文件

1. 函数

rpa_pdf_open(filePath)

  • filePath:字符串类型,PDF文件路径;

2. 返回值

返回PDF操作标识符,字符串类型。通过此对象可进行其他PDF操作。

若返回空表示执行失败,通过rpa_getLastErrorCode()获取错误码,rpa_getLastErrorMsg()获取错误信息。

3. 示例

#打开PDF文件
pdfId = rpa_pdf_open("d:/test.pdf")

#打开失败结束流程
if not pdfId:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()

#获取PDF文件总页码,若返回0,则表示发生错误
if rpa_pdf_pages(pdfId) == 0:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()

#获取PDF指定页的文本内容,可以对文本进行相应操作
#若pageIndex使用默认参数-1,比pageText为整个PDF文档的所有文本内容
pageText = rpa_pdf_extract_text(pdfId,9)
if not pageText:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
reg = re.compile(r'乙方承诺在\s*【(\s*\d*\s*|\s*/\s*)】\s*(选择1或2或3或4)(1)每年度(2)每半年度(3)每季度(4)每月度')
result = reg.search(pageText)
try:
    findInfo = result.group(1).strip()
except IndexError:
    rpa_log("解析失败")
    rpa_exit()

#获取打开PDF文件指定页码的每行文本列表
wordArr = rpa_pdf_extract_words(pdfId,pageIndex = 9)
if not wordArr:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
for word in wordArr:
    rpa_log(word['text'])

#获取打开PDF文件指定页码的表格数据
tables = rpa_pdf_extract_tables(pdfId,pageIndex=0)
if not tables:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
for index in range(len(tables)):
    rpa_log("第%d个表格行数据" % index)
    for row in range(len(tables[index])):
        rpa_log(tables[index][row]

#关闭PDF文件,调用该接口后,pdfId失效,无法进行相应的PDF操作
if not rpa_pdf_close(pdfId):
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
powered by Gitbook修订时间: 2021-04-15 15:56:54

找到相关内容

    未找到""相关内容

    找到相关内容

      未找到""相关内容