rpa_pdf_open

打开PDF文件

1. 函数

rpa_pdf_open(filePath)

filePath：字符串类型，PDF文件路径；

2. 返回值

返回PDF操作标识符，字符串类型。通过此对象可进行其他PDF操作。

若返回空表示执行失败，通过rpa_getLastErrorCode()获取错误码，rpa_getLastErrorMsg()获取错误信息。

3. 示例

#打开PDF文件
pdfId = rpa_pdf_open("d:/test.pdf")

#打开失败结束流程
if not pdfId:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()

#获取PDF文件总页码,若返回0，则表示发生错误
if rpa_pdf_pages(pdfId) == 0:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()

#获取PDF指定页的文本内容，可以对文本进行相应操作
#若pageIndex使用默认参数-1，比pageText为整个PDF文档的所有文本内容
pageText = rpa_pdf_extract_text(pdfId,9)
if not pageText:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
reg = re.compile(r'乙方承诺在\s*【(\s*\d*\s*|\s*/\s*)】\s*（选择1或2或3或4）（1）每年度（2）每半年度（3）每季度（4）每月度')
result = reg.search(pageText)
try:
    findInfo = result.group(1).strip()
except IndexError:
    rpa_log("解析失败")
    rpa_exit()

#获取打开PDF文件指定页码的每行文本列表
wordArr = rpa_pdf_extract_words(pdfId,pageIndex = 9)
if not wordArr:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
for word in wordArr:
    rpa_log(word['text'])

#获取打开PDF文件指定页码的表格数据
tables = rpa_pdf_extract_tables(pdfId,pageIndex=0)
if not tables:
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())
    rpa_exit()
for index in range(len(tables)):
    rpa_log("第%d个表格行数据" % index)
    for row in range(len(tables[index])):
        rpa_log(tables[index][row]

#关闭PDF文件,调用该接口后，pdfId失效，无法进行相应的PDF操作
if not rpa_pdf_close(pdfId):
    rpa_log(rpa_getLastErrorCode())
    rpa_log(rpa_getLastErrorMsg())

找到相关内容个

未找到""相关内容

找到相关内容个

未找到""相关内容