解码 PDF 文档

问题:

供应商提供的产品手册是设置了密码的 PDF 文件,每次在打开时都需要输入密码。

现在的问题是能否清除密码。

解决:

查找下来,pypdf 项目可以解决。项目主页在这里:https://github.com/py-pdf/pypdf

使用方法大概是这样的:

1, 创建 Python 虚拟环境

2, 下载并安装 pypdf 包:

pip install pypdf

3, pypdf 的文档里描述了Decrypt相关的调用方法:

from pypdf import PdfReader, PdfWriter

reader = PdfReader("encrypted-pdf.pdf")

if reader.is_encrypted:
    reader.decrypt("XXXXXX")

writer = PdfWriter(clone_from=reader)

with open("decrypted-pdf.pdf", "wb") as f:
    writer.write(f)

示例里生成的 decrypted-pdf.pdf 可以直接打开浏览。

对于实际的产品手册,适当地调整代码即可。

Read More: