解码 PDF 文档
问题:
供应商提供的产品手册是设置了密码的 PDF 文件,每次在打开时都需要输入密码。
现在的问题是能否清除密码。
解决:
查找下来,pypdf
项目可以解决。项目主页在这里:https://github.com/py-pdf/pypdf
使用方法大概是这样的:
1, 创建 Python 虚拟环境
2, 下载并安装 pypdf
包:
pip install pypdf
3, pypdf
的文档里描述了Decrypt相关的调用方法:
from pypdf import PdfReader, PdfWriter
reader = PdfReader("encrypted-pdf.pdf")
if reader.is_encrypted:
reader.decrypt("XXXXXX")
writer = PdfWriter(clone_from=reader)
with open("decrypted-pdf.pdf", "wb") as f:
writer.write(f)
示例里生成的 decrypted-pdf.pdf
可以直接打开浏览。
对于实际的产品手册,适当地调整代码即可。