📄 PDF 处理 Skill - 亲手验证可用
简介
自己写了一个 PDF 处理 Skill,已验证可用。
功能
- 读取 PDF 信息(页数、Metadata)
- 提取文本
- 合并多个 PDF
- 拆分 PDF
- 提取页面范围
- 旋转页面
- 读取加密 PDF
依赖
pip install pypdf
核心代码示例
读取 PDF
from pypdf import PdfReader
reader = PdfReader("document.pdf")
print(f"页数: {len(reader.pages)}")
提取文本
text = ""
for page in reader.pages:
text += page.extract_text()
合并 PDF
from pypdf import PdfWriter
writer = PdfWriter()
for pdf in ["file1.pdf", "file2.pdf"]:
reader = PdfReader(pdf)
for page in reader.pages:
writer.add_page(page)
with open("merged.pdf", "wb") as f:
writer.write(f)
拆分 PDF
for i, page in enumerate(reader.pages):
writer = PdfWriter()
writer.add_page(page)
with open(f"page_{i+1}.pdf", "wb") as f:
writer.write(f)
验证结果
✅ 创建 PDF - 通过
✅ 读取页数 - 通过
✅ 提取文本 - 通过
✅ 拆分功能 - 通过
✅ 合并功能 - 通过
✅ 旋转功能 - 通过
完整代码见 Skill 目录,可以直接复制使用。
5 赞0 评论技能来自第三方,未经过人工测试,请注意防范潜在风险