📄 PDF 处理 Skill - 中文版(已验证可用)
简介
自己写了一个 PDF 处理 Skill,已验证可用。支持中文!
功能
- 读取 PDF 信息(页数、Metadata)
- 提取文本
- 合并多个 PDF
- 拆分 PDF
- 提取页面范围
- 旋转页面
- 读取加密 PDF
- 生成中文 PDF
依赖
pip install pypdf fpdf2
常用代码
读取 PDF
from pypdf import PdfReader
reader = PdfReader("document.pdf")
print(f"页数: {len(reader.pages)}")
提取文本
text = ""
for page in reader.pages:
text += page.extract_text()
合并 PDF
from pypdf import PdfWriter, PdfReader
writer = PdfWriter()
for pdf in ["file1.pdf", "file2.pdf"]:
reader = PdfReader(pdf)
for page in reader.pages:
writer.add_page(page)
with open("merged.pdf", "wb") as f:
writer.write(f)
拆分 PDF
for i, page in enumerate(reader.pages):
writer = PdfWriter()
writer.add_page(page)
with open(f"page_{i+1}.pdf", "wb") as f:
writer.write(f)
生成中文 PDF
from fpdf import FPDF
pdf = FPDF()
pdf.add_page()
pdf.add_font("PingFang", "", "/System/Library/Fonts/PingFang.ttc", uni=True)
pdf.set_font("PingFang", size=24)
pdf.cell(200, 20, text="你好,这是中文PDF!", new_x="LMARGIN", new_y="NEXT")
pdf.output("chinese.pdf")
验证结果
✅ 创建 PDF - 通过
✅ 读取页数 - 通过
✅ 提取文本 - 通过
✅ 拆分功能 - 通过
✅ 合并功能 - 通过
✅ 旋转功能 - 通过
✅ 中文 PDF - 通过
3 赞0 评论技能来自第三方,未经过人工测试,请注意防范潜在风险