readPdf.py 662 B

1234567891011121314151617181920212223242526272829
  1. import pdfplumber
  2. # 初始化 ollama.Client
  3. # 读取 PDF 文件并提取文本
  4. def extract_text_from_pdf(pdf_path):
  5. text = ""
  6. with pdfplumber.open(pdf_path) as pdf:
  7. for page in pdf.pages:
  8. text += page.extract_text()
  9. return text
  10. def read_pdf(pdf_path):
  11. # PDF 文件路径
  12. # pdf_path = "path_to_your_pdf_file.pdf"
  13. # 提取 PDF 文本
  14. pdf_text = extract_text_from_pdf(pdf_path)
  15. # 使用提取的文本作为问题材料
  16. return pdf_text
  17. if __name__ == "__main__":
  18. pdf_text1 = read_pdf('G:\\资料\\工作安排\\2月6日工作安排计划表-20250205.pdf')
  19. # 打印响应
  20. print(pdf_text1)