跳至主要內容

PDF关键词抽取

yczha小于 1 分钟pythonPDFofficepythonexcelPDF

功能介绍:程序从txt文件中读取内容然后抽取指定内容,要抽取的关键词需要写入Excel中,一个PDF样本如下示例:

样本
样本

保存到Excel的样本如下图示意:

保存结果
保存结果

最终提取的结果如下示意:

提取结果
提取结果
  • 用法:

    • 首先将PDF转换为TXT文件,转换方法如下:

      • 使用迅捷转换器转换
迅捷转换器
迅捷转换器
  • 将所有需要转换的TXT文件放在一个文件夹内

  • 双击运行PDF2Excel.exe ,弹出如下界面:

程序界面
程序界面
- 依次选择TXT文件夹路径,Excel路径,保存路径
- 运行程序得到结果
  • 完整项目及代码下载地址:https://github.com/yooongchun/04_PDF2Excel_key-value