跳至主要內容
PDF词频统计

需求描述:在我的keywordsExtractor 目录下有一些文件夹,文件夹内是pdf文件,我需要把这些pdf文件跟目标股票进行对比,如果该PDF属于目标股票,那么加载,否则不加载。然后把PDF中的一些特定关键词出现次数提取到Excel中,如下示例:


yczha大约 5 分钟pythonPDF专题PDF词频统计pdfplumber
PDF表格提取

本文介绍一个提取PDF中的表格内容的程序。首先,程序给出使用示例,最后给出代码开发思路及细节。


yczha大约 10 分钟pythonPDF专题PDF表格提取pdfplumber
PDF电子发票解析

文章介绍把PDF格式的电子发票内容提取出来保存到Excel中


yczha大约 7 分钟pythonPDF专题PDF发票解析pdfplumber
PDF文档内容替换

这篇文章介绍了如何使用Python3把PDF文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则。


yczha大约 6 分钟pythonPDF专题文档替换PDF转Word
PDF文本解析

最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标。


yczha大约 13 分钟pythonPDF专题officePDF内容解析pdfminer3K
PDF内容解析

这篇文章主要介绍如何使用Python[3.6版本]中的PDFminer3k 模块来抽取PDF内容,包括文本、图像、曲线等。


yczha大约 2 分钟pythonPDF专题officePDF内容解析pdfminer3K