python tabula模块 怎么安装
发布网友
发布时间:2024-10-02 06:39
我来回答
共1个回答
热心网友
时间:2024-11-23 04:42
试试tabula,读取pdf后可转为pandas dataframe进行后续处理,也可直接输出csv文件。
python版本的项目主页,有示例代码:https://github.com/chezou/tabula-py
安装:pip install tabula-py
如果包含中文内容需要修改编码格式:
pd.read_csv("example.csv", encoding="GB18030")
参考:pandas怎样处理中文? - 数据挖掘 - 知乎
(ps下次提问请先查看万能的stackoverflow:
Extracting table contents from a collection of PDF files)