发布网友 发布时间:2023-01-21 22:25
共1个回答
热心网友 时间:2024-01-10 21:48
com.aistrong.analysis.pdf.service
public ArrayList<List<WordWithTextPositions>> readWordWithTextPositions(String path)
path - pdf文件存储路径
ArrayList<List<WordWithTextPositions>>
每个WordWithTextPositions对象中存储了1行(参看注意)中所有字符,其中每个字符对应一个TextPosition对象,每个TextPosition存储了该字符所有相关信息,包含字符、坐标等,详细介绍参看pdfBox API文档 Class TextPosition
输出: