我正在尝试将 PDF 预处理为 OCR 的 TIF 图像。在命令行上,我可以通过使用以下 ImageMagick 命令将 PDF 转换为 TIF 来完成此操作:$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff我怎样才能在 Java 中获得等效的结果?我目前可以使用 tess4j 将 PDF 转换为 TIF,但是如何重新缩放和预处理生成的 tif?哪些库可以让我快速轻松地做到这一点?
1 回答

达令说
TA贡献1821条经验 获得超6个赞
弄清楚了。与其尝试学习另一个图像预处理库,我只是使用im4java来扭曲 IM 命令行,然后直接将命令翻译成以下内容:
ConvertCmd cmd = new ConvertCmd();
IMOperation op = new IMOperation();
op.addImage(imagePath);
op.density(300);
op.depth(8);
op.strip();
op.background("white");
op.alpha("off");
try {
cmd.run(op);
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (IM4JavaException e) {
e.printStackTrace();
}
添加回答
举报
0/150
提交
取消