为了账号安全,请及时绑定邮箱和手机立即绑定

如何提取答题纸中的书面数字(图片)

如何提取答题纸中的书面数字(图片)

C#
慕姐8265434 2022-12-31 11:24:41
我试过 tesseract 但它只适用于纯文本文档,任何人都可以建议我该怎么做吗? 这是我的 vb.net 代码Dim pic = New Bitmap(OpenFileDialog1.FileName) Dim ocr = New TesseractEngine("./dataset", "eng", EngineMode.TesseractAndCube) Dim page = ocr.Process(pic) TextBox1.Text = page.GetText
查看完整描述

1 回答

?
喵喔喔

TA贡献1735条经验 获得超5个赞

看起来你的答题纸结构合理。我会专注于为每个答案提取子图像,然后在该图像上以单字符模式运行 Tesseract。我不确定你如何在你使用的任何 Tesseract 包装器中获得单字符模式,但通过命令行它是参数:--psm 10

要提取每个图像,我会使用 OpenCV(尝试Emgu for .NET)。您可能需要先应用透视环绕以获得正方形图像。然后您可以使用一个简单的滑动窗口来获取每个子图像。

我不确定在答案被划掉的情况下这将如何执行。



查看完整回答
反对 回复 2022-12-31
  • 1 回答
  • 0 关注
  • 57 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信