【当前热闻】高精度离线免费的C#文字识别PaddleOCR库

发表于: 2023-06-21 13:14:04 来源：博客园

随便打开一个Microsoft Visual Studio，新建一个WinForms项目，从下面列表中随便选择一个NET框架。目标平台要设置成X64，该OCR仅支持64位。

net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;netstandard2.0;netcoreapp3.1;net5.0;net6.0;net7.0;

创建完窗口后，切换到【程序包管理控制台】，输入下面命令并回车：

Install-Package PaddleOCRSharp -Version 3.1.0

也可以：项目名称右键点击》管理nuget程序包,在浏览界面，搜索“PaddleOCRSharp”选择最新版本点击【安装】

(资料图)

按照上面操作完成PaddleOCRSharp的依赖包安装。

在窗口界面拖放一个按钮，并双击，在按钮的点击事件中，输入以下代码：

OpenFileDialog ofd = new OpenFileDialog();  ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";  if (ofd.ShowDialog() != DialogResult.OK) return;  var imagebyte = File.ReadAllBytes(ofd.FileName);  Bitmap bitmap = new Bitmap(new MemoryStream(imagebyte));  OCRModelConfig config = null;  OCRParameter oCRParameter = new  OCRParameter ();  OCRResult ocrResult = new OCRResult();  //建议程序全局初始化一次即可，不必每次识别都初始化，容易报错。  PaddleOCREngine engine = new PaddleOCREngine(config, oCRParameter);   {    ocrResult = engine.DetectText(bitmap );   } if (ocrResult != null) {    MessageBox.Show(ocrResult.Text,"识别结果"); }

然后按F5运行，点击按钮，选择一个本地图片，进行OCR文字识别。

弹出识别结果，说明你已经上手学会了如何使用OCR，就这么简单。

PaddleOCRSharp项目，是基于百度飞桨OCR代码修改并封装的.NET的工具类库。包含文本识别、文本检测、基于文本检测结果的统计分析的表格识别功能，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测。项目封装极其简化，实际调用仅几行代码，极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别，同时提供不同的.NET框架使用，方便各个行业应用开发与部署。Nuget包即装即用，可以离线部署，不需要网络就可以识别的高精度中英文OCR。

关键：离线、免费、高精度、开源

项目开源地址：https://gitee.com/raoyutian/paddle-ocrsharp

github地址：https://github.com/raoyutian/PaddleOCRSharp

同时，，该核心PaddleOCR.dll库，还支持Python.GO.C++.Rust等语言调用哟！

你get到了吗？

关键词：