当前位置:首页 > 网络黑客 > 正文内容

ocr识别软件哪个好用(更好用的ocr文字识别软件)

访客3年前 (2022-01-26)网络黑客776

创作立场声明:本人长年热衷于挖掘各种好玩有趣或稀奇古怪的电脑软件和手机 App,写文科生都能看得懂玩得转的玩机教程,期待和大家的深入探讨交流。

今天来反思一下关于 OCR 这一块的问题。

5 月底,给大家安利了天若 OCR 的最后一个开源版本 5.0,但我一直心中有愧。

一方面我的需求没有那么大,把一直用着的天若拉出来其实有点取巧,真正偶尔用一次的情况下,完全可以用 *** 自带的文字识别。

另一方面天若那个版本两三年没更新了,作者跑去维护别的项目去了,虽然说是接受百度、搜狗、腾讯、有道四个接口。

但公共接口挂了两个(腾讯、百度),而真正支持用自己申请的接口只有百度一个。

看很多小伙伴其实对百度这个接口并不买单,这是我有愧的地方。

毕竟咱偶尔分享一个应用,就是想让更多人了解到更好用的软件,违背了初衷我可不干。

好在那次摸索的 OCR 的时候,了解到 PandaOCR 可以支持多个自定义接口。

怎么说呢,就很强大。

作者也是个爆肝强人,每逢节假日还在那里更新迭代,比起早早退出舞台的天若 5.0 更值得拿出来说道说道。

这不,它来了。

PandaOCR

额,今天介绍的版本是 PandaOCR 2.71。

这大概是最后一个免费提供多自定义接口的版本了。

前几天去 GitHub 上翻 PandaOCR 的时候,发现多了个 Pro 版本。

作者原话,因为前期急着上新功能,结果忽视了执行逻辑混乱以及后续维护成本高的问题。

换句话说,就是作者把旧版的代码定性成屎山了。

与其满头大汉(不是错字)的折磨自己,不如重构一遍,跳过那座山,然后就有了 Pro 版。

这是 PandaOCR Pro 5.32:

可问题是 Pro 版只提供有百度的自定义接口,别的接口都成收费服务了。

所以,各种意义上说,PandaOCR 2.71 就成了能 *** 的最后一个版本。

不过作者说啊,这最后一个版本只是不上新功能了,已有的功能接口仍会维护。

对于绝大部分人来说,这就够了,比如我。

如果你真心喜欢这个浓眉大眼小熊猫,还是可以给作者支持一波。

能做什么

一款集大成的 OCR 工具有什么用?

对于文本识别质量而言,那是接口的对比,如果弄不太明白的,可以看看天若 OCR 的那篇文章。

就识别效果而言,搜狗的准确率高些,百度手写识别的效果更好,有道的识别速度更快,讯飞和 Mathpix 的公式识别更清晰,百度的表格识别也不错。

所以抛开接口,回归到 PandaOCR 自身,它提供了怎样的方便,才是我们该关心的。

我们重新认识一下它的界面,左边显示图片,右边则是识别文本和翻译框,外加一个功能栏:

操作起来很方便,默认快捷键「F4」截图,然后就能调用你选择的接口自动识别。

识别的内容会显示在桌面,以弹窗的形式显示,至于显示的内容,可以在「高级」设置中选择。

当然,高级设置里能更改更多东西,比如是否监听剪切板,是否自动复制识别的内容,甚至字体、截图方式等等。

双击 PandaOCR 的识别和翻译那一块,还会有惊喜,打开监听剪切板,分分钟变成一个翻译软件。

对了,还有个固定截图的功能,简单的说,就是把截图框固定到桌面一处,然后快捷键触发 OCR 识别。

我看 B 站上已经有人拿它来做游戏机翻工具了,效果是这样的。

我就不重复造轮子了,感兴趣的可以去研究一下。

PandaOCR 之所以强大,还是因为它支持的接口多,那它到底能使用什么接口呢?

我从它配置文件里看了一下:

支持通用识别:搜狗 + 腾讯 + 百度 + 有道 + 阿里 + 讯飞 + 网校 + SpaceOCR

支持手写识别:腾讯 + 百度 + 阿里 + 讯飞

支持公式识别:微软(演示)+ 百度 + 腾讯 + Mathpix + 讯飞

支持表格识别:有道(演示)+ 百度 + 腾讯 + 阿里

支持翻译:搜狗 + 腾讯 + 百度 + 有道 + 彩云小译 + DeepL

是不是看的都有些怵的慌,事实上早先版本的接口更多,最后一个版本应该删除了近 20 个接口。

但设置起来并不麻烦,右键点击左上角的图标,选择「编辑配置」,在文本中更改对应的接口就行。

至于怎么申请接口,又要放哪里,我这里还是以百度为例,介绍一下。

申请接口

进入百度 AI 开放平台,注册登录个账号先。

然后在「人工智能」找到「OCR 文字识别」里的「通用场景文字识别」。

当然你也可以在这里找到「OCR 文字识别」:

反正流程不变,选择「创建应用」。

然后「应用名称」和「应用描述」都随便填,记得「应用归属」选择个人。

最后立即创建,从「应用列表」把 API Key 和 Secret Key 记录下来。

总结一下申请流程,就是注册登录 – 申请 – 填信息 – 开通 – 复制 ID 和密钥 – 在 Panda 中粘贴-重载配置文件。

就是中间这个粘贴步骤,PandaOCR 的格式一直是「ID | KEY」,竖线前后都有个空格,最容易出错的就是这里了。

纵观整个流程,相信我,真的没有你想的那么难。

我就不光明正大借着申请接口来水字了,再简单说说接口免费额度以及注意事项。

百度

我以前见过的这种类似的工具,一般给的接口都是百度的。

无他,实在是百度给的免费额度太多了,通用 OCR 识别的每日额度高达 5 万。

可惜,这些都成了过往云烟,5 月底的时候百度把额度改成了未实名 200 次/月,实名 1000 次/月。

所以百度的接口再也不是最香的了,但百度的手写识别还是挺给力的。

免费额度如下:

通用识别 1000 次/月,高精度通用识别 1000 次/月,表格识别 500 次/月,手写识别 500 次/月,通用翻译免费。

腾讯

腾讯云在开通识别时,有个营业执照,那个不管它,直接选确定就行。

还有就是需要自己申请一下密钥(账号信息-访问管理),不过那个腾讯云的翻译,现在好像只能使用 API 参数调用,PandaOCR 应该是用不成了。

至于免费额度,腾讯云的 OCR + 表格 + 公式接口共用 1000 次/月,翻译 5 百万/月。

搜狗

搜狗没有免费额度,而是直接按次收费的,能免费用的点在于刚开始送的 100 元新用户注册券。

而且作者说是得充点钱才能用,我往里充了一块钱,正在白嫖那 100 元的新人福利。

有道

和搜狗一样是按量收费的,新人福利 50 元。

阿里

阿里云的 OCR 也是按次收费的,更大的优惠应该是不可重复购买的那个每 500 次 0.01 元了。

SpaceOCR

每月有 2.5 万次的免费额度,不过是个国外的网站,邮箱注册(亲测 *** 邮箱可用),看不懂的直接机翻就行。

网校

也就是好未来,PandaOCR 只提供了好未来 OCR 的接口,没有翻译接口,所以翻译那个就不用添到项目里了。

免费额度都是每日 100 次,手写也是百次(过去好像是每日 10 万,哭了)。

讯飞

讯飞的 OCR 识别的免费形式,是 90 天的 10 万次使用,时间到或者用完即止。

DeepL

不陌生吧,翻译里的 yyds,它家 API 的免费额度为每月 50 个字符。

但是,亚洲只有个日本,街道那把我给尬住了,所以我放弃了,溜。

Mathpix

注册登录没啥的,免费额度每月 1000 次的公式识别,但是创建项目时需要 1 美元的手续费,所以这就意味着你得用到信用卡。

总结

PandaOCR 这个工具,不仅可以像常规 OCR 工具那样截图识别,固定截图和复制翻译的功能给了它更多的可能。

拿来翻译论文、做机翻工具都可以,而这都源于大厂的提供的接口。

PandaOCR 就像是一个中间的掮客,把大厂资源汇集一处,带来了全新的可能。

不过有一说一,现在白嫖大厂资源是越来越难了。

但要说缺点的话,就是这玩意用起来太复杂了。

但可能很长一段时间,我的 OCR 工具都不会改了,为了写这一篇文章,我把所有的接口都申请了一遍,不过也算有所得。

下回碰到更好用的OCR,估计我就转投付费软件的阵营了。

这一篇到这里就结束了,我们有缘下篇再见咯。

本文首发于程序员不高兴,未经授权请勿转载!

一如既往感谢各位小伙伴的支持和关注!

扫描二维码推送至手机访问。

版权声明:本文由黑客技术发布,如需转载请注明出处。

本文链接:http://w-123.com/90690.html

标签: 网站随笔

“ocr识别软件哪个好用(更好用的ocr文字识别软件)” 的相关文章

脸书被欧盟罚款 1.2 亿:大规模数据泄露

Facebook母公司Meta被欧盟罚款1700万欧元(约合1900万美元),原因是它未能阻止Facebook平台在2018年发生的一系列数据泄露事件,违反了欧盟的隐私规则。 Meta在欧盟的主要隐私监管机构爱尔兰数据保护委员会表示,他们发现Facebook“未能采取适当的技术和组织措施”。 20...

以色列阻止乌克兰购买 NSO 集团的“飞马”间谍软件

据熟悉此事的人士透露,以色列阻止乌克兰购买NSO集团开发的飞马(Pegasus)间谍软件,因为其担心俄罗斯官员会因此而感到愤怒。在《卫报》和《华盛顿邮报》的联合调查之后,这一启示为以色列跟俄罗斯的关系有时会破坏乌克兰的进攻能力提供了新的见解–并跟美国的优先事项相矛盾。 自俄罗斯于2月24日对乌克兰...

半数北美企业高管与雇员收到过黑客提出的协助发起勒索软件攻击请求

为应对近年来不断增长的勒索软件攻击,越来越多的企业 IT 高管和员工,已经收到了专业人士的相关安全建议。Hitachi ID 刚刚公布了针对北美企业的最新调查报告,其中强调了内外部的 IT 安全措施需求。可知有 65% 的受访者表示,他们有被黑客接近,试图引诱他们参与谋划针对自家企业的勒索软件攻击。...

BlackTech 组织与他们使用的恶意软件 Gh0stTimes

BlackTech是一个网络间谍组织,在2018年前后对日本发起攻击活动。近日,研究人员发现了BlackTech可能使用的恶意软件Gh0stTimes。 研究人员在受Gh0stTimes感染的服务器上还发现了其他恶意软件,如下载器、后门程序、ELF Bifrose和攻击工具。这些工具可能会也被Bl...

Clop 勒索软件团伙在警方展开突袭行动后又曝光了两位受害者

据外媒报道,就在几天前,乌克兰警方逮捕了Clop勒索软件背后组织的6名成员。上周,乌克兰国家警察(National Police of Ukraine)跟韩国和美国的官员一起进行了一次执法行动,他们逮捕了多名据信跟Clop勒索软件团伙有关的嫌疑人。这被认为是国家执法机构首次大规模逮捕涉及勒索软件的团...

卡巴斯基发现朝鲜支持的黑客组织最近攻击了韩国多个行业

针对韩国多种行业的恶意软件活动被认为是一个名为Andariel的朝鲜国家黑客组织所为。据《黑客新闻》报道,这一进展表明,Lazarus黑客攻击者正在紧跟潮流,扩大他们的武器库。卡巴斯基实验室在一份详细的报告中指出:”这次活动中使用Windows命令及其选项的方式与以前的Andariel活动几乎相同...

评论列表

拥嬉墓栀
2年前 (2022-07-26)

OCR + 表格 + 公式接口共用 1000 次/月,翻译 5 百万/月。搜狗搜狗没有免费额度,而是直接按次收费的,能免费用的点在于刚开始送的 100 元新用户注册券。而且作者说是得充点钱才能用,我往里充了一块钱,正在白嫖那 100 元的新人福利。有道和搜狗一样是按量收费的,新人

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。