Loading...

超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字

GoodNav 11 月 5 日报道,Google Research 展示了一种利用人工智能读取手写文本的新技术。名为 InkSight 的系统能直接从手写文字图像中提取数字文本,无需任何中间介质。

超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字

传统的手写识别技术主要依赖于光学字符识别 (OCR),但在处理复杂的背景、模糊或低光照条件下的手写文字时,效果往往不尽如人意。而 InkSight 采用了不同的方法,通过模仿人类的阅读过程来提高识别准确性,即不断重写文本,从而学习整个单词的外观和含义。这一过程需要研究人员对 AI 模型进行训练,使其能够识别并模仿人类的手写风格。

超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字

在处理复杂的场景时,InkSight 显示出更强的性能,例如在光线较暗、文本部分遮挡或背景干扰的情况下,InkSight 能更加精准地识别手写文字。研究人员发现,人类对 InkSight 生成的文本描摹的识别率高达 87%,其中三分之二的描摹几乎无法与真实的手写文本区别开来。

对于喜欢手写的人而言,InkSight 展现出巨大的潜力。试想一下,只需拍摄手写笔记的照片,即可快速将其转化为可搜索的数字文本。对于那些字体潦草的人,InkSight 能够将难于辨识的手写内容转换为清晰且准确的打印文本。

从更宏观的角度看,这项技术在解读并将几个世纪以来的手写文本数字化方面具有重要的意义。即使是对那些数字化程度较低的语言,InkSight 也能助力于保护手写文化遗产,并为这些语言的数字化训练提供更多支持。

需要指出的是,谷歌并非唯一一家专注于手写识别 AI 工具研发的公司。亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转化为可读文本的功能。此外,像 Goodnotes 这样的数字笔记应用也已经推出了手写识别和编辑功能,可以将手写内容转换为可编辑的数字文本。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...