尊而光上海团队律师

  • 执业资质:2420120**********

  • 执业机构:湖北尊而光律师事务所

  • 擅长领域:债权债务合同纠纷劳动纠纷婚姻家庭房产纠纷

打印此页返回列表

OCR算法技术侵权么?(一)

发布者:尊而光上海团队律师|时间:2020年11月26日|分类:经济仲裁 |610人看过

OCR即(Optical acter Recognition,光学字符识别)是指电子设备检查纸上打印或环境内浮现的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。这项技术可应用场景极多,如拍照翻译、拍照取字词句、印刷品内文字提取编辑、点读、指读、自动朗读等。我们可以看到如百度、夸克、金山、网易等众多互联网公司都在自己的产品内应用了这项技术。通过技术,为广大用户提供了良好的体验价值。
       经过多年的广泛实践,而今追求更高精准度的标准OCR技术开展已愈发离不开算法能力的提升和应用。算法尤其是经过模型化训练的算法对于复杂环境、场景中准确识别文字、准确呈现文字已具有不可替代的作用。OCR技术的行业门槛本身已相对较高,而在较高的门槛之上,体现不同服务者技术能力、体验优异差别的关键就在于各方算法模型的差异。 

       从行业目前的通行做法看,体验优异的算法模型离不开大量的文字标注及基于文字标注的算法训练,此为必需亦为惯例。标注、训练则依赖大量的文字载体作为训练素材。这里的文字载体可能包括出版物、可能包含印刷品、可能包含多种复杂文字呈现场景如照片、证件照、快递条形码、美术作品、横幅、手写文字等。在对上述内容、文字进行标注后,才可以进行算法训练,提取出相应载体的算法特征值数据。特征值可能包含文本特征及图像特征。基于已提取的特征值才可以形成完备的算法模型。 

       由此引出一个问题:如果用来做文字标注及算法训练的内容为著作权作品的载体,那在OCR技术的准备(文字标注、算法训练)及整个技术实现过程中,是否会侵犯作品的著作权?
文章来源网络,若有侵权请联系删除。

0 收藏

相关阅读

免责声明:以上所展示的会员介绍、亲办案例等信息,由会员律师提供;内容的真实性、准确性和合法性由其本人负责,华律网对此不承担任何责任。