使用LEADTOOLS将图像转换为包含文本、元数据的可检索PDF文件:25天25个项目

作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于艾伦的分享。

发布于 2016/03/02 00:00

行业动态

作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于艾伦的分享。

默认的转换窗体

clip_image001

填充转换窗体

clip_image002

元数据对话框

clip_image003

填充元数据对话框

clip_image004

它是做什么的

该项目将利用LEADTOOLS第19版来实现从图像到可检索的、图像超文本的、包含元数据的PDF文件的转换。

所使用的功能

· PDF

· OCR


开发进程日志

大家好,我是艾伦。我要写这样一个C#的WinForms应用程序,该程序可以将所有类型的文件都转换成可搜索的PDF文件。该应用程序将包括可以使用图像超文本属性,以及可以添加元数据到输出的PDF文件的功能。

创建应用程序的主用户界面这一部分我已经完成。这大约花了我一个小时的时间。

现在我要开始使用我们的优势OCR引擎来识别文档,这样,我就可以将它保存为可检索的PDF文件。

Documentation: IOcrEngine

使用了优势OCR引擎以后,现在,无需所添加的各种功能,该应用程序就可以将文件转换为可检索的PDF文件。这个部分花了我大约一个小时时间才完成,包括调试过程。

现在,我要开始实现将其保存为具有图像超文本属性的PDF文件的功能。

Documentation: Image Over Text

现在我已经实现了具有图像超文本特征的保存功能。这只需花十五分钟左右即可完成。

现在,我要开始实现将元数据添加到输出的PDF文件的功能。

Documentation: PdfDocumentOptions

现在,我已经实现了将元数据添加到输出的PDF文件的功能。这花了我大约一个小时的时间才完成,包括为获取用户所需的元数据而创建弹出窗体的时间。

至今为止,这一共花了我三个半小时的时间。而我,现在要开始做一些测试。

现在,我已经修复了在我的应用程序中发现的一些漏洞,并且添加了一些可以使代码更容易阅读的注解。这大约花了我一个小时左右的时间。这样,我的应用程序已经准备好进行部署了。

从开始到结束,我一共花了五个半小时的时间来完成该应用程序的开发。如果没有LEADTOOLS的帮助,这可能需要花费我几个星期,甚至几个月的时间。

下载该项目

该示例项目的源代码您可以点击进行下载。

06 Convert to PDF Series.zip

要运行这个程序,请将文件解压缩至:C:\LEADTOOLS 19\Examples\DotNet\CS 目录下。

 

支持

关于其他产品的更多信息,请访问我们的官方网站

欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持

关于葡萄城

葡萄城是专业的软件开发技术和低代码平台提供商,以“赋能开发者”为使命,致力于通过表格控件、低代码和BI等各类软件开发工具和服务,一站式满足开发者需求,帮助企业提升开发效率并创新开发模式。葡萄城开发技术始于1980年,40余年来始终聚焦软件开发技术,有深厚的技术积累和丰富的产品线。是业界能够同时赋能软件开发和低代码开发的企业。凭借过硬的产品能力、活跃的用户社区和丰富的伙伴生态,与超过3000家合作伙伴紧密合作,产品广泛应用于信息和软件服务、制造、交通运输、建筑、金融、能源、教育、公共管理等支柱产业。

推荐相关资源
关注微信
葡萄城社区二维码

关注“葡萄城社区”

活字格低代码二维码

关注“活字格低代码”

想了解更多信息,请联系我们, 随时掌握技术资源和产品动态