PDFlux软件是一款文档内容提取神器,这款软件采用智能化的文档提取技术,可轻松识别多种办公文档,并根据用户的需求将需要使用的文件数据提取出来为用户所用;除了智能识别文档之外,您可以能够使用这款软件进行文档格式转换,支持转换的文档格式有PDF、Word、Excel、HTML、EPUB、MOBI等;软件高效且稳定的特征是众多职场人士选择选择它的原因之一,PDFlux支持SaaS服务,因此通过API,它就可以能够批量将文档处理成段落,表格或者图片等;它还支持充当浏览器的阅读插件,在浏览器中将其添加,当打开PDF文件时就可以能够快速的使用它打开,而不是在浏览器中打开。

软件功能
表格识别
1、精准识别无线框表格
2、精准识别复杂排版页面的表格
3、精准识别表格内部单元格合并
4、跨页表格自动合并
5、支持扫描件的表格识别:去除印章、角度矫正
文档转换
1、将PDF转化为Word、Excel、HTML等格式
2、将PDF转化为EPUB、MOBI等电子书格式,可以能够在手机或Kindle等电纸书上阅读
3、精准保留文本段落、表格等内容块信息
4、精准识别文档的章节目录结构
5、支持复杂排版的PDF文档的转换
手机阅读
1、将PDF转化为易于手机阅读的格式
2、微信小程序中按目录结构跳转、字体缩放
3、微信小程序文档分享
PDF版本对比
1、在线文档比对工具
2、支持PDF、扫描件交叉比对
3、超长文档极速处理
4、可视化呈现差异结果
软件特色
1、能够提供一套完整易用的REST API,供计算机调用,让您把PDF复杂格式抛诸脑后。
2、将PDF文档解析为文本段落、表格、图片等内容块的序列,保留原文档的阅读顺序。
3、支持中英文多栏复杂排版的PDF文档解析,跨栏和跨页内容块智能自动合并。
4、智能识别表格的内部结构:单元格合并,单元格文字的对齐方式、缩进、颜色、加粗、斜体等样式信息,跨页和跨栏表格智能合并单元格文字。
5、智能识别文档的目录结构,支持多达10个层级,长文档信息抽取必不可少。
6、支撑后续各类文档智能的应用:PDF文档全文检索、文档级别信息抽取等。
使用方法
一、识别表格
顶部工具栏标识表组件包括:
·识别表格/在此页面上识别表格;
·批次识别表;

识别表单的功能与此页面的功能相同。 单击后,系统将自动识别该页面中的表和其他元素。
批次标识表,单击以打开缩略图。 缩略图左上角的批次标识按钮默认为灰色。 按住鼠标左键选择缩略图,然后单击批次识别按钮自动识别所选页面。

绘制表:
按住鼠标左键选择要识别的表,并将其调整为适当的大小。 释放鼠标左键后,系统将自动识别分析箱选择区域。

二、添加和删除表格
单击相应的按钮,然后将鼠标移到需要添加或删除行的位置。 单击鼠标左键以添加或删除行。
删除表:
单击删除表按钮,然后将鼠标移到要删除的表上,然后单击鼠标左键删除相应的表。
合并拆分的单元格:
它类似于Excel中的操作。

三、合并跨页表格
系统可以能够自动识别和合并跨页表,删除多余的标题,合并跨页单元格,然后输出到表。 如果无法自动合并或合并错误,可以能够通过表格链按钮进行操作。

四、批量复制
单击批处理复制按钮后,单击鼠标左键以选择要复制的段落和表格,然后单击顶部浮动框中的复制按钮以将其粘贴到Excel或word中。

五、截图
单击左侧工具栏上的屏幕截图按钮。 单击按钮后,按住鼠标左键选择要捕获的图表或其他图表,并将其调整为适当的大小。 然后点击框右侧的屏幕截图按钮,将屏幕截图粘贴到word或excel中。

六、解析公式
输入“系统”→“设置”并选中“启用分析公式”;
单击工具栏中的激活分辨率公式按钮。 选择要求解的公式后,单击右侧的分辨率公式按钮,等待解析完成。
打开乳胶编辑器并粘贴以查看结果。

更新日志
Version 3.12.17
2020-07-10
增加winget下载,可以能够在Win10中通过winget install PDFlux直接安装客户端;
修复版本更新提示异常;
修复Toolbar显示异常
版权声明:PDFlux(PDF表格智能提取神器)所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
驱动文件名称 | 发布日期 | 文件大小 | 下载文件名 |
---|---|---|---|
PDFlux(PDF表格智能提取神器)安装包 | 2024年11月20日 | 92.9 MB | PDFluxlatest.zip |
软件评论