网上找了JS将PDF转html5 pdf貌似没有,比较哆的都是html5 pdf转PDF
pdf.js这个可以将PDF在html5 pdf5 平台上展示。那么转换成html5 pdf5或其他呢
现在的需求主要是为了对PDF转换成可操作的html5 pdf5文档(主要是分离图片、文字、提取字库等功能),然后对其选中文本设置id、class、添加一些动作之类
有思路的朋友们可以探讨一下...
—————————— —————————— —————————— —————————— —————————— —————————— —————————— ————
常见的 PDF 閱读功能一应俱全,渲染速度上也已经和本地的 PDF 阅读插件无异
毫无疑问 pdf.js 将被整合入 Gecko 成为 Firefox 的内嵌 PDF 阅读器,但是具体整合时间表尚未确定
—————————— —————————— —————————— —————————— —————————— —————————— —————————— ————
在线上传文档可下载,可预览(已试过可以生成html5 pdf5,采用内嵌SVG)
新的个人上传文件转换
可以给普通消费者提供文档转换它还为企业客户提供服务并整合到客户的产品中
—————————— —————————— —————————— —————————— —————————— —————————— —————————— ————
转换后的效果是:只是提取pdf中的文字出来,没有图片提取等
没试验,估计跟上面的Java一样只是提取文字而已(已调试,简单地提取文字而已)
—————————— —————————— —————————— —————————— —————————— —————————— —————————— ————
由於 Crocodoc在线上传且部分无法转换成功的局限性我后来找了另外的转换工具。——PDF2html5 pdfEx
其转换的效果还不错说是高保真的。刚开始我觉得唯一不恏就是每一个pdf就只转换成一个html5 pdf没有抽离文字、图片、字体库等等,还对字体重编码(考虑文件大小优化问题)后来发了邮件给作者,怹回复了可以加参数果真如此:参数请参考:
—————————— —————————— —————————— —————————— —————————— —————————— —————————— ————
总结:采用PDF2html5 pdfEx,功能强大免费开源,高保真转换效果