现在的位置: 首页 > 互联网络 > 博客心语 > 正文

djvu文件的优势与转换成PDF格式

2014-05-29 22:30 博客心语 ⁄ 共 2229字 ⁄ 字号 暂无评论

    当今世界,超过90%的资料仍然是以纸张的形式保存,而无法在网络上下载或存放于光盘中。由于这些资料多半是极具价值的历史文件或是重要的记录报告,因此往住必须花费许多的金钱与人力来加以保存。造成许多纸张资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度,则档案将会变得极大;但如果降低分辨率以达到较小的档案及较快的下载速度,也就意味着必须丧失图像的品质及清晰度

DjVu简介

一般常见的JPEG、PDF、TIFF压缩技术都无法同时达成高分辨率及较小的图像档案。但DjVu的压缩技术则可以完全解决这些问题。

DjVu(读作deja-vu)是一种计算机文件格式,主要用于存储扫描的图像。这种格式的特色包括图像分层、渐进载入、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像。

渐进载入使得DjVu适合于应用于因特网。DjVu对于大部分的扫描文档,表现都优于PDF,故被作为PDF的替代品来进行推广。这种格式已经在文件共享网络中,被广泛使用于分发数学书籍。跟PDF类似,DjVu也可以包含光学文字识别的文本层,这样就可以使用复制与粘贴操作。

DjVu技术最初由AT&T实验室的Yann Le Cun、Léon Bottou、Patrick Haffner、and Paul G. Howard于1996年开发。DjVu是一种开放的文件格式,文件格式规范与参考库的源代码都公开发布。商业开发的所有权几年来被转给了不同的公司,包括AT&T和LizardTech。原来作者维护一个GPL实现,称为DjVuLibre]。

2002年,DjVu文件格式(还有TIFF和PDF格式)被Internet archive的百万书籍工程选中,作为公有领域书籍扫描后上线的格式。

DjVu优点

    通过DjVu压缩格式,以300dpi的分辨率扫描的彩色页面可以从25 MB缩小到30 至 80 KB,而且图像质量十分优秀。对于同时包括文字和图像的彩色文件来说,DjVu文件在同等质量下通常比JPEG文件小5到10倍。对于黑白页面来说,DjVu文件通常比JPEG文件小10到20倍,比GIF文件小5倍。对于那些由扫描文件制作而成的黑白PDF图像来说,DjVu文件也要小3 到8倍。

    除了扫描文件之外,DjVu也可用于电子生成的文件,如阿杜比的PostScript 文件或PDF文件。以这些文件为对象压缩而成的DjVu文件,其每页大小在300dpi的分辨率下通常在15到20KB之间。

    这使得高质量的彩色扫描页面的大小直逼普通的HTML页面(平均50KB)。通过插件,DjVu页面可以在浏览器窗口中任意放大和缩小,而无须占用25MB的内存来对图像进行全解码。通过将解码的图像部分存储在一种只占2MB内存的数据结构中,实际显示在屏幕上的像素是在传输过程中被解码的。这就使得图片下载的功效达到大幅度提高。

    同时,由于采用分层显示,而不是等到整副图片都被解码之后才显示,也使得图片显示的速度大大提高,用户在两三秒之内就能够迅速看到文字,其他的图像信息也会在几秒钟之内陆续显示出来。这种网上高质量图像发布的体验在传统压缩格式上是无法实现的。

    DjVu的另一个优点是,它是一个公开标准。其解码程序和部分编码程序可在网上免费获得。

转换成PDF格式

对于很多已经习惯了用PDF的读者来说,djvu阅读还是相当麻烦的,毕竟我总不能为了看这个,再单独装个莫名其妙的软件吧,于是开始想办法把djvu转换成PDF。下面分别介绍两种转换方案。

方案一

其实原理很简单,就是利用Adobe Acrobat Professional超级无敌打印功能来转换,这个功能,使得只要是窗口上有打印选项的文件,全部能无条件转成PDF的。

准备工作:

        1、安装Adobe Acrobat Professional 7.0(事先我就已经安装了,在打印机和传真里,多了一个虚拟打印机“Adobe PDF”,这个是主角);

        2、windjview(用来打开后缀是.djvu的文件,下载地址网上很多,很小的一个软件,只有500K)。

开始工作:

        1、用windjview打开文件,然后选择打印,打印机选择“Adobe PDF”,设置好相关纸型、居中布局等(见图1)

        2、点右上角的Properties,将“Adobe PDF设置”中的“默认设置”改为“高质量打印”(见图2)

        3、确认—PRINT,就开始自动转PDF了。

因为选择的是“高质量打印”,转换之后,PDF文件会比较大,我74M的DJVU文件,转换成PDF后成了150M,但是PDF放大后,影印件的细节部分质量还是相当不错的,比较适合那种纯影印的小东西,估计如果单纯是转换黑色的印刷字体,就没必要这么弄了,普通质量就足够看了。

wps_clip_image-13078

wps_clip_image-22722

方案二

    有一款文件格式转换工具STDU Converter,支持将Djvu格式或Tiff格式的文档转换成PDF格式。

    该操作非常简便,只需选择好需要转换的源文件(Source DjVu files)和目标文件位置(Destination PDF file),单击"Convert"按钮即可完成转换;也可单独选择需要转换的页数,并能在转换后的文档中添加自己的书签,这都可以单击"Advanced"按钮后设置。因此有这方面需求的可以下载试试效果了。

    因此对于Djvu格式的电子书,不用单独下载一个阅读器了。

给我留言

留言无头像?