当前位置:软件学习 > Word >>

将 Word 文件 转换 为 HTML 工具类

有一段时间 没有写 博客了, 过年 过的我太逍遥了,大门不出二门不迈  ,天天闷在家里大穿越火线,都TNN的快变成宅男了 ,哎,玩物丧志这句话谁说的 , 一点都不假,该收敛一下了 。

公司的项目  UI  设计阶段  基本完成了 , 现在步入写工具类的阶段了 ,公司领导说要  把帮助文档,规程文档 等等这类的文件  嵌入到程序中 , 可是帮助文档,规程文档这些东西全都是Word文档,  虽然  可以 把 这些 东西 通过工具 的  转换为  CHM 电子书的格式, 到时后一个连接 就可以 调用  XX帮助电子书文档。

可是有没有更简单的方法 ? 例如 把  Word 文档  直接  通过  Html 的 格式  以  网页的形式 直接 呈现给 用户 呢 , 当然 是可以的啦 ,本人 说实话 就是比较懒的那种。

因为那个 制作电子书的 那个 方案 我觉得 太麻烦了 ( 主要是懒得的去研究  那么麻烦 的东西)。

经过左思又考  觉得 还是 写一个  直接将 Wrod  转为Html 工具类的方式  呈现给用户 更加 的方便简介,不需要 花大量的 时间 浪费 到   电子书 制作 上。 

于是我很快想到了  一个 解决方案, 那就是 我以前给公司做网站的项目中 写了一个 在线文档的模块, 里面有 通过将各种文档文件转换为 PDF  之后 在 通过 转换工具

转为SWF 文件 以 Flash 的方式 展现给用户(就是类似与百度文库,豆丁在线文档...), 于是 一个小小的、牛逼的、帅帅的工具产生了,哇~哈哈哈......

(自我感慨的YY了一下,又白话了一堆),切入正题,我所做的操作步骤如下:

 


第一:下载必备工具OpenOffice.org 3.2 (zh-CN) Installation Files  使用此工具 主要是 使用 其内部服务。

            如果想要  以工具形式 转换, 此8100服务必须 的开啦,要不 不能转换的啦。

 


第二:下载 jodconverter-2.2.2.zip 包, 该包中的 lib 包下的 jar 包 都是 为 转换准备的。

 


第三:下载了 不用是不对i地,默认 安装 OpenOffice.org 3.2 程序, 有的个别 杀毒软件  回报一些 警告型阻止 提示 , 直接 给 添加 到信任服务即可。

 


第四:安装完毕之后呢, 当然 是要 开启 服务了, 安装 OpenOffice.org 3.2 的 目的 就是 为了 使用 其中的 8100 服务地,

           打开 运行文本框中 输入 cmd 进入 命令窗口, 进入到 你的 默认安装路径 

          【提示一下,一般都会在C:\Program Files\OpenOffice.org 3\program这个路径下,

              但是 64位系统中会在 C:\Program Files(x86)\OpenOffice.org 3\program 的这个路径下 ,

             其区别 就是 多了一个 (x86),我自己用的 是 64位的Win7系统,后来发现安装好多软件

              都不兼容,郁闷的不得了,现在用的是公司配了 32位的Win7系统。】

 


            依次使用如下两条命令即可:

命令1:cd C:\Program Files\OpenOffice.org 3\program

命令2:soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard

执行玩 这两条命令之后 , 8100 服务就会 被打开了 , 你也可以 使用  netstat -an 这个 命令 查看  8100 端口 是否 真的 被打开了。

 


打开  MyEclipse6.5  , 开发到现在 几乎 MyEclipse这些 版本 差不多 都用过了, 但是后期 还是 觉得 这个 6.5 比较好用,

8.5之后 机器 卡的的不行, 配置 好的机器还可以,配置 稍微 差点的 , 你跑起来 就是到有多么的杯具了。

呃~~~~~好似  又脱离正题了,我们继续哈....  在其中建立一个公共类:名为WordToHtml.java  代码共享如下 :

 

 

[java] package com.stars.windpowersystem.util; 
 
import java.io.BufferedReader; 
import java.io.File; 
import java.io.FileInputStream; 
import java.io.FileNotFoundException; 
import java.io.IOException; 
import java.io.InputStreamReader; 
import java.net.ConnectException; 
import java.util.Date; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
 
import com.artofsolving.jodconverter.DocumentConverter; 
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection; 
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection; 
import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter; 
 
/**
 * 描述: TODO 将Word文档转换成html字符串的工具类
 * 
 * @类名称: WordToHtml
 * @作者: 宋延军
 * @邮箱: songyanjun_stars@126.com
 * @日期: Feb 9, 2012 10:07:21 AM
 */ 
public class WordToHtml { 
 
    /**
     * 描述: TODO 调用测试
     * @标题: main
     * @设定: @param args
     * @返回类型: void
     */ 
    public static void main(String[] args) { 
         
        Long time1 = System.currentTimeMillis(); 
        Long time2 = System.currentTimeMillis(); 
         
        System.out.println( 
                toHtmlString(new File("C:/Users/Administrator/Desktop/风电可靠性信息管理系统/01_需求分析文档/风电可靠性管理信息系统需求分析文档V5.0(最新).doc"), "C:/Users/Administrator/Desktop/风电可靠性信息管理系统/01_需求分析文档/tempDir")); 
         
        System.out.println("执行效率为:"+(time2-time1)); 
    } 
 
    /**
     * 将word文档转换成html文档
     * 
     * @param docFile   需要转换的word文档
     * @param filepath  转换之后html的存放路径
     * @return 转换之后的html文件
     */ 
    public static File convert(File docFile, String filepath) { 
        // 创建保存html的文件  
        File htmlFile = new File(filepath + "/" + new Date().getTime()+ ".html"); 
        // 创建Openoffice连接  
        OpenOfficeConnection con = new SocketOpenOfficeConnection(8100); 
        try { 
            // 连接  
            con.connect(); 
        } catch (ConnectException e) { 
            System.out.println("获取OpenOffice连接失败..."); 
            e.printStackTrace(); 
        } 
        // 创建转换器  
        DocumentConverter converter = new OpenOfficeDocumentConverter(con); 
    &nbs

补充:软件开发 , Java ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,