当前位置:编程学习 > JAVA >>

jacob读取word

请问怎么读取word中指定部分的内容,比如【题干】。。。。。。【题干结束】,读取中间的内容,里面可能有图片,表格,然后转为html存入到数据库。 jacob word --------------------编程问答--------------------  最近有个项目要求从word中导入试题到数据库,打算用jacob解析word,word中包含(图片和表格),word模板样式为:
   简答题
    1. 简答题题干。。。
       答案:
       简答题答案。。。
    2. 简答题题干。。。
       答案:
       简答题答案。。。
   请问在解析word的时候怎样才能区分从哪到哪是一道题题干和答案的开始和结尾,也就是说这个word模板的规范标准,在哪制定,怎么制定 --------------------编程问答-------------------- 我晕,直接用openoffice将word转为html,然后用jsoup解析html word中都能拿到,除了docx中的公式,图片表格什么的不在话下 --------------------编程问答-------------------- openoffice不是收费的吗 --------------------编程问答-------------------- 额,看错了,pageoffice收费的 --------------------编程问答--------------------
引用 3 楼 liubinwo245 的回复:
openoffice不是收费的吗
不收,本人表示用的很happy,网上找一个word转html,一大堆 --------------------编程问答-------------------- jacob读取表格,图片,操作较全,请参考http://www.cnblogs.com/rushoooooo/archive/2011/10/28/2227395.html --------------------编程问答-------------------- 源码例子http://download.csdn.net/download/woniuyehenniu/3212902 --------------------编程问答-------------------- jacob 操作 word我做过,可以联系 --------------------编程问答--------------------
引用 7 楼 baohuan_love 的回复:
源码例子http://download.csdn.net/download/woniuyehenniu/3212902
这个东西不能跨平台吧 --------------------编程问答--------------------
引用 6 楼 baohuan_love 的回复:
jacob读取表格,图片,操作较全,请参考http://www.cnblogs.com/rushoooooo/archive/2011/10/28/2227395.html
我去看看,谢谢! --------------------编程问答-------------------- 6L 完美答案 --------------------编程问答--------------------
引用 11 楼 u010006337 的回复:
6L 完美答案
操作word往里面写东西的例子很多,很详细,我现在只想获取内容,特定的内容 --------------------编程问答--------------------
引用 12 楼 liubinwo245 的回复:
Quote: 引用 11 楼 u010006337 的回复:

6L 完美答案
操作word往里面写东西的例子很多,很详细,我现在只想获取内容,特定的内容

特定内容可以自己加代码 获取指定的内容 --------------------编程问答--------------------
引用 13 楼 u010006337 的回复:
Quote: 引用 12 楼 liubinwo245 的回复:

Quote: 引用 11 楼 u010006337 的回复:

6L 完美答案
操作word往里面写东西的例子很多,很详细,我现在只想获取内容,特定的内容

特定内容可以自己加代码 获取指定的内容

能给个思路吗,看工具类,可以获取特定的段落,可以获取指定位置的图片和表格,单身我想获取一部分内容就是一道题目,里面可能包括图片,表格。 --------------------编程问答--------------------
引用 14 楼 liubinwo245 的回复:
Quote: 引用 13 楼 u010006337 的回复:

Quote: 引用 12 楼 liubinwo245 的回复:

Quote: 引用 11 楼 u010006337 的回复:

6L 完美答案
操作word往里面写东西的例子很多,很详细,我现在只想获取内容,特定的内容

特定内容可以自己加代码 获取指定的内容

能给个思路吗,看工具类,可以获取特定的段落,可以获取指定位置的图片和表格,单身我想获取一部分内容就是一道题目,里面可能包括图片,表格。

把题目搞成数据库里一个表 字段有图片 表格什么的  然后获取数据的ID
这个思路效果应该不是很好 不过也能达到你的要求 --------------------编程问答--------------------
引用 15 楼 u010006337 的回复:
Quote: 引用 14 楼 liubinwo245 的回复:

Quote: 引用 13 楼 u010006337 的回复:

Quote: 引用 12 楼 liubinwo245 的回复:

Quote: 引用 11 楼 u010006337 的回复:

6L 完美答案
操作word往里面写东西的例子很多,很详细,我现在只想获取内容,特定的内容

特定内容可以自己加代码 获取指定的内容

能给个思路吗,看工具类,可以获取特定的段落,可以获取指定位置的图片和表格,单身我想获取一部分内容就是一道题目,里面可能包括图片,表格。

把题目搞成数据库里一个表 字段有图片 表格什么的  然后获取数据的ID
这个思路效果应该不是很好 不过也能达到你的要求

我们项目的数据库用的是mongo,直接把html代码存在里面的~ --------------------编程问答-------------------- 你这不就是导入word中的题目嘛,html数据都有,有什么拿不到?? --------------------编程问答--------------------
引用 17 楼 tlfu_12344 的回复:
你这不就是导入word中的题目嘛,html数据都有,有什么拿不到??

你这个是用openoffice把word转成html吗? --------------------编程问答-------------------- 建议用excel做模板
word格式个人感觉比较乱读取来以及提取估计比较麻烦
--------------------编程问答--------------------
引用 19 楼 ylovep 的回复:
建议用excel做模板
word格式个人感觉比较乱读取来以及提取估计比较麻烦

是啊,由于Word内容的复杂性,读取也是非常不方便的,目前可以有"按段落读取","按书签读取"及"按照表格读取"等几种形式。
但是我不是决策者啊,我只是打工的,策划要求,客户要求。。。 --------------------编程问答--------------------
引用 18 楼 liubinwo245 的回复:
Quote: 引用 17 楼 tlfu_12344 的回复:

你这不就是导入word中的题目嘛,html数据都有,有什么拿不到??

你这个是用openoffice把word转成html吗?
嗯,是地,而且是跨平台的。因为我们做过这个,而且主是我实现的。所以我敢说方法可行。。。 --------------------编程问答-------------------- 关于word按平常要求,按分页来取,按段落来取用openffice+自己的代码是都能实现的 --------------------编程问答--------------------
引用 21 楼 tlfu_12344 的回复:
Quote: 引用 18 楼 liubinwo245 的回复:

Quote: 引用 17 楼 tlfu_12344 的回复:

你这不就是导入word中的题目嘛,html数据都有,有什么拿不到??

你这个是用openoffice把word转成html吗?
嗯,是地,而且是跨平台的。因为我们做过这个,而且主是我实现的。所以我敢说方法可行。。。

你是转成html以后,再从中提取出题目,答案等等吗,我们是把题目以html形式存储的。 --------------------编程问答--------------------
引用 23 楼 liubinwo245 的回复:
Quote: 引用 21 楼 tlfu_12344 的回复:

Quote: 引用 18 楼 liubinwo245 的回复:

Quote: 引用 17 楼 tlfu_12344 的回复:

你这不就是导入word中的题目嘛,html数据都有,有什么拿不到??

你这个是用openoffice把word转成html吗?
嗯,是地,而且是跨平台的。因为我们做过这个,而且主是我实现的。所以我敢说方法可行。。。

你是转成html以后,再从中提取出题目,答案等等吗,我们是把题目以html形式存储的。
这有矛盾嘛?你在存的东西包括样式什么的在这已经生成的html还取不能不成??
--------------------编程问答-------------------- 我也正在研究呢,还没出来 --------------------编程问答-------------------- 我是水军来骗分的,楼主好人给点分。。。
补充:Java ,  Java EE
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,