现在的位置: 首页 > 综合 > 正文

把Doc文档转换成HTML等其它格式

2013年12月02日 ⁄ 综合 ⁄ 共 1298字 ⁄ 字号 评论关闭

利用microsoft Word 9.0 Object Library可以在页面中对Doc文档进行格式转换。有关Word对象的一些方法可以参考Open和Save。下面是进行转换的代码[C#]:

/// <summary>
/// WordToHtml 的摘要说明。
/// 首先要添加引用:Microsoft Word 9.0 Object Library
/// </summary>

word.applicationclass word = new Word.ApplicationClass();
Type wordType = word.GetType();
Word.Documents docs = word.Documents;

// 打开文件
Type docsType = docs.GetType();
object fileName = "d://tmp//aaa.doc";
Word.Document doc = (Word.Document)docsType.InvokeMember("Open", 
System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});

// 转换格式,另存为
Type docType = doc.GetType();
object saveFileName = "d://tmp//aaa.html";
//下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成:
//docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null, 
// doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML});
///其它格式:
///wdFormatHTML
///wdFormatDocument
///wdFormatDOSText
///wdFormatDOSTextLineBreaks
///wdFormatEncodedText
///wdFormatRTF
///wdFormatTemplate
///wdFormatText
///wdFormatTextLineBreaks
///wdFormatUnicodeText
docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null, 
doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});

// 退出 Word
wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);

 
 

抱歉!评论已关闭.