C# 2010 中的代码拷入到Word时汉字出现乱码的问题
不知道使用新版Visual Studio 2010中的C#的朋友们发现没有,从编辑器中复制的代码,在Word下汉字会变成乱码,而且字体也不是在编辑器中的“新宋体”。以前从Visual Studio 2008下拷入Word中时,能所见即所得的保留代码的所有格式,很美观,现在不得不先拷入纯文本编辑中,再把纯文本拷入到Word里面,不但多了一道手续,而且文字的格式全部丢失。即使在发布不久的简体中文版下也是如此(当然应该和哪个语言版没有多大关系),不知道朋友们是怎么解决这个问题的?或者,也许是一个Bug? --------------------编程问答-------------------- 没注意,一直是用英文的 --------------------编程问答-------------------- 帮 顶 --------------------编程问答-------------------- 从网站上转贴的,繁体字,呵呵,楼主凑合看一下
FIX-修正VS2010剪貼程式碼時中文夾雜亂碼問題
Abstract: VS2010 RTM has a bug. When copying code and pasting it to Word, Excel, Powerpoint, Outlook, there are one or two redundent characters following the non-ASCII characters. I wrote a tool as a workaround.
許多人應該都發現了, VS2010在處理程式碼剪貼時有個明顯Bug--將含顏色標示的程式碼貼到Office(Word, Excel, PowerPoint, Outlook)時,中文部分會夾雜亂碼。例如: "每個中文字後會連著一到兩個多餘字元"會變成"每LC個O中?文a字r後a會P|連s著gU一@到Li兩La個O多h餘l字r元¡M"。
這實在是個惱人的問題,像我常需要將程式碼貼在Word或Outlook中。原本在VS2008裡,選取並複製程式碼,在Office裡貼上時,可保留語法中的不同顏色標記,美觀又大方。但到了VS2010,貼成RichText格式時中文部分會有夾雜亂碼的問題,但貼上為純文字時則正常。原本兩個動作可以完成的任務,現在要嘛得手動將多餘字元刪掉,不然就得仰賴其他Syntax Highlight機制,十分不便。
研究了一下這個問題,發現是放進Clipboard裡的內容出現多餘字元,於是我用C#寫了一個小工具,取出剪貼內容,用Regex修改後再貼回去,就可修正這個問題囉!
[img=http://blog.darkthread.net/photos/darkthread/images/6470/original.aspx][/img]
程式原理很簡單,用Clipboard.GetDataObject()取出RTF剪貼內容,用Regex把有問題的部分換掉(Regular Expression好威呀!),再把修正後的結果放進剪貼簿,如此而已,幾行程式就搞定了: (.NET好威呀!)
排版顯示純文字複製文字
//每個中文字後會連著一到兩個多餘字元private void btnFix_Click(object sender, EventArgs e){ //取得剪貼簿內容 IDataObject dataObject = Clipboard.GetDataObject(); if (dataObject.GetDataPresent(DataFormats.Rtf)) { //取出RTF格式 string rtf = dataObject.GetData(DataFormats.Rtf) as string; //以Regex.Replace去除多餘字元(註: 不管是否有問題,一律強制處理) string fixedRtf = Regex.Replace(rtf, @"\\uinput2(?<uc>\\u-?\d*)\s..", (m) => { return m.Groups["uc"].Value + "?"; }); //另建新DataObject物件 DataObject newDataObject = new DataObject(); //RTF格式用修正後的字串,其餘依原值 foreach (String t in dataObject.GetFormats()) newDataObject.SetData(t, t == "Rich Text Format" ? fixedRtf : dataObject.GetData(t)); //將修正後內容寫入剪貼簿 Clipboard.SetDataObject(newDataObject, true); }}//每個中文字後會連著一到兩個多餘字元
private void btnFix_Click(object sender, EventArgs e)
{
//取得剪貼簿內容
IDataObject dataObject = Clipboard.GetDataObject();
if (dataObject.GetDataPresent(DataFormats.Rtf))
{
//取出RTF格式
string rtf = dataObject.GetData(DataFormats.Rtf) as string;
//以Regex.Replace去除多餘字元(註: 不管是否有問題,一律強制處理)
string fixedRtf =
Regex.Replace(rtf, @"\\uinput2(?<uc>\\u-?\d*)\s..",
(m) =>
{
return m.Groups["uc"].Value + "?";
});
//另建新DataObject物件
DataObject newDataObject = new DataObject();
//RTF格式用修正後的字串,其餘依原值
foreach (String t in dataObject.GetFormats())
newDataObject.SetData(t,
t == "Rich Text Format" ? fixedRtf :
dataObject.GetData(t));
//將修正後內容寫入剪貼簿
Clipboard.SetDataObject(newDataObject, true);
}
}
有需要的朋友可以下載回去使用,或是DIY自行編譯上述程式碼。(下載格式為.7z,請使用7-Zip解壓縮;因只有VS2010的使用者會需要,所以我編譯成.NET 4.0)
--------------------编程问答-------------------- 呵呵,还没开始用勒,明天下一个10版的 --------------------编程问答-------------------- 3楼所引用的那篇可以解决问题,只是还是不知道VS2010怎么会出现这种问题,反正也不是什么大问题,凑合的用吧。 --------------------编程问答-------------------- 3 楼那篇是台湾这边相当知名的一位 MVP 写的(黑暗执行绪),作者有说在 MS 正式 Fix 前可先顶着用。
补充:.NET技术 , C#