寻找建议(也许是最佳实践)。
我们有一个MS Word文档(Office 2007),我们正在从单元格中提取文本。
我们可以使用以下内容:
string text = wordTable.cell(tablerow.index, 1).Range.Text;
提取文本;但是我们似乎会拖尾一些多余的字符,例如
\r\a
。现在我们可以添加以下内容:
.... wordTable.cell(tablerow.index, 1).Range.Text.Replace("\r\a,"");
但这似乎有些懒惰,并且浪费大量时间,很可能会导致问题。
我们还可以使用一种方法来接收要清除的字符串:
private string cleanTextWordCellBreak(string wordTextToClean)
{
// Clean the text here
return cleanstring;
}
然后我们可以使用它:
cleanTextWordCellBreak(wordTable.cell(tablerow.index, 1).Range.Text;
);
这似乎更接近于解决该问题的更好方法。你会怎么做?
最佳答案
我将其分解为单独的方法,但是使用replace实现,因为这是最简单的解决方案。如果遇到问题,您以后总是可以更改实现(例如,文本包含多个\r\a
并且需要保留)
所以:
private string stripCellText(string text)
{
return text.Replace("\r\a", "");
}
string text = stripCellText(wordTable.cell(tablerow.index, 1).Range.Text);
关于c# - 有关提取文字和处理断行符的建议,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/378167/