寻找建议(也许是最佳实践)。

我们有一个MS Word文档(Office 2007),我们正在从单元格中提取文本。

我们可以使用以下内容:

string text = wordTable.cell(tablerow.index, 1).Range.Text;


提取文本;但是我们似乎会拖尾一些多余的字符,例如\r\a

现在我们可以添加以下内容:

.... wordTable.cell(tablerow.index, 1).Range.Text.Replace("\r\a,"");


但这似乎有些懒惰,并且浪费大量时间,很可能会导致问题。

我们还可以使用一种方法来接收要清除的字符串:

private string cleanTextWordCellBreak(string wordTextToClean)
{
    // Clean the text here
    return cleanstring;
}


然后我们可以使用它:

cleanTextWordCellBreak(wordTable.cell(tablerow.index, 1).Range.Text;
);


这似乎更接近于解决该问题的更好方法。你会怎么做?

最佳答案

我将其分解为单独的方法,但是使用replace实现,因为这是最简单的解决方案。如果遇到问题,您以后总是可以更改实现(例如,文本包含多个\r\a并且需要保留)

所以:

private string stripCellText(string text)
{
      return text.Replace("\r\a", "");
}

string text = stripCellText(wordTable.cell(tablerow.index, 1).Range.Text);

关于c# - 有关提取文字和处理断行符的建议,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/378167/

10-12 15:26