我有一个需要在TStringList中进行大量文本操作的应用程序。基本上我需要用定界符来分割文本;例如,如果我有1000个字符的单行,并且该定界符在该行中出现3次,那么我需要将其分成3行。分隔符可以包含多个字符,例如可以是“[test]”之类的标记。

我已经编写了两个函数来使用2种不同的方法来完成此任务,但是它们在大量文本(通常大于2 MB)中的速度都很慢。

我怎样才能更快地实现这一目标?

这两个函数都接收两个参数:'lines'是原始的tstringlist,而'q'是定界符。

function splitlines(lines : tstringlist; q: string) : integer;
var
  s, aux, ant : string;
  i,j : integer;
  flag : boolean;
  m2 : tstringlist;
begin
  try
    m2 := tstringlist.create;
    m2.BeginUpdate;
    result := 0;
    for i := 0 to lines.count-1 do
    begin
      s := lines[i];
      for j := 1 to length(s) do
      begin
        flag := lowercase(copy(s,j,length(q))) = lowercase(q);
        if flag then
        begin
          inc(result);
          m2.add(aux);
          aux := s[j];
        end
        else
          aux := aux + s[j];
      end;
      m2.add(aux);
      aux := '';
    end;
    m2.EndUpdate;
    lines.text := m2.text;
  finally
    m2.free;
  end;
end;


function splitLines2(lines : tstringlist; q: string) : integer;
var
  aux, p : string;
  i : integer;
  flag : boolean;
begin
  //maux1 and maux2 are already instanced in the parent class
  try
    maux2.text := lines.text;
    p := '';
    i := 0;
    flag := false;
    maux1.BeginUpdate;
    maux2.BeginUpdate;
    while (pos(lowercase(q),lowercase(maux2.text)) > 0) and (i < 5000) do
    begin
      flag := true;
      aux := p+copy(maux2.text,1,pos(lowercase(q),lowercase(maux2.text))-1);
      maux1.add(aux);
      maux2.text := copy(maux2.text,pos(lowercase(q),lowercase(maux2.text)),length(maux2.text));
      p := copy(maux2.text,1,1);
      maux2.text := copy(maux2.text,2,length(maux2.text));
      inc(i);
    end;
  finally
    result := i;
    maux1.EndUpdate;
    maux2.EndUpdate;
    if flag then
    begin
      maux1.add(p+maux2.text);
      lines.text := maux1.text;
    end;
  end;
end;

最佳答案

我尚未测试速度,但是出于学术目的,这是拆分字符串的一种简单方法:

myStringList.Text :=
  StringReplace(myStringList.Text, myDelimiter, #13#10, [rfReplaceAll]);
// Use [rfReplaceAll, rfIgnoreCase] if you want to ignore case

当您设置TextTStringList属性时,它将解析新行并在其中拆分,因此转换为字符串,用新行替换定界符,然后将其分配回Text属性即可。

关于delphi - 在Delphi TStringList中分割文本的更快方法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19567276/

10-14 23:55