定界符分割字符串

定界符分割字符串

我有一个像这样的PL/pgSQL函数(感谢使之成为可能的人):

 CREATE OR REPLACE FUNCTION public.split_string(text, text)
    RETURNS SETOF text
    LANGUAGE plpgsql
    AS $function$
    DECLARE
      pos int;
      delim_length int := length($2);
    BEGIN
      WHILE $1 <> ''
      LOOP
        pos := strpos($1,$2);
        IF pos > 0 THEN
          RETURN NEXT substring($1 FROM 1 FOR pos - 1);
          $1 := substring($1 FROM pos + delim_length);
        ELSE
          RETURN NEXT $1;
          EXIT;
        END IF;
      END LOOP;
      RETURN;
    END;
    $function$

它使用定界符分割字符串。像这样:
select * from split_string('3.584731 60.739211,3.590472 60.738030,3.592740 60.736220', ' ');

"3.584731"
"60.739211,3.590472"
"60.738030,3.592740"
"60.736220"

如何将结果保存在temp_array或temp_table中。因此,我可以在temp_x中获得结果,然后再次拆分这些点。喜欢:
"3.584731"
"60.739211"
"3.590472"
"60.738030"
"3.592740"
"60.736220"

并以double precision的形式返回值。所有这些都应在函数中完成。

最佳答案

如果您需要中介步骤:

SELECT unnest(string_to_array(a, ' '))::float8
       -- or do something else with the derived table
FROM   unnest(string_to_array('3.584731 60.739211,3.590472 60.738030', ',')) a;

这比 regexp_split_to_table() 更为冗长,但可能会更快,因为正则表达式通常更昂贵。 (使用EXPLAIN ANALYZE测试。)

我首先在','处进行拆分,然后在' '处进行拆分-按照您所描述的相反顺序似乎更合适。

如果需要,可以将其包装到PL/pgSQL函数中:
CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
BEGIN
   RETURN QUERY
   SELECT unnest(string_to_array(a, _delim2))::float8
          -- or do something else with the derived table from step 1
   FROM   unnest(string_to_array(_str, _delim1)) a;
END
$func$ LANGUAGE plpgsql IMMUTABLE;

或者只是一个SQL函数:
CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
   SELECT unnest(string_to_array(a, _delim2))::float8
   FROM   unnest(string_to_array(_str, _delim1)) a
$func$ LANGUAGE sql IMMUTABLE;

将其设置为IMMUTABLE以允许性能优化和其他用途。

调用(使用_delim1_delim2提供的默认值):
SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030');

或者:
SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030', ',', ' ');

最快的

为了获得最佳性能,请将 translate() unnest(string_to_array(...))结合使用:
SELECT unnest(
          string_to_array(
             translate('3.584731 60.739211,3.590472 60.738030', ' ', ',')
           , ','
          )
       )::float8

10-05 22:50