我正在尝试解析一个 m3u 文件,但遇到了麻烦。

M3U 文件如下所示:

#EXTM3U
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren" tvg-logo="http://195.154.221.171/picons/6erendk.png" group-title="Denmark",6'eren
http://URL/something
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren FHD" tvg-logo="http://195.154.221.171/picons/6erenhddk.png" group-title="Denmark",6'eren FHD
http://URL/something
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren FHD" tvg-logo="http://195.154.221.171/picons/6erenhddk.png" group-title="Denmark",6'eren FHD
http://portal.siptveu.com:8080/8IsZPSZ7sc/IMd7O87LUj/9266
#EXTINF:-1 tvg-name="6'eren HD" group-title="Denmark",6'eren HD
http://URL/something
#EXTINF:-1 tvg-id="Animal Planet" tvg-name="Animal Planet FHD" tvg-logo="http://195.154.221.171/picons/animalplanethddk.png" group-title="Denmark",Animal Planet FHD
http://URL/something
#EXTINF:-1 tvg-id="Animal Planet" tvg-name="Animal Planet HD" tvg-logo="http://195.154.221.171/picons/animalplanethddk.png" group-title="Denmark",Animal Planet HD
http://URL/something
#EXTINF:-1 tvg-name="Boomerang" tvg-logo="http://195.154.221.171/picons/boomerangse.png" group-title="Denmark",Boomerang
http://URL/something
#EXTINF:-1 tvg-name="C More First FHD" group-title="Denmark",C More First FHD
http://URL/something
#EXTINF:-1 tvg-name="C More Hits FHD" group-title="Denmark",C More Hits FHD
http://URL/something

etc...

我需要获取 tvg-name 的值和同一条目的 URL。

到目前为止,我已经创建了代码来获取如下所示的 tvg-name:
List<Channel> ChannelList = new List<Channel>();
                List<int> posOfTvgName = GetPositions(m3u, "tvg-name");

                var reg = new Regex("tvg-name=\".*?\"");
                var matches = reg.Matches(m3u);
                foreach (var item in matches)
                {
                    Channel c = new Channel();
                    string channelName = item.ToString();
                    channelName = item.ToString().Remove(0, 10);
                    channelName = channelName.Remove(channelName.Length - 1);
                    c.Name = channelName;

                    ChannelList.Add(c);
                }

但是我遇到了一些障碍,因为我不知道如何获取下一行的内容。

有什么建议么?

最佳答案

您可以使用 2 个捕获组,对于 tvg-name 的值,请使用匹配除 " 以外的任何字符的否定字符类,而不是非贪婪的 .*?
值位于组 1 和组 2 中,可使用 Match.Groups 属性访问。

如果下一行应该以 http 开头,也许还有一个可选的 s:

\btvg-name="([^"]+)".*\r?\n(https?\S+)
  • \btvg-name= 匹配带有单词边界的 tvg-name=
  • "([^"]+)" 捕获 组 1 双引号之间,匹配除 "
  • 之外的任何字符
  • .*\r?\n 匹配除换行符以外的任何字符 0+ 次,然后匹配换行符
  • (https?\S+) 捕获 组 2 ,匹配 http、可选 s 和 1+ 次非空白字符

  • Regex demo | C# Demo

    如何从组中获取值的示例:
    string pattern = @"\btvg-name=""([^""]+)"".*\r?\n(https?\S+)";
    string input = @"#EXTM3U
    #EXTINF:-1 tvg-id=""6 eren"" tvg-name=""6'eren"" tvg-logo=""http://195.154.221.171/picons/6erendk.png"" group-title=""Denmark"",6'eren
    http://URL/something ...";
    
    foreach (Match m in Regex.Matches(input, pattern))
    {
        Console.WriteLine("tvg-name: {0} URL: {1}" , m.Groups[1].Value, m.Groups[2].Value);
    }
    

    关于c# - 解析 M3U 文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57964048/

    10-10 13:15