我正在尝试解析一个 m3u 文件,但遇到了麻烦。
M3U 文件如下所示:
#EXTM3U
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren" tvg-logo="http://195.154.221.171/picons/6erendk.png" group-title="Denmark",6'eren
http://URL/something
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren FHD" tvg-logo="http://195.154.221.171/picons/6erenhddk.png" group-title="Denmark",6'eren FHD
http://URL/something
#EXTINF:-1 tvg-id="6 eren" tvg-name="6'eren FHD" tvg-logo="http://195.154.221.171/picons/6erenhddk.png" group-title="Denmark",6'eren FHD
http://portal.siptveu.com:8080/8IsZPSZ7sc/IMd7O87LUj/9266
#EXTINF:-1 tvg-name="6'eren HD" group-title="Denmark",6'eren HD
http://URL/something
#EXTINF:-1 tvg-id="Animal Planet" tvg-name="Animal Planet FHD" tvg-logo="http://195.154.221.171/picons/animalplanethddk.png" group-title="Denmark",Animal Planet FHD
http://URL/something
#EXTINF:-1 tvg-id="Animal Planet" tvg-name="Animal Planet HD" tvg-logo="http://195.154.221.171/picons/animalplanethddk.png" group-title="Denmark",Animal Planet HD
http://URL/something
#EXTINF:-1 tvg-name="Boomerang" tvg-logo="http://195.154.221.171/picons/boomerangse.png" group-title="Denmark",Boomerang
http://URL/something
#EXTINF:-1 tvg-name="C More First FHD" group-title="Denmark",C More First FHD
http://URL/something
#EXTINF:-1 tvg-name="C More Hits FHD" group-title="Denmark",C More Hits FHD
http://URL/something
etc...
我需要获取 tvg-name 的值和同一条目的 URL。
到目前为止,我已经创建了代码来获取如下所示的 tvg-name:
List<Channel> ChannelList = new List<Channel>();
List<int> posOfTvgName = GetPositions(m3u, "tvg-name");
var reg = new Regex("tvg-name=\".*?\"");
var matches = reg.Matches(m3u);
foreach (var item in matches)
{
Channel c = new Channel();
string channelName = item.ToString();
channelName = item.ToString().Remove(0, 10);
channelName = channelName.Remove(channelName.Length - 1);
c.Name = channelName;
ChannelList.Add(c);
}
但是我遇到了一些障碍,因为我不知道如何获取下一行的内容。
有什么建议么?
最佳答案
您可以使用 2 个捕获组,对于 tvg-name 的值,请使用匹配除 "
以外的任何字符的否定字符类,而不是非贪婪的 .*?
值位于组 1 和组 2 中,可使用 Match.Groups 属性访问。
如果下一行应该以 http 开头,也许还有一个可选的 s:
\btvg-name="([^"]+)".*\r?\n(https?\S+)
\btvg-name=
匹配带有单词边界的 tvg-name=
"([^"]+)"
捕获 组 1 双引号之间,匹配除 "
.*\r?\n
匹配除换行符以外的任何字符 0+ 次,然后匹配换行符 (https?\S+)
捕获 组 2 ,匹配 http、可选 s 和 1+ 次非空白字符 Regex demo | C# Demo
如何从组中获取值的示例:
string pattern = @"\btvg-name=""([^""]+)"".*\r?\n(https?\S+)";
string input = @"#EXTM3U
#EXTINF:-1 tvg-id=""6 eren"" tvg-name=""6'eren"" tvg-logo=""http://195.154.221.171/picons/6erendk.png"" group-title=""Denmark"",6'eren
http://URL/something ...";
foreach (Match m in Regex.Matches(input, pattern))
{
Console.WriteLine("tvg-name: {0} URL: {1}" , m.Groups[1].Value, m.Groups[2].Value);
}
关于c# - 解析 M3U 文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57964048/