给你一个字符串 s ,返回 s 中 同质子字符串 的数目。由于答案可能很大,只需返回对 109 + 7 取余 后的结果。

同质字符串 的定义为:如果一个字符串中的所有字符都相同,那么该字符串就是同质字符串。

子字符串 是字符串中的一个连续字符序列。

示例 1:

输入:s = "abbcccaa"
输出:13
解释:同质子字符串如下所列:
"a"   出现 3 次。
"aa"  出现 1 次。
"b"   出现 2 次。
"bb"  出现 1 次。
"c"   出现 3 次。
"cc"  出现 2 次。
"ccc" 出现 1 次。
3 + 1 + 2 + 1 + 3 + 2 + 1 = 13

示例 2:

输入:s = "xy"
输出:2
解释:同质子字符串是 "x""y"

示例 3:

输入:s = "zzzzz"
输出:15

提示:

  • 1 <= s.length <= 10^5
  • s 由小写字符串组成

解法 遍历

题目给出一个长度为 n n n 的字符串 s s s ,并给出「同构字符串」的定义为:如果一个字符串中的所有字符都相同,那么该字符串就是同构字符串。现在要求 s s s 中「同构子字符串」的数目。

因为「同构子字符串」为一个连续的字符序列、且需要序列中的字符都相同,那么首先按照连续相同的字符来对字符串 s s s 进行分组,比如对于字符串 “abbcccaa" \text{``abbcccaa"} “abbcccaa" 分组结果为 [a,bb,ccc,aa] \text{[a,bb,ccc,aa]} [a,bb,ccc,aa] 。因为一个组中字符串的任意子串都为「同构子字符串」,而一个长度为 m m m 的字符串的子字符串的数目为 m × ( m + 1 ) 2 \dfrac{m \times (m + 1)}{2} 2m×(m+1) 。那么对每个组统计其贡献的「同构子字符串」数目并求和即可。

class Solution {
public:
    int countHomogenous(string s) {
        const int mod = 1e9 + 7;
        int ans = 0;
        for (int n = s.size(), i = 0, cnt = 0; i < n; ++i) {
            if (i != 0 && s[i] == s[i - 1]) ++cnt;
            else cnt = 1;
            ans = (ans + cnt) % mod;
        }
        return ans;
    }
};

复杂度分析:

  • 时间复杂度: O ( n ) O(n) O(n)
  • 空间复杂度: O ( n ) O(n) O(n)
11-09 17:50