给你一个字符串 s
,返回 s
中 同质子字符串 的数目。由于答案可能很大,只需返回对 109 + 7
取余 后的结果。
同质字符串 的定义为:如果一个字符串中的所有字符都相同,那么该字符串就是同质字符串。
子字符串 是字符串中的一个连续字符序列。
示例 1:
输入:s = "abbcccaa"
输出:13
解释:同质子字符串如下所列:
"a" 出现 3 次。
"aa" 出现 1 次。
"b" 出现 2 次。
"bb" 出现 1 次。
"c" 出现 3 次。
"cc" 出现 2 次。
"ccc" 出现 1 次。
3 + 1 + 2 + 1 + 3 + 2 + 1 = 13
示例 2:
输入:s = "xy"
输出:2
解释:同质子字符串是 "x" 和 "y" 。
示例 3:
输入:s = "zzzzz"
输出:15
提示:
1 <= s.length <= 10^5
s
由小写字符串组成
解法 遍历
题目给出一个长度为 n n n 的字符串 s s s ,并给出「同构字符串」的定义为:如果一个字符串中的所有字符都相同,那么该字符串就是同构字符串。现在要求 s s s 中「同构子字符串」的数目。
因为「同构子字符串」为一个连续的字符序列、且需要序列中的字符都相同,那么首先按照连续相同的字符来对字符串 s s s 进行分组,比如对于字符串 “abbcccaa" \text{``abbcccaa"} “abbcccaa" 分组结果为 [a,bb,ccc,aa] \text{[a,bb,ccc,aa]} [a,bb,ccc,aa] 。因为一个组中字符串的任意子串都为「同构子字符串」,而一个长度为 m m m 的字符串的子字符串的数目为 m × ( m + 1 ) 2 \dfrac{m \times (m + 1)}{2} 2m×(m+1) 。那么对每个组统计其贡献的「同构子字符串」数目并求和即可。
class Solution {
public:
int countHomogenous(string s) {
const int mod = 1e9 + 7;
int ans = 0;
for (int n = s.size(), i = 0, cnt = 0; i < n; ++i) {
if (i != 0 && s[i] == s[i - 1]) ++cnt;
else cnt = 1;
ans = (ans + cnt) % mod;
}
return ans;
}
};
复杂度分析:
- 时间复杂度: O ( n ) O(n) O(n)
- 空间复杂度: O ( n ) O(n) O(n)