我有一个问题,这几天我一直在广泛研究,你可以通过标题看出,这与文本到语音类型的算法,将字符串解析为音素。
我不打算用这个来进行文本到语音转换,主要是为一个即将进行的项目进行文本分析。我在这里找到了一些有用的信息:
http://www.dtic.mil/dtic/tr/fulltext/u2/a021929.pdf
利用这些信息,我希望创建一个类似的工具以下是上述软件的工作方式:
基本上,从字符串的第一个字符开始,我们检查它的左边和右边的字符。
(对于单词开头的字符,左边的字符将是空白)
我们根据44个英语音素和每个音素下的字母设置规则。
这里是我得到数据来制定这些规则的地方:
http://www.boardman.k12.oh.us/userfiles/363/Phonological%20Awareness/44Phonemes.pdf-我认为这与本文之前的一些规则不同。
下面是我迄今为止创建的规则对象的示例:
var rules_syntax = {
cons_b: {case:["b", "bb"], pro: "b"},
cons_d: {case:["d", "dd", "ed"], pro: "d"},
cons_f: {case:["f", "ph"], pro: "f"},
cons_g: {case:["g", "gg"], pro: "g"},
cons_h: {case:["h"], pro: "h"},
cons_j: {case:["j", "g", "ge", "dge"], pro: "j"},
cons_k: {case:["c", "k", "ck", "ch", "cc", "que"], pro: "k"},
cons_l: {case:["l", "ll"], pro: "l"},
cons_m: {case:["m", "mm", "mb"], pro: "m"},
cons_n: {case:["n", "nn", "kn", "gn"], pro: "n"},
cons_p: {case:["p", "pp"], pro: "p"},
cons_r: {case:["r", "rr", "wr"], pro: "r"},
cons_s: {case:["s", "se", "ss", "ci", "ce", "sc"], pro: "s"},
cons_t: {case:["t", "tt", "ed"], pro: "t"},
cons_v: {case:["v", "ve"], pro: "v"},
cons_w: {case:["w"], pro: "w"},
cons_y: {case:["y", "oi", "io"], pro: "y"},
cons_z: {case:["z", "zz", "ze", "se", "x"], pro: "z"},
cons_diag_th: {case:["th"], pro: "th"},
cons_diag_th_voice: {case:["th"], pro: "thh"},
cons_diag_ng: {case:["ng", "n"], pro: "n"},
cons_diag_sh: {case:["sh", "ss", "ch", "ti", "ci"], pro: "sh"},
cons_diag_ch: {case:["ch", "tch"], pro: "ch"},
cons_diag_zh: {case:["ge", "s"], pro: "zh"},
cons_diag_wh: {case:["wh"], pro: "w"},
shor_vowe_a: {case: ["a", "au"], pro: "a"},
shor_vowe_e: {case: ["e", "ea"], pro: "e"},
shor_vowe_i: {case: ["i"], pro: "i"},
shor_vowe_o: {case: ["o", "a", "au", "aw", "ough"], pro: "o"},
shor_vowe_u: {case: ["u", "o"], pro: "u"},
}
希望这足以让你得到这个想法。
第一篇文章也有以下规则,我还没有完全弄清楚如何实现这些规则。-有什么建议吗
“”一个或多个元音
“*”(星)一个或多个辅音
“*”(圈)b、d、v、g、j、l、m、n、r、w和z中的一个:浊音辅音
“$”一个辅音后跟E或I
“%”其中之一(er、e、es、ed、ing、ely):后缀
“&”其中一个(s,c,g,z,x,j,ch,sh):嘶嘶声
“@”之一(T,S,R,D,L,Z,N,J,TH,CH,SH):影响
后继长u的声音(参见rule和mule)
'^'一个辅音
“+”之一(E,I,Y):前元音
“:”零个或多个辅音
我的第一个问题是:
有人认为这是处理这些规则的适当方法吗?请给我建议。
继续前进,
一旦我们知道了主要字符是什么,以及左侧和右侧的字符,我们就会检查适用于此字符组的所有规则第一篇文章解释了
翻译算法从左到右扫描输入文本,并对扫描的每个字符按顺序搜索与该字符相关的规则,直到找到其左侧与文本在正确位置匹配的规则为止。
这就是我现在被困的地方我有我的代码设置,以便它可以收集所有的规则,一个字符组适用,但一旦我有这个我不知道如何选择哪个是正确的音素。例如,我一直用“谨慎”这个词作为例子这个词中的“au”组合符合“a”规则和“o”规则。
这会像在笑中一样发出A音,或者像在教中一样发出O音。很明显,在教导中的o是正确的答案,但是我怎样才能检查我的代码呢?
如何确定此处使用哪个音素正确?
这就是我还没用过的第二套规则发挥作用的地方吗?如果是,您建议如何使用这些规则来消除/缩小适用的规则?
我已经坐在这个概念有一段时间了,我不是专业人士,但我想得到任何人的反馈如果需要更多的细节,请告诉我这是我目前掌握的代码:
var test01 = function(word)
{
var arr = [];
var arr2 = [];
//for every letter in the word
for(var x = 0; x < word.length; x ++)
{
//grab the letter
var index = word[x];
var pert = [];
//push the letter to an array
arr.push(index);
//create an object which holds the neighboring letters
var pro = new Object();
pro.left = word[x - 1];
pro.org = index;
pro.right = word[x + 1];
//store this object in an array
arr2.push(pro);
//check to see if any spaces exist (undefined) and replace them with a ""
for(b in pro)
{
if(!pro[b])
{
pro[b] = "";
}
}
//loop through each letter object
for(var y = 0; y < arr2.length; y ++)
{
var letter = arr2[y];
letter.rules = [];
//loop through each rule that exists
for (z in rules_syntax)
{
var rule = rules_syntax[z];
//for each rule, loop through its graphemes
for(var a = 0; a < rule.case.length; a ++)
{
var grapheme = rule.case[a];
//combine the original letter, and the letter to the left
var letterCheck = letter.left + letter.org;
//check if the above combo (left + original) exists in the list of graphemes
if(letterCheck === grapheme)
{
//here is where I would put any other conditions to check for any other rules.
pert.push(rule.pro);
letter.rules.push(rule.pro);
}
if(letter.org === grapheme)
{
//here is where I would put any other conditions to check for any other rules.
pert.push(rule.pro);
letter.rules.push(rule.pro);
}
}
}
}
console.log(pert);
}
}
test01("cautious");
这是输出的最后一行
(16) ["k", "k", "a", "o", "a", "o", "u", "t", "sh", "i", "y", "o", "u", "u", "s", "zh"]
欢迎回复。
谢谢您。
最佳答案
我认为你误读了文章中的表2:
“”一个或多个元音
“*”(星)一个或多个辅音
“*”(圈)B、D、V、G、J、L、M、N、R、W和Z中的一个:A
辅音
“$”一个辅音后跟E或I
“%”其中之一(er、e、es、ed、ing、ely):后缀
“&”其中一个(s,c,g,z,x,j,ch,sh):嘶嘶声
“@”其中之一(t,s,r,d,l,z,n,j,th,ch,sh):辅音
影响下一个长u的声音(参见rule和mule)
'^'一个辅音
“+”之一(E,I,Y):前元音
“:”零个或多个辅音
那张桌子的标题是:
从ipa翻译规则看英语中的特殊符号
换句话说,这些不是规则,而是对符号的描述。
真正的规则从文章的第51页开始。根据我对算法的理解,它将首先解析“t”,然后转到trule.eng部分(第58页)。唯一适用的规则是[T]=/T/
然后它解析“a”,并查看ARULE.ENG(第51页)浏览这里的规则,我看到的第一个适用的规则是[AU]=/AO/
,这给了你“au”如“teached”从那里它进入grule.eng列表,为“gh”生成/ /
,然后为最后的“t”再次生成/T/
。
至于“笑”,根据规则,我会说它会把“au”读成“teached”。因为规则是#[GH]=/ /
,所以不会有其他声音。”“笑”听起来可能像“法律”。