你如何在一长串字符中找到正确的单词?
输入:

"The revised report onthesyntactictheoriesofsequentialcontrolandstate"

谷歌的产出:
"The revised report on syntactic theories sequential controlandstate"

(考虑到他们产出的时间,这已经足够接近了)
你认为谷歌是怎么做到的?
你如何提高准确性?

最佳答案

我会尝试这样的递归算法:
尝试在每个位置插入一个空格。如果左边是一个单词,那么在右边重复。
计算所有最终输出中的有效字数/总字数。比例最好的那个可能就是你的答案。
例如,给它“thesentenceisgood”将运行:

thesentenceisgood
the sentenceisgood
    sent enceisgood
         enceisgood: OUT1: the sent enceisgood, 2/3
    sentence isgood
             is good
                go od: OUT2: the sentence is go od, 4/5
             is good: OUT3: the sentence is good, 4/4
    sentenceisgood: OUT4: the sentenceisgood, 1/2
these ntenceisgood
      ntenceisgood: OUT5: these ntenceisgood, 1/2

所以你会选择3作为答案。

07-24 15:10