我希望人们能够搜索#photographyphotography。在狮身人面像中应将它们视为两个不同的词。默认情况下,#photography映射到photography,我无法搜索主题标签。

我在this page上读到,您可以将hash标签添加到charset_table中以完成此操作。我完全不知道该怎么做。我不知道unicode,也不知道我的charset_table应该是什么。

有人可以告诉我我的charset_table应该是什么吗?谢谢。

# charset_table     = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

注意:我计划使用实时索引。 (不确定是否会有所不同)

最佳答案

根据Unicode表,它是U+0023。所以最终的配置应该像

charset_table     = 0..9, A..Z->a..z, _, a..z, U+23, U+410..U+42F->U+430..U+44F, U+430..U+44F

不要忘记charset_type变量。 AFAIK,此示例charset_table用于utf-8。除此之外,您还应该从U+23变量中删除blend_chars,以允许Sphinx将其索引为合法字符。

10-06 14:24