我希望人们能够搜索#photography
和photography
。在狮身人面像中应将它们视为两个不同的词。默认情况下,#photography
映射到photography
,我无法搜索主题标签。
我在this page上读到,您可以将hash标签添加到charset_table中以完成此操作。我完全不知道该怎么做。我不知道unicode,也不知道我的charset_table应该是什么。
有人可以告诉我我的charset_table应该是什么吗?谢谢。
# charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
注意:我计划使用实时索引。 (不确定是否会有所不同)
最佳答案
根据Unicode表,它是U+0023
。所以最终的配置应该像
charset_table = 0..9, A..Z->a..z, _, a..z, U+23, U+410..U+42F->U+430..U+44F, U+430..U+44F
不要忘记
charset_type
变量。 AFAIK,此示例charset_table
用于utf-8
。除此之外,您还应该从U+23
变量中删除blend_chars
,以允许Sphinx将其索引为合法字符。