整理强度与当地语言的关系

整理强度与当地语言的关系

本文介绍了整理强度与当地语言的关系的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我已经从Collat​​or的Javadoc中阅读了以下内容.

I have read the following from Collator's Javadoc.

对语言功能的优势的确切分配取决于语言环境.例如,在捷克语中,"e"和"f"被认为是主要区别,而"e"和ê"是次要区别,"e"和""E"是三次差异,"e"和"e"是相同的."

"The exact assignment of strengths to language features is locale dependant. For example, in Czech, "e" and "f" are considered primary differences, while "e" and "ê" are secondary differences, "e" and "E" are tertiary differences and "e" and "e" are identical."

这是否意味着我应该根据所使用的语言设置强度?如果可以的话,有人可以建议区域设置的默认设置:us_en,us_es,ca_fr,spain_spanish,chile_spanish,葡萄牙语

Does this mean that I should set the STRENGTH based on the language I am using? If so can someone suggest the defaults for the locales: us_en, us_es, ca_fr, spain_spanish, chile_spanish, portuguese

推荐答案

确实取决于您要执行的操作.对于使用拉丁字母的大多数(所有?)语言而言,以下内容是正确的:

It really depends on what you're trying to do. The following is true for most (all?) languages that use the Latin alphabet:

  • 主要
    • 不同:a,á,Á,b
    • 相同:á,â
    • 相同:a,A
    • Primary
      • Different: a, á, Á, b
      • Same: á, â
      • Same: a, A
      • 不同:a,á,Á,b
      • 不同:á,â
      • 相同:a,A
      • 不同:a,á,Á,b
      • 不同:á,â
      • 不同:a,A
      • 还要考虑您看不到的差异,例如(accented A)(A) + (accent)

      语言之间会有细微的差异,但本质上是:

      There will be slight variations between languages, but in essence:

      • 如果要区分大小写的比较,请使用Tertiary.
      • 对于不区分大小写的比较,请根据是否要将á与â分组来使用Primary或​​Secondary.
      • 某些整理规则非常奇怪.即使在小学,a也不同于á,甚至在小学/中学中á也不同于Á.我不知道为什么;错误,也许?
      • 谁知道非拉丁语言会发生什么.

      这篇关于整理强度与当地语言的关系的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-03 09:40