User:Li3939108/ChineseVarientsSpecification Draft

目的 edit

本规范旨在确定维基数据目前存在9种中文及中文变体语言代码的使用方法。

背景 edit

中文的语言代码是zh,因此维基数据的中文为

  • zh:中文

但是维基数据中还存在以下若干中文变体,维基数据中按照字形划分的中文有两种

  1. zh-hans:中文(简体)
  2. zh-hant:中文(繁体)

其中的中文(繁体)又可按地区划分为以下三种

  1. zh-tw:中文(台湾)
  2. zh-hk:中文(香港)
  3. zh-mo:中文(澳门)

中文(简体)亦可划分为以下三种

  1. zh-cn:中文(中国大陆)
  2. zh-sg:中文(新加坡)
  3. zh-my:中文(马来西亚)

但是这9种中文及中文变体的存在造成了维基数据中的中文的使用比较混乱,简体中文可能存在于5个地方,繁体中文也可能存在于5个地方。

规范 edit

本规范所指中文(简体)指使用unicode中的所有中文用字去除中华人民共和国文字改革委员会发布的简化字总表中所规定的应该简化的繁体字或异体字的中文。

本规范所指中文(繁体)指使用unicode中的所有中文用字去除中华人民共和国文字改革委员会发布的简化字总表中所规定的简体字的中文。

“标签”中各种中文及中文变体使用方法 edit

zh-tw, zh-hk, zh-mo edit

这些中文变体下的标签应只用于地区词,即这些地区对某个项目的特殊写法。

  1. 除以下情况外,项目的这些中文变种的标签应不存在。
    1. 一个地区与其他两个地区对某个项目的写法不同的,而另外两个地区对该项目写法一致,则该地区的标签可以存在,但另外两个地区的标签应不存在。如地铁站(捷运车站)的中文(台湾)标签可以为“捷運車站”。
    2. 三个地区对某个项目的写法均不同,则三个地区的标签均可存在。

zh-cn, zh-sg, zh-my edit

zh-tw, zh-hk, zh-mo的情况。

zh-hant edit

  1. 项目的中文(繁体)标签使用中文(繁体)。
  2. 如果中文(台湾)、中文(香港)与中文(澳门)按zh-tw, zh-hk, zh-mo的规范要求,对应的标签
    1. 均应不存在,则采用这些地区通行写法。如权威控制(规范控制)的中文(繁体)标签可以为“權威控制“。
    2. 有一个应存在,另外两个应不存在,则另外两个地区通行写法。如地铁站(捷运车站)项目的中文(繁体)标签可以为“地鐵站”。
    3. 三个均应存在,则考虑中文(简体)的符合本规范的标签,如果中文(简体)的标签经过机器自动繁体化后与其中一个地区写法相同,则采纳该写法,如果仍无法确定,则由社群讨论决定。

zh-hans edit

zh-hant的情况。

zh edit

仅当中文(简体)和中文(繁体)的标签一致的情况下,中文标签可以添加中文(简体)或中文(繁体)的标签。否则为空。

“描述”中各种中文及中文变体使用方法 edit

zh-cn, zh-sg, zh-my,zh-tw, zh-hk, zh-mo edit

这些变体的“描述”应不存在。

zh-hans, zh-hant edit

这些变体的“描述”可以存在,也可以不同。

zh edit

仅当zh-hans和zh-hant的描述完全一致时,中文描述可以添加任一描述。

“别名”中各种中文及中文变体使用方法 edit

zh-cn, zh-sg, zh-my,zh-tw, zh-hk, zh-mo edit

这些变体的别名应不存在。

zh-hans edit

中文(简体)的别名应为某项的所有中文名称用中文(简体)书写时可能的值。

zh-hant edit

中文(繁体)的别名应为某项的所有中文名称用中文(繁体)书写时可能的值。

zh edit

中文别名应为某项的所有中文名称用中文(繁体)或中文(简体)书写时所有可能的值。