维基数据:词汇表

This page is a translated version of the page Wikidata:Glossary and the translation is 86% complete.
Outdated translations are marked like this.

Q42的声明,其各個元素

本术语表定义了重要的维基数据概念,并引用了更详细的信息。请参阅维基数据:简介以获取对维基数据的概述;参阅术语表指引以获得编写和改进术语表条目的方法。

术语表
别名(也称为“亦稱為”)是一個数据项属性的替代用名。通常(或是最重要)的名称是标签。别名帮助那些不通过标签进行搜索的人们查找数据项。例如,数据项Q2的标签是“地球”,别名有“大地”和“藍色星球”等。它是一種術語的类型。
條目佔位符是一个扩展,用于展示小作品條目、以及启始基於维基数据项的view的维基百科條目。参见mw:Extension:ArticlePlaceholder
徽章是可以附加在一个网站链接到另一个维基媒体上的可选标记。例如,在某个链接旁边,可以标记其为一個“典范条目”或是一個“已校对”页面。
分类项目模板项目模块项目是在维基数据站點中分别带有网站链接到分类、模板、或模块的维基数据项。当最后一个网站链接被删除时,这些项目通常会被删除(见Wikidata:Database reports/to delete)。
声称是在实体的页面上显示与该实体有关的一些数据。一个声称由下列二者所组成:一个属性(例如位置)、和另一个若不是(例如德國)就是某些特殊情形的其中之一(“无值”或“未知值”)。一个声称可能含有限定符,例如时间限定符,是用來表示该声明在一定时间段内有效。与RDF(資源描述框架)数据模型中的三元组相比,声称使用一個属性來表示三元组的谓词、使用一个值来表示三元组的受詞。在项目页面上,這些声称构成了某部分的声明,且可在頁面中透過參考文獻排序來擴增。這些声称也可以出现在非项目数据页中。
共享资源(或维基共享资源)是一个维基媒体项目,用于存储图像、音频、视频和其他文件。Wikibase包括三种不同的数据类型,可以从维基数据链接到媒体文件、地理形状和表格数据。共享资源会向文件中添加用作mediaentities的声明。
完整性是一个衡量现有数据覆盖率的评估。在维基数据,一个项目或声明的存在并不意味着所有类似的项目或声明都存在。Wikibase不包括任何完整性指标。数量属性可用于与可用的声明或项目进行比较。例如:关于美国各州的项目有一个数量为50的声明。我们可以将其与该项目使用的次数进行比较。现在有一些试图测量完整性的工具。在某种程度上,property suggestersuggestion constraints会表明完整项目所缺少的元素。
复杂度约束(或自定义约束)是一个约束,由一个自由选择的SPARQL查询在属性对话页面的模板中定义。
混淆是一种错误的类型,通常是在一个项目中,几种不同概念的觀點被混合在一起。例如,一个项目中包含有某个人的出生日期和另一个同名的人的职业。
约束规定了如何使用特定的属性。例如,大多数标识符应该只有一个值,因此标记它们为单值约束。一种特殊的类型称为复杂约束
约束报告 可以指一系列定期更新的页面,其為了那些基于约束的每一个属性;或是指一個为了单个数据项或其他实体的特殊頁面
Cradle 是一个編輯的工具,用于基于具有预定义的屬性的表单,以创建新的維基数据项。
数据类型(或属性类型)是属性中的一个特性,用於指定每个声称中的的类型和形状。每个属性都被分配一个预定义的数据类型,它通常是不能被改变的。只要缺少某些数据类型,那么就并非所有的值都可以链接。数据类型只能由开发者定义。另请参阅Special:ListDatatypes了解当前可用的数据类型。数据类型并不直接指定其值的内部存储方式;这是由值的类型指定的。
Data namespaces are namespaces for pages that hold Wikidata entities. The data namespaces in Wikidata are the main namespace for the Wikidata items, "Property:" for properties, and "Lexeme:" for lexemes.
日期(或时间时间值)是一種属性的值的数据类型。它允许输入不同精度的日期,并能在查询中进行日期计算。不支持小时或分钟的精度。维基数据成立日期的属性之中,就有这样的值。
描述是某個特定语言的描述性短语,用在项目、或属性。它提供标签的上下文語義(例如,會存在多個不同的項目,它的地點标签都是「劍橋」)。因此,无论是在某個语言之內、还是整個的维基数据之內,描述的內容不會是唯一的,但它与标签結合之後必需是獨一無二的。标签和描述的组合的唯一性是強制的,如果你的編輯不符合这个要求,你就無法發表。它是術語的一種类型。
消歧义项目是一个带有网站链接到消歧义页面的维基数据项,这是它唯一的目的。一般来说,它会有一个 隶属于 維基媒體消歧義頁的声稱。
重复是一个实体,一般來說是一个项目,指的是与另一个实体具有相同概念。重复的东西通常会被合并,然後创建一个重定向的实体。特殊类型的重复有临时重复永久重复、以及真实重复
编辑界面是一个可以添加或修改数据的視圖。这些视图是默认的视图、維基共享資源的结构化数据接口、維基數據桥、以及一系列基于API的工具,值得一提的是快速声明Cradle、PetScan、OpenRefine或Pywikibot的框架。
实体是在其中一個數據命名空间中的維基數據頁面的内容,例如是一個項目(在主命名空间中)、一個屬性(在属性命名空间中)、或一個词位(在词位命名空间中)。每个实体都能被一个「实体ID」獨一無二地标识,该实体ID是一組带有一個前缀的数字,例如,项目是以前缀Q开头、属性是以P开头。一个实体也由每种语言的標籤描述的唯一组合来标识。一个实体在多种语言中可能有多個代理的别名(类似于同义词)。每个实体还有一个可解引用的URI,它遵循http://www.wikidata.org/entity/ID這個模式,裏面的ID就是它的实体ID。

其他扩展可以定义新的实体类型。比如:

实体选择器允许通过输入部分的实体名称来挑选实体,然後从搜索结果的列表中选择。对于項目而言,此结果是基于标签和别名。如果有描述的话,它会显示出來。例如:输入"human",从"human(Q5)智人的俗称"、"humanity(Q1156970)世界人口總數"等中挑选Q1156970。这与屬性建议器不同。
實體輪廓是维基数据page的一种特殊类型,它包含一個在ShEx格式中的文档、以及相关的元数据。虽然它可能有类似于项目的标签、描述和别名,但它「不是」一种entity的类型。实体可以使用ShEx2 - Simple Online Validator tool根据實體輪廓进行验证。
外部标识符(External identifier):是一種屬性的類型--是一個由外部组织的数据库所使用的字符串。某些属性是以外部标识符做為它的值。它们「獨一無二地识别」一个数据项,雖然這個唯一性并不由软件所強制,但它卻受到约束的控制。例如,书籍的ISBN、电影URL中的唯一部分、或互联网电影数据库(IMDB)中的一名演员。
联邦查询是一個通过查询服务器上的服务进行的查询,允许访问维基数据以外的数据库。
词性词位在指特定语法环境下出现的一串字符。每个词位可以有多种词性。每个词位的词性由词位ID和破折号、字母"F"和数字来识别。词性可以像其他实体一样拥有声明。它们也被赋予“语法特征”,如词性L1298-F2(“词性”)的"plural"(复数)。
历史信息是通过限定日期来納入。如果信息不再是最新的,则会添加日期限定符,而不是覆盖语句。历史信息是不同於不正确的信息
人类(或人类的实例)是一个关于个人或个体的维基数据项目。它有一个隶属于 人類的聲稱。
不正确的信息是指一個有参考文献支持、卻通常被认为是无效的或不准确的聲稱。虽然维基百科通常不包括这类信息,但维基数据已废弃的等級允许标记这类声明,这有助于避免出现这种情况:它被删除后又被错误地重新添加成为有效的信息。不正确的信息是不同於历史信息
的实例的子类、和有一部分(也稱為类別类型)是在维基数据中用来指隶属于上级分类可分為、以及其他一些相关本体论属性、它们的值或使用它们的项目。
数据项,或称项目,是指在维基数据中對现实世界的对象、概念、或事件给出的一個标识符(等同于名称)以及关連到它的信息。每个项目在维基数据的主命名空间中都有对应的wiki页面。项目通过前缀ID(如Q42)或网站链接到外部页面、或是通过多语言的标签描述的獨一無二的組合,而能被識別。数据项也可能有别名来简化查找。数据项的主要数据部分是关于该项的声明的列表。数据项可以被视为链接的数据三元組的主题部分。
项目标识符:詳见下文的QID
标签(或标签名)是做為识别实体(即項目屬性)的主要名称。例如:具有項目标识符 Q7378的項目具有中文标签“大象”。一个实体在给定的人类语言中只能有一个标签。标签不需要是唯一的。描述別名就是用于区分具有相同标签的实体。Wikidata的頁面没有标签,但是有標題。它是一種術語的類型。
滞后数据库滞后在维基数据中是指其他的项目中或在查询服务器上的一種数据更新的延迟。
语言属性是语言特定的标签别名描述分配给项目属性查询的。这些是人类可读的文本,以提高对项目范围的理解;例如,某個特定的真实世界实体的类型。如果语言属性不見了,其中的某些是可以由替代语言中的某些字符串所替换,请依照language fallback chains
语言代码是一个语言标识符,用於标签、描述、别名或单语种文本的值。标签、描述和别名的语言代码是与其他维基媒体项目共享的。更多用于单语文本的代码是专门为维基数据定义的。词条使用其中的一些,以及一些额外的代码或项目来识别词条、词汇和形式中的语言。一个语言代码也被分配给网站链接。代码大多是基于IETF language tags
Language fallbacks(也称为“语言链”)是用替代语言的字符串系统地替换缺失的 language attributes 的方法。 可以根据页面类型、用户是否登录或用户首选语言来选择确切的替换规则。
词位词典编篆数据的一个实体。它包含意义和词性的子实体,但不包含网站链接。词位实体没有标签、描述和别名,而是有一个词条(可能不止一个,用于有拼写变体的语言)、一种语言和一个词典分类。
LID(或L号码)是维基数据中词位实体的标识符,由字母"L"和一个或多个数字所構成。
Listeria(或维基数据列表)是一个工具,用于在维基媒体项目中以列表形式显示来自维基数据的数据。数据會由机器人定期更新。
主空间是wiki中的命名空间之一。维基数据中除主空间之外的命名空间都帶有前缀。在维基数据中,主空间包含带有项目的页面。
MediaWiki是运行维基数据、维基百科以及其他维基媒体计划(wiki)的软件。维基数据所用的Mediawiki软件使用Wikibase扩展。請参见什么是Mediawiki?
MediaInfo是一种用于描述文件的实体类型。它在维基共享资源上被激活。
元页面是全部的非实体的页面,也就是不属于数据名字空间的页面。维基数据的元页面包括在Wikitext裏面的非结构化内容,這包括维基数据客户端包含代码。诸如「讨论页」、「分类页」、「計劃页」(在Wikidata 命名空间中)和「帮助页」(在Help 命名空间中)。元页面还可包含由MediaWiki软件自动生成的内容和数据(例如页面特殊页面的编辑历史)。
姓名项目是一个关于给定名或姓氏的维基数据项目。这些项目被用作姓氏名字的值,并且可以包括额外的信息和网站链接。
命名空间 是wiki页面的一种类别。对于每个命名空间,您可能对页面及其内容有不同的规则。在维基数据中,最重要的命名空间(或“主命名空间”)是用于维基数据。维基数据主空间页面的URL以带有一個前缀Q加上数字结尾,例如,Q7378代表“象”。其他命名空间中的页面以命名空间的名称开头,即是“前缀”。例如,帮助页面以带有一個“Help:”开头,例如Help:Contents(帮助:内容)。
受詞請詳见主語
聲明的顺序一般而言由正在使用的視圖决定,一般而言并不重要。许多视图先显示检索或输入的数据,再显示其他数据。一些视图根据限定词的值、聲明的值、属性或数据类型,对聲明进行排序或允许排序。
页面是一个带有唯一标题的内部或外部网页,例如一个在维基百科主名字空间裏的「条目」或一个在维基数据主名字空间裏的「项目」。一个页面是一个网站的一部分,在维基数据裏,“页面”這個术语可以指一个数据命名空间中的一個项目页面或一個属性页面、或指一个其他名字空间的元页面、或指一個外部的「被链入页面」,它们可以位于维基百科或其他维基媒體站点或一个外部站点。客户端网站上的一个页面可以使用网站链接来引用它們。维基数据主命名空间中的許多页面包含許多项目,并且一个页面只能持有一个项目。
谓语請詳见主語
前缀用于查询服务中。
项目维基媒体运动中常见的术语,它表示一個wiki。在维基数据中,这个术语指的是维基数据本身。
属性描述了一个声明的数据值,可以被认为是一个数据的类别,例如数据值為“蓝色”的“颜色”。属性与配对时,在维基数据中形成一个声明。属性也可用于限定符。在维基数据中,属性有其自己的页面并与项目相关联,从而形成一個链接的数据结构。
属性建议器它在添加声明到维基数据的项目时,提供了属性的预选,出现这些是基于属性在类似项目上的频率。例如:在一个只隶属于 人類的项目中,建议的屬性可能是性別职业出生日期,这些可能會适合也可能不适合於這個特定的项目。這一點与实体选择器建议约束不同。
QID(或Q号码)是维基数据项目的唯一标识符,由字母"Q"和一个或多个数字所组成。它被用来帮助人们和机器了解具有相同或类似名称的项目之间的区别。例如,世界上有多个地方叫伦敦,有许多人叫詹姆斯-史密斯。这个数字出现在每个维基数据项目顶部的標籤旁边。
限定符声称的一部分,它们通常以一种描述性的方式,明确了某个特定的声称的一些事项。一个限定符可以是一个词汇表中的术语但也可以是不同的描述性短语(这些术语或短语是任意文字还是一定是某个词汇表的一部分取决于维基数据社群)。
数量(錯誤地表示為数字)是属性值的一个数据类型。它允许输入整数或十进制数字。可以选择性地包含一个單位或一个边界。維基數據的人口属性就有这样的值。数字标识符並不是数量,而是外部标识符
查询是在维基数据中搜索数据项以及與它們關聯的数据的功能。查询通常是在维基数据查询服务上使用SPARQL查询语言执行。
快速声明(QS)是一个第三方工具,可以根据一组简单的文本命令来编辑维基数据的项目。该工具可以添加和删除声明、标签、描述和别名。它还可以添加带有可选的限定词和来源的声明。
等级是一个质量系数,在一个给定的属性中有多个声明的情况下,得以简单的选择和过滤。在这种情况下,您可能希望指出哪个陈述比其他陈述更重要或更相关。在这种情况下,你可能想表明哪个语句比其他语句更重要或更相关。默认情况下,一个声明的等级是“正常”,但你可以将其改为“首选的”或 “被废弃的”。“被废弃的”等级可用于具有参考文献的支持但被认为是不正确的声明。
重定向实体(或重定向)是一个项目或一个词组,它可以重定向到另一个项目或词组(目标)。由于在许多用途中,这些都需要特别查询,机器人通常用目标来取代作为价值的重定向。
参考文獻(或称“来源”)是用來指出某個支持維基數據內的一個聲稱的特定資料來源。一個參考文獻可以是一個URL的链接或是一个项目;例如,某個關於一本書的一個项目。维基数据并非旨在回答某個聲稱是否正确的问题,而仅是在回答某個聲稱是否出現在一個参考文獻之內。一個結合了参考文獻的聲稱,形成了一個聲明
再利用是通过编辑其标签、描述或声明来改变一个实体(一般来说是一个项目)的定义或范围。一般来说應該要避免。
沙盒沙盒项目是维基数据中的一系列项目、属性、和其他实体,用于测试维基数据的实时数据库中的功能。例如:项目Q4115189、属性Property:P369、實體輪廓EntitySchema:E123、词位L123
意义指的是一个词位的具体含义。意义在每个词位上都由词位ID和破折号、字母“S”和一个数字来识别。意义可以像其他实体一样拥有声明。它们也允许有一个“注解”:对含义的自由描述(每种语言一个)。
网站是指一般的外部网站,但在网站链接中,它指的是特定的已注册wiki,例如,某个维基百科的语言版本。这些网站由网站标识符,简称「siteid」,所引用,技术上对应到wiki的DBname。例如,拉丁语维基百科的siteid是lawiki。每个外部頁面只能在维基数据注册一个链接,一个項目只能有一个链接到每个外部站点。
网站链接是对另一个网站上的链接页面的标识。它由一个网站标识符和一个标题组成,并存储在维基数据的单个数据項中。网站链接既可用于识别外部网站的项目,也可作为一個跨语言间的链接(有时被称为 "维基间链接",尽管这个术语有時也有不同的含义)的中央存储。
维基词典各版本之间的网站链接一般不由维基数据所提供,而是通过另一种功能提供。
Snak是一个Wikibase软件的技术術語,当通过MediaWiki API访问维基数据时,数据用户很可能遇到它。它指向属性(或是特殊值例“无值”和“未知值”)的组合。Snak可以在声称(那么它们就被称为“主snak”)中找到、或在作为声明的一部份的限定符(那么它们就被称为“限定词snak”)中找到。例如在声明“艾瑪·華森曾是《哈利波特:神秘的魔法石》的演员,扮演妙麗·格蘭傑一角”中,主snak指的是前半部分“曾是《哈利波特:神秘的魔法石》的演员”,然後,限定词snak指的是後半部分“扮演妙麗·格蘭傑一角”。
声明是一個记录在某个數據项的页面上,关于某一项目的一段数据。一则声明由一个声称(一個属性-值的对,如「地点:德国」,与可选的限定符之组合)所构成、由多個参考文献(给出声称的来源)和一个等级(用于区分数个具有相同属性的声称,默认为「正常」)所擴增。维基数据并不对声明的正确性做出任何假设,而仅仅透過一个指向来源的参考文献去收集、记录这些声明。「陳述」這個术语经常与"声称"交替使用,但从技术上讲,只有在至少添加了一个参考文献之后,它才成为一个声明。
字串(簡自「字符串」)是一个泛指自由选择的字符序列、其可以被解析为「你好」这样的文本,与之对应的是一個被解析为数字的值(如3.14)、或是一个项目的链接(如[[Q1234]])。除了字符串的数据类型之外,维基数据还支持使用「单语文本」的特定语言文本,作为某個属性的
主语谓语、和受詞是有时在将實體屬性视为三元组时,用来描述一个聲稱的术语。
建议约束是一个属性约束的一個状态,它提供额外的改进建议。这可以与其他要添加到项目中的那些属性,一起做為声明。
术语(或稱"术语箱")是实体的一部分,包括標籤描述代名。术语只能是纯文本(也就是不包含任何wiki标记)。
Termbox is the zone at the top of an item page, which includes the labels, the descriptions, and the aliases in different languages.
标题页面的名称。某個wiki裏的所有页面都必须有一个獨一無二的标题,因为标题就被包含在這個页面的URL之中。例如,英文维基百科上只能有一个标题为“Douglas Adams”的页面。而在维基数据中,标题既可以是一個实体标识符(例如是Q42),也可以由一個前缀命名空间开头的字(例如是Help:)。页面的标题不能与维基数据项裏的或属性裏的标签相混淆。维基数据通过网站链接連接到其他维基媒体各個wiki的页面,后者是使用页面的标题来唯一地识别资源。
三元組(或稱"语义三元組",或 "三元體")是RDF数据模型中的基本数据实体,它以主语-謂語-受詞的语表达式的形式來编排聲明。
单位是一个与數量-值一起使用的维基数据项。经常使用的单位是米或欧元,但任何项目都可以作为单位使用。如果该单位包括国际单位制单位转换的声明,那么使用该单位的数量将根据该声明进行标准化。請参见mw:Wikibase/Indexing/RDF Dump Format#Normalized values
(也称「数据值」)是指存储在聲稱中的实际信息片段。维基数据有一系列允许的数据类型,如「项目」、「数学表达式」和「数量」。任何给定的聲稱所需的数据类型由其所使用的属性决定(例如,在「出生地」這個聲稱中的值必须是一个「项目」)。你也可以在一個聲稱中使用「未知值」或「无值」的特殊情况,而不僅是一个正常的值。
值的类型存储在内部的方式。每个数据的类型都对应一个值的类型。例如,尽管是外部标识符、維基共享媒体和数学表达式是不同的数据类型,但它们都使用「字符串」值的类型。一些数据类型的值包含有多種不同值的类型的多个部分。例如,一个数量包含四个部分。「数量」、「单位」、「上界」和「下界」,最后两个是可选的。单位是一个指向Wikidata项目的URL;其他三个部分是字符串型態的数字(不是浮点数字)。
视图是一种数据可以被可视化或访问的方式。除了默认的视图,维基百科还提供了移动设备的视图,以及rdf和json格式的视图。数据可以通过API进行访问。维基数据被镜像到Wikidata查询服务器上,提供各种结果视图。其中一些视图是editing views,其他的不是。提供自定义视图的工具和扩展的例子有共鳴器條目佔位符Listeria
Wikibase是维基数据背后的软件软件。它由一系列MediaWiki软件的扩展所组成。这些扩展允许维基数据在属性中管理数据,并使用查询去搜尋這些数据。
維基數據是一個維基媒體專案,它運行一個帶有Wikibase扩展MediaWiki實例。它允許「維基數據編者」輸入數據並瀏覽所顯示的頁面
维基数据查询服务(或稱WDQS)是使用SPARQL查询语言去查询维基数据的官方服务。
维基媒体是由人和组织组成的运动名称。维基数据与其他wiki(例如维基百科)一样由维基媒体基金会运行。Wikibase软件主要由德国维基媒体协会开发,这是国家维基媒体分会之一。
Wiki是可以被访问者快速编辑的网站,维基百科和维基数据都是维基。

相关术语表