مساعدة:حول البيانات

This page is a translated version of the page Help:About data and the translation is 98% complete.

ويكي بيانات هي قاعدة معرفية يمكن للإنسان والآلة على حد سواء القراءة والتعديل فيها، إنها واحدة من الكثير من المشاريع التي تتخذ الويكي أساسًا لها كما يتم استضافتها وصيانتها على خوادم ويكيميديا. ويكيميديا هي مؤسسة غير ربحية تستضيف المحتوى الحر وتساعد على نشره وهي معروفة بموسوعتها الحرة ويكيبيديا. كل مشروع من مشاريع ويكيميديا يركز على نقاط معينة ويسعى لتحقيق أهداف بعينها، على سبيل المثال، فوكيبيديا هي موسوعة حرة المحتوى يستطيع أي شخص تحريرها لكن في المقابل مشروع كومنز تتمحور أهدافه حول كونه قاعدة للصور والوسائط المتعددة الحرة مثل الفيديوهات، اما بالنسبة لويكي قاموس فهو يسعى لأن يكون معجمًا ضخمًا يحتوي كل التفاصيل الممكنة عن كلمة معينة. لكن هدف ويكي بيانات هو البيانات المهيكلة أي المنظمة وفق نظام معين.

هذه الصفحة مخصصة كلمحة عن البيانات المهيكلة، إذا كنت تعرف البيانات المهيكلة من قبل لكن تريد أن تتعرف عليها أكثر لاستخدامها في عمل معين في ويكي بيانات أو معرفة كيفية الوصول للبيانات أو المساهمة بمشروعك هنا الرجاء الذهاب مباشرة الى قسم كيفية ربط البيانات.

فهم ويكي داتا

مصطلح البيانات المهيكلة يشير إلى البيانات التي تم تنظيمها وتخزينها بطريقة معينة، غالبًا ما يكون الهدف منها ترميز المعنى وحفظه من الاختلاط بالبيانات المختلفة المتواجدة ضمن مجموعة من البيانات.

لكن ما هي البيانات على أي حال؟ ولماذا ينبغي علي الاهتمام بما يدعى البيانات المهيكلة بشكل خاص؟

تعريف البيانات

البيانات الضخمة، البيانات التجريبية، البيانات المفتوحة، البيانات الوصفية- يمكن ان تكون قد واجهت بعض أو حتى كل هذه المصطلحات من قبل.

كل مصطلح يعني شيئا مختلفا مع بعض الاختلافات الطفيفة لكن جميعهم قد تم بناؤهم بنفس الأسلوب المعتمد على وجهة نظر واحدة تجاه البيانات وقدرتها على وصف وتطوير الفهم تجاه العالم من حولنا.

كمفهوم مجرد، البيانات هي المادة الأولية للمعلومات والذي يعني ان المعلومات تُشتَق من البيانات بعد معالجتها.

وهذا لأن البيانات عندما تغلي إلى جوهرها هي ببساطة مجموعة من القيم حول الأشياء، يمكن أن تكون هذه القيم رقمية أو كمية مثل قياس أو مقدار، كما يمكن أن تكون نوعية، مثل وصف أو مقارنة، على سبيل المثال، يمكننا أن نقول أن "8848 م (29029 قدم)" هي قيمة البيانات عن ارتفاع جبل إيفرست وأن "الأحمر" هو قيمة البيانات عن لون سيارة.

وكما ذكرنا من قبل، فإن المعلومات ليست هي نفسها البيانات ولكنها بدلا من ذلك نتاج جمع وتحليل البيانات، على سبيل المثال ، 8848 (بيان) هو رقم لا معنى له إلى حد ما من تلقاء نفسه حتى لو كنا نعرف أنه ارتفاع الجبل، يمكننا فقط أن نقول أن جبل إيفرست هو أعلى جبل في العالم ويبلغ 8،848 م (معلومات) إذا كنا مدركين لقياسات الارتفاع القياسية ومتى عرفنا ارتفاع الجبال الأخرى، يصبح من الأسهل كثيرا إنشاء مثل هذه الاستدلالات واكتساب رؤى ومعرفة جديدة وتحديد الحقائق عند تنظيم البيانات، وسنعود إلى هذه الفكرة لاحقا.

أين هي البيانات؟

البيانات في كل مكان حولنا، هناك العديد من أنواع مصادر البيانات، بما في ذلك البيانات المالية والبيولوجية والاجتماعية، حتى هذه الصفحة لديها بيانات! على سبيل المثال، تحتوي على إجمالي عدد الكلمات، والتواريخ التي تم إنشاؤها، والمراجعة الأخيرة، وموضوع، وعدد مشاهدات الصفحة، واللغات التي يتوفر بها المحتوى.

ومع ذلك، في حين أن كل شيء يمكن أن يكون مصدرًا للبيانات، والبيانات التي لا يتم تسجيلها وتنظيمها كذلك قد تكون لا وجود لها على الإطلاق، دون وجود البنية الأساسية، تظهر بيانات لا معنى لها ونفشل في تقديم معلومات مفيدة.

بتنظيمها، فإننا نعني تصنيفها بطريقة قياسية لا لبس فيها، البيانات المنظمة والمصنفة هي ما نشير إليها عندما نقول البيانات المنظمة.

 
ويكي بيانات يتميز بالمدخلات القائمة على نموذج لإضافة البيانات إلى البنود

أين هو التركيب؟

على شبكة الإنترنت، الهيكل يسود; يتم إنشاء معظم مواقع الويب باستخدام HTML، لغة الترميز التي توفر السقالة أو البنية الأساسية لصفحة الويب.

تُستخدَم لغات البرمجة أيضًا لوضع علامات ووصف محتوى الصفحة بحيث يمكن لمحركات البحث، والبوتات، وتطبيقات مثل خلاصات RSS معالجتها و"فهمها" بسهولة، على سبيل المثال، وسوم <title> تقول للآلات ما اسم موقع الويب.

بدلا من دعم البنية والعناصر المشتركة لصفحة الويب، يوفر ويكي بيانات بنية لكل المعلومات المخزنة في ويكيبيديا، وعلى مشاريع ويكيميديا ​​الأخرى، يستند ويكي بيانات على برنامج ميدياويكي كما هو الحال مع أي مشروع ويكيميديا آخر، ممدد بواسطة Wikibase: البرنامج الذي يدير ويكي بيانات وهو مصمم لإدارة كميات كبيرة من البيانات المنظمة، لا تتم إضافة البنية مباشرة إلى محتوى ويكيبيديا أو صفحات ويكيميديا ​​الأخرى، كما هو الحال في الجداول أو القوائم، ولا أية معرفة بلغة الترميز أو مخططات البيانات أو تدوين الأشياء أو أية صيغة خاصة أخرى مطلوبة من قبل مستخدمي ويكيميديا، بدلا من ذلك، تتم إضافة وتحرير البيانات في ويكي بيانات من خلال نماذج إدخال سهلة للمستخدم.

جميع البيانات المخزنة على ويكي بيانات يمكن استخدامها لتوليد جميع أنواع قوائم التاريخ أو الجداول أو صفحات منظمة أخرى في أي موقع ويكيميديا ​​أو في أي مكان آخر.

الجدول 1
بيانات للجبال
جبل خاصية قيمة
Mount Everest height 8,848 m
K2 hauteur 8,611 m
Kanchenjunga height 8,586 m
Lhotse height 27940 ft

تركيب البيانات

على سبيل المثال لأهمية البنية، دعنا ننظر إلى الجدول 1، في هذا الجدول يمكننا أن نرى بيانات لأعلى أربعة جبال وجه الأرض، إذا كنا نرغب في معرفة معلومات معينة، مثل ارتفاع ثاني أعلى جبل في العالم، فيجب أن نكون قادرين على الاطلاع على البيانات المقدمة ومعرفة القيمة الصحيحة، ومع ذلك، فإن ثلاثة فقط من الجبال الأربعة قد صُنِّفت بياناتها على أنها قيمة ارتفاع، وهناك فقط اثنان من هذه الجبال الثلاثة لديها قيم بالأمتار، في حين أننا نعلم أن الطول وhauteur (الفرنسية للارتفاع) يمكن فهمهما على أنهما متساويتان، وأن كل من الأمتار والأقدام يمكن أن تُستخدَم كوحدات قياس للارتفاع، فإن آلة، مثل بوت أو برنامج برنامج حاسوب قد لا يكون كذلك.

سيكون من الأسهل بكثير للبشر والآلات معالجة المعلومات والإجابة على السؤال الأصلي عن ثاني أعلى جبل عندما يتم تسجيل جميع البيانات الأساسية بطريقة مشابهة حتى لو اختلف العرض التقديمي.

نمذجة البيانات

يتم تنظيم مجموعات البيانات المنظمة ، مثل ويكي بيانات، وفقا لنموذج بيانات ، تكون نماذج البيانات قابلة للقراءة آليا: بمعنى أنه يمكن فهمها بواسطة الحاسوب، في حين أن أجهزة الحواسيب قوية، إلا أنها في كثير من الأحيان ليست ذكية مثلنا عندما يتعلق الأمر بالتفكير البسيط، على سبيل المثال، في المثال أعلاه، لن يتمكن الجهاز من معرفة أن الارتفاع وhauteur مماثلان ما لم يتم إخباره بشكل صريح بأن هذه هي الحالة.

الجدول 2
بيانات للجبال
جبل خاصية قيمة
Mount Everest continent Asia
K2 continent Asia
Kanchenjunga continent Asia
Lhotse continent Asia
 

تختلف نماذج البيانات وفقا لاحتياجات التحليل ونطاقه وإطاره المفاهيمي لمجموعة البيانات والمتطلبات الفنية لنظام ما، ومع ذلك، فإن جميع نماذج البيانات ستحدد عادة نوع البيانات التي يمكن دعمها من خلال نظام وما هي العلاقات بين القيم التي يمكن فهمها وتمثيلها، على سبيل المثال، يمكن أن يحدد نموذج البيانات أن الارتفاع وhauteur يتم تعيينهما لبعضهما البعض بحيث يمثل كلا المصطلحين مفهوما واحدا، أو أن القياسات بالقدم يتم تحويلها تلقائيا إلى متر، نموذج بيانات ويكي بيانات يشكل الطريقة التي يمكن بها تحرير البيانات وإضافتها إلى النظام من قبل المستخدمين، وهو أيضا عبارة عن عمل قيد التقدم، مع إضافة أنواع بيانات جديدة إلى النموذج بمرور الوقت.

كما يقوم نموذج البيانات بترجمة أنماط اللغة الطبيعية البشرية إلى شيء يمكن معالجته بواسطة الآلات، على سبيل المثال، قد نقول بالإنجليزية:

"Mount Everest is the highest mountain in the world"

هذا هو أيضا الشكل الخام وغير المنظم للمحتوى الموجود حاليا على ويكيبيديا وجميع مواقع ويكيميديا ​​الأخرى.

في ويكي بيانات، هذا من شأنه أن يمثله بيان، والذي يتألف من زوج من الخواص ذات القيمة حول عنصر، في هذه الحالة الأرض:

Earth (Q2) (عنصر)highest point (P610) (خاصية)Mount Everest (Q513) (قيمة)

بالإضافة إلى ذلك، فإن ويكي بيانات أيضًا يحتفظ ببيان حول هذا البند لجبل إيفرست (يشير إلى أنه جبل):

Mount Everest (Q513) (عنصر)instance of (P31) (خاصية)mountain (Q8502) (قيمة)

لاحظ أنه لاستخدام عناصر أخرى كقيم للبيانات، ولجميع العناصر صفحة خاصة بها على ويكي بيانات; فإن هذا يعني أنه يمكن ربط جميع العناصر في النظام معا من خلال سلسلة من البيانات، لأن ويكي بيانات يستخدم تنسيقا مقروءا آليا; فإن ترابط البيانات هذا يسمح باكتشاف العلاقات والوصلات الجديدة ومعالجتها بواسطة الآلات، على سبيل المثال، في الجدول 2، نرى بيانات جديدة لجبالنا، وهذه المرة عن موقعها الجغرافي حسب القارة ولكن لا شيء عن ارتفاعاتها، وبافتراض أن بيانات هذه القارة كانت مرتبطة ببيانات ارتفاع الجبل، فإننا نشعر بثقة أكبر في صنع التوقعات أو استخلاص استنتاجات معينة حولها، مثل القول بأن آسيا هي موطن أعلى جبال العالم.

ربط البيانات

وبالإضافة إلى كونها مجموعة من البيانات المنظمة، ويكي بيانات يدعم أيضًا البيانات المرتبطة، وتشير البيانات المرتبطة لممارسة نشر البيانات المنظمة بحيث يمكن أن تكون مترابطة.

بالنسبة لويكي بيانات، هذا يعني أنه يمكن أيضا ربط البيانات التي يقدمها المتطوعون بمجموعات بيانات وقواعد بيانات ومصادر بيانات أخرى من جميع أنحاء الويب ومن مبادرات متنوعة خارج نطاق عائلة ويكيميديا، على سبيل المثال، يسمح ويكي بيانات حاليا بالربط مع مجموعات بيانات وقواعد بيانات متنوعة مثل كتب جوجل وكانمور (إحدى قواعد بيانات بيئة اسكتلندا التاريخية) ومكتبة الفاتيكان وأوميغاويكي وميوزك برينز.

 
مثال على بيان بسيط يتكون من زوج من الخواص وقيمة واحدة
 
مثال على بيان بسيط يتكون من زوج من الخواص وقيمة واحدة وتصفيات ومرجع

باتباع مبادئ وممارسات البيانات المرتبطة، ويكي بيانات قادر أيضًا على الدعم ويمكن استخدامه في مشاريع أخرى.

مباديء البيانات الموصولة

يستخدم ويكي بيانات معرفات فريدة من نوعها، أو معرفات الموارد الموحدة (URIs)، لجميع بنوده وفقًا لمعايير البيانات المرتبطة.

في حين يستخدم ويكي بيانات نموذج بيانات فريدا، يمكن تصدير محتواه ، وهو تنسيق قياسي يُستخدَم على نطاق واسع للبيانات المرتبطة، في مصطلحات ويكي بيانات، يتكون البيان من عنصر وزوج قيمة الخاصية، بالنسبة لأولئك المألوفين بمفاهيم البيانات المرتبطة، يمكن النظر إلى عنصر باعتباره جزء الموضوع في الثلاثي، الخاصية تمثل مضمون ثلاثي، ويتم استخدام قيمة للتعبير عن وجوه ثلاثي.

ومع ذلك، قد تحتوي أيضا بيانات ويكي بيانات على عناصر تتعدى كائن المسند الموضوعي، مثل المراجع والمؤهلات (لمزيد من المعلومات; راجع Help:Statements)، وهذا يجعل من التعقيد تمثيل محتوى ويكي بيانات بشكل كامل باستخدام لغة RDF، يمكن العثور على مزيد من المعلومات حول هذه التحديات في الوثيقة "تقديم ويكي بيانات إلى ويب البيانات المرتبطة".

المساهمة ببيانات

إذا كانت لديك مجموعات بيانات ترغب في المساهمة بها في ويكي بيانات، رجاءً انظر Wikidata:Dataset Imports.

الوصول للبيانات

يتم نشر البيانات في ويكي بيانات تحت المشاع الإبداعي إهداء الملكية العامة 1.0، مما يسمح بإعادة الاستخدام المجاني للبيانات، يمكنك نسخ البيانات وتعديلها وتوزيعها وتنفيذها، حتى لأغراض تجارية، وكل ذلك دون طلب إذن.

See Data access for details about the different ways to programmatically access Wikidata's data.

انظر أيضا

لصفحات مرتبطة; انظر:

لمعلومات وإرشاد إضافية; انظر:

  • دردشة المشروع: لمناقشة كل شيء وبأي جانب من جوانب ويكي بيانات
  • Wikidata:Glossary: للمصطلحات المستخدمة في صفحة المساعدة هذه وصفحات المساعدة الأخرى
  • Help:FAQ: الأسئلة المتداولة والإجابة عليها من قبل مجتمع ويكي بيانات
  • Help:Contents: بوابة المساعدة التي تضم جميع الوثائق المتاحة في ويكي بيانات