رسم بياني للمعرفة
الرسم البياني للمعرفة Knowledge graph عبارة عن قاعدة معرفية تستخدم نموذج بيانات منظم أو طوبولوجية لدمج البيانات. غالباً ما تُستخدم الرسوم البيانية المعرفية لتخزين الأوصاف المترابطة لـ الكيانات – الكائنات أو الأحداث أو المواقف أو المفاهيم المجردة – باستخدام دلالات حرة الشكل.[1]
منذ تطوير الوب الدلالي، غالباً ما ترتبط الرسوم البيانية المعرفية بمشروعات بيانات مفتوحة مرتبطة، مع التركيز على الروابط بين المفاهيم والكيانات.[2] كما أنها مرتبطة بشكل بارز وتستخدمها محركات البحث مثل گوگل و بنگ و ياهو؛ محركات المعرفة وخدمات إجابة الأسئلة مثل ولفرام ألفا و سيري من آپل و ألكسا من أمازون؛ والشبكات الاجتماعية مثل لنكد إن و فيسبوك
تاريخ
تمت صياغة المصطلح في أوائل عام 1972، في مناقشة كيفية بناء أنظمة تعليمية معيارية للمقررات.[3] في أواخر الثمانينيات، بدأت جامعتا گرونينگن و توينتي مشروعاً مشتركاً يسمى لرسوم البيانية المعرفية، مع التركيز على تصميم الشبكات الدلالية ذات الحدود المقيدة بمجموعة من العلاقات لتسهيل الجبر على الرسم البياني. في العقود اللاحقة، كان التمييز بين الشبكات الدلالية والرسوم البيانية المعرفية غير واضح.
كانت بعض الرسوم البيانية المعرفية الأولية خاصة بالموضوع. في عام 1985، تم إنشاء ووردنت، لالتقاط العلاقات الدلالية بين الكلمات والمعاني – تطبيقاً لهذه الفكرة على اللغة نفسها. في عام 2005، أسس مارك ويرك جيونيمز لالتقاط العلاقات بين مختلف الأسماء الجغرافية والمواقع والكيانات المرتبطة بها. في عام 1998، أنشأ أندرو إدموندز من العلوم المالية المحدودة في المملكة المتحدة نظاماً يسمى ThinkBase والذي قدم التفكير المنطقي المبني على المنطق الضبابي في سياق رسومي.[4]
في عام 2007، تم تأسيس كل من DBpedia و فري بيز القاعدة الحرة كمستودعات معرفية قائمة على الرسم البياني للمعرفة العامة. ركزت DBpedia حصرياً على البيانات المستخرجة من ويكيپيديا، بينما تضمنت فري بيز أيضاً مجموعة من مجموعات البيانات العامة. لم يصف أي منهما نفسه على أنهما مطورا "الرسم البياني للمعرفة" بل قاما بتطوير ووصف المفاهيم المرتبطة.
في عام 2012، قدمت گوگل الرسم البياني للمعرفة،[5]بناءً على DBpedia و القاعدة الحرة من بين مصادر أخرى. قاموا لاحقاً بدمج RDFa، مايكروداتا JSON-LD المحتوى المستخرج من صفحات الوب المفهرسة، بما في ذلك كتاب حقائق العالم لوكالة المخابرات المركزية و ويكي داتا و ويكيپيديا.[5][6]. تم تنظيم أنواع الكيانات والعلاقات المرتبطة بالرسم البياني المعرفي هذا بشكل أكبر باستخدام مصطلحات من الكلماتschema.org[7]. أصبح الرسم البياني للمعرفة من گوگل مكملاً ناجحاً للبحث المستند إلى السلاسل داخل گوگل، وقد أدت شعبيته عبر الإنترنت إلى زيادة استخدام المصطلح.[7]
منذ ذلك الحين، أعلنت العديد من الشركات متعددة الجنسيات عن استخدام الرسوم البيانية المعرفية، مما أدى إلى زيادة انتشار هذا المصطلح. وتشمل فيسبوك و لنكدن إن و إير بي-إن-بي و مايكروسوفت و أمازون و أوبر و إي باي.[8]
تعاريف
لا يوجد تعريف واحد مُسلَّم به بشكل عام للرسم البياني المعرفي. تعرض معظم التعريفات الموضوع من خلال منظار الوب الدلالية وتشمل هذه الميزات:[9]
- العلاقات المرنة بين المعرفة في المجالات الموضوعية: الرسم البياني للمعرفة (1) يحدد الفئات المجردة وعلاقات الكيانات في مخطط، (2) يصف بشكل أساسي كيانات العالم الحقيقي وعلاقاتها المتبادلة، المنظمة في رسم بياني، (3) يسمح بإمكانية ربط الكيانات العشوائية مع بعضها البعض، و (4) يغطي مجالات موضعية مختلفة.[10]
- الهيكل العام: شبكة من الكيانات وأنواعها الدلالية وخصائصها وعلاقاتها.[11][12]
- دعم الاستدلال على الأنطولوجية المستنبطة: يكتسب الرسم البياني المعرفي المعلومات ويدمجها في الأنطولوجية ويطبق سبباً لاشتقاق معرفة جديدة.[2]
ومع ذلك، هناك العديد من تمثيلات الرسم البياني المعرفي التي لا تكون بعض هذه الميزات ذات علاقة بها. بالنسبة إلى الرسوم البيانية المعرفية، قد يكون هذا التعريف الأبسط أكثر فائدة:
- بنية رقمية تمثل المعرفة كمفاهيم والعلاقات بينها (حقائق). يمكن أن يشتمل الرسم البياني للمعرفة على الأنطولوجية التي تسمح لكل من البشر والآلات بفهم محتوياته والتفكير ملياً بها.[13]
التطبيقات
بالإضافة إلى الأمثلة المذكورة أعلاه، تم استخدام المصطلح لوصف مشاريع المعرفة المفتوحة مثل YAGO و ويكي داتا؛ اتحادات مثل سحابة البيانات المفتوحة المرتبطة;[14] مجموعة من أدوات البحث التجارية، بما في ذلك مساعد البحث الدلالي سپارك من ياهو و الرسم البياني للمعرفة من گوگل و ساتوري من مايكروسوفت؛ والرسومات البيانية لكيان لنكد إن وفيسبوك.[2]يستخدم المصطلح أيضاً بشكل متزايد من خلال تطبيقات تدوين الملاحظات التي تسمح للمستخدم ببناء رسم بياني للمعرفة الشخصية.
استخدام الرسم البياني للمعرفة للاستدلال على البيانات
يمثل الرسم البياني المعرفي اصطلاحياً الدلالات من خلال وصف الكيانات وعلاقاتها. قد تستفيد الرسوم البيانية المعرفية من أنطولوجية كطبقة مخطط. من خلال القيام بذلك، فإنها تسمح للاستدلال المنطقي باسترداد المعرفة الضمنية بدلاً من السماح فقط بالاستعلامات التي تطلب معرفة صريحة.[15]
من أجل السماح باستخدام الرسوم البيانية المعرفية في مهام التعلم الآلي المختلفة، تم وضع عدة طرق لاشتقاق تمثيلات الميزات الكامنة للكيانات والعلاقات. تسمح عمليات تضمين الرسم البياني المعرفي هذه بالاتصال بأساليب التعلم الآلي التي تتطلب متجهات ميزات مثل تضمين الكلمات. هذا يمكن أن يكمل التقديرات الأخرى للتشابه المفاهيمي.[16] [17]
انتظام الكيانات
بينما ما يتم إنتاج رسوم بيانية معرفية جديدة عبر مجالات وسياقات متنوعة، فإن الكيان نفسه سيُمثَّل حتمًا في رسوم بيانية متعددة. ومع ذلك، نظرًا لعدم وجود معيار واحد لبناء أو تمثيل الرسم البياني المعرفي، فإن حل مسألة تحديد أي الكيانات من الرسوم البيانية المتباينة تتوافق مع موضوع العالم الحقيقي نفسه هي مهمة غير بديهية. تُعرف هذه المهمة باسم محاذاة كيانات الرسم البياني المعرفي، وهي مجال نشط للبحث.
استراتيجيات محاذاة الكيانات
بشكل عام، تسعى استراتيجيات محاذاة الكيانات إلى تحديد ما يلي بين رسمين بيانيين معرفيين متميزين:
البُنى التحتية المتشابهة: البحث عن أنماط متطابقة أو متشابهة في كيفية ارتباط الكيانات بجيرانها داخل كل رسم بياني (مثل تصنيفات متشابهة، أو وجود في سياق علائقي متماثل).
العلاقات الدلالية: تحليل المعنى والسياق وراء الروابط بين الكيانات، وليس فقط الهيكل نفسه. يتضمن ذلك فهم أن علاقة "يُنتجُ" في رسم بياني تعادل علاقة "يصنع" في رسم آخر.
السمات المشتركة: المقارنة المباشرة للخصائص (Properties) والقيم (Values) المرتبطة بالكيان في كلا المصدرين، مثل الأسماء، والتواريخ، والوصف، مع الأخذ في الاعتبار مرادفات اللغة والتباين في صياغة البيانات.
مزيج من العناصر الثلاثة: تعتمد معظم المنهجيات المتقدمة على دمج هذه الاستراتيجيات معًا، حيث أن الاعتماد على أسلوب واحد قد لا يكون كافيًا لتحقيق دقة عالية، خاصة في ظل وجود تباين في تمثيل البيانات.
التحديات والمنهجيات
تتعلق التحديات الرئيسية في محاذاة الكيانات بفجوات التباين (heterogeneity gap) التي تنشأ من:
التباين الهيكلي: اختلاف المخططات (Schemas) وهياكل الرسوم البيانية.
تباين التمثيل: اختلاف المعرفات (IDs)، والخصائص (Properties)، وأسماء العلاقات (Relation names) لنفس الكيان.
تباين اللغة: استخدام لغات أو مفردات مختلفة لوصف الكيانات نفسها.
عدم اكتمال البيانات: قد تكون المعلومات المتعلقة بكيان ما موجودة في رسم بياني واحد ومفقودة في الآخر.
تعتمد منهجيات المحاذاة الحديثة بشكل متزايد على:
حفلات القران: تضمين الكيانات والعلاقات في فضاء متجهي (Vector Space) ثم قياس المسافة بينها.
التعلم العميق: استخدام الشبكات العصبية لاكتشاف الأنماط المعقدة والميزات غير الظاهرة للمطابقة.
المعاجم والمراجع: الاستفادة من مصادر معرفية خارجية (مثل ويكي بيانات "Wikidata" أو DBpedia) كمراجع أساسية للمحاذاة.
يعد تحقيق محاذاة دقيقة وفعالة أمرًا بالغ الأهمية لدمج المعرفة من مصادر متعددة، مما يمكّن من إنشاء رسوم بيانية معرفية شاملة وغنية، وهو ما يُعد حجر الأساس للويب الدلالي والذكاء الاصطناعي التوضيحي.
انظر أيضاً
- Concept map
- Formal semantics (natural language)
- Graph database
- Knowledge base
- Knowledge graph embedding
- Logical graph
- Semantic integration
- Semantic technology
- Topic map
- Vadalog
- Wikibase- Mediawiki Software extensions for creating knowledge bases
- Wikidata - Free Knowledge Database Project
- YAGO (database)
المراجع
- ^ "What is a Knowledge Graph?". 2018.
- ^ أ ب ت (2016) "Towards a Definition of Knowledge Graphs" in SEMANTiCS2016.: 13–16, Leipzig: Joint Proceedings of the Posters and Demos Track of 12th International Conference on Semantic Systems - SEMANTiCS2016 and 1st International Workshop on Semantic Change & Evolving Semantics (SuCCESS16).
- ^ Edward W. Schneider. 1973. Course Modularization Applied: The Interface System and Its Implications For Sequence Control and Data Analysis. In Association for the Development of Instructional Systems (ADIS), Chicago, Illinois, April 1972
- ^ "US Trademark no 75589756".
- ^ أ ب Singhal, Amit (May 16, 2012). "Introducing the Knowledge Graph: things, not strings". Official Google Blog. Retrieved 21 March 2017.
{{cite web}}
: CS1 maint: url-status (link) - ^ Schwartz, Barry (December 17, 2014). "Google's Freebase To Close After Migrating To Wikidata: Knowledge Graph Impact?". Search Engine Roundtable. Retrieved December 10, 2017.
- ^ أ ب McCusker, James P.; McGuiness, Deborah L. "What is a Knowledge Graph?". www.authorea.com. Retrieved 21 March 2017.
- ^ "Knowledge Graph Enterprises". 2020.
- ^ قالب:Cite arxiv
- ^ Paulheim, Heiko (2017). "Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods" (PDF). Semantic Web: 489–508. Retrieved 21 March 2017.
- ^ Kroetsch, Markus; Weikum, Gerhard. "Special Issue on Knowledge Graph". Journal of Web Semantics. Retrieved 21 March 2017.
- ^ "What is a Knowledge Graph?|Onotext". Ontotext (in الإنجليزية الأمريكية). Retrieved 2020-07-01.
- ^ "The Knowledge Graph about Knowledge Graphs". 2020.
- ^ "The Linked Open Data Cloud". lod-cloud.net. Retrieved 2020-06-30.
- ^ "What are the benefits of the Google Knowledge Panel?". GKP Maker (in الإنجليزية الأمريكية). 2020-10-06. Retrieved 2020-10-28.
- ^ Hongwei Wang (October 2018). "RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems". ACM International Conference on Information and Knowledge Management: 417–426. arXiv:1803.03467. doi:10.1145/3269206.3271739. S2CID 3766110.
- ^ "Embedding models for knowledge graph completion".
وصلات خارجية
- Will Douglas Heaven (4 September 2020). "This know-it-all AI learns by reading the entire web nonstop". MIT Technology Review. Retrieved 5 September 2020.
Diffbot is building the biggest-ever knowledge graph by applying image recognition and natural-language processing to billions of web pages.