التجربة الأولى: قياس مقارن للتغطية في محرك البحث "عربي"

كتبهاهشام طليب ، في 30 أكتوبر 2006 الساعة: 08:10 ص

أولاً: مقدمة:

     يعد قياس التغطية Coverage من عناصر تقييم أدوات البحث، وتعني التغطية إجمالي الوثائق أو المصادر التي تضمها قاعدة البيانات الخاصة بأداة البحث، أي مجتمع الوثائق أو الأوعية التي تضمها الأداة وغالباً لا تكون مساوية لحجم المصادر المتاح عموماً على الإنترنت.

* عند تقدير التغطية يمكن النظر إليها من زاويتين:

1- نسبة تغطية الأداة إلى إجمالي حجم المصادر المتوافرة على الإنترنت.

2- نسبة تغطية الأداة إلى إجمالي تغطية أدوات البحث الأخرى (منفردة أو مجتمعة)

* ويمكن لحجم التغطية المراد قياسه أن يكون:

1- كلياً: أي إجمالي حجم تغطية الأداة.

2- جزئياً: أي جزء محدد من حجم تغطية الأداة (كقياس تغطية الأداة لمواقع دور النشر العربية مثلاً)

* ويمكن قياس التغطية بأكثر من أسلوب:

1- قياس منفرد للتغطية الخاصة بأداة بعينها

2- قياس مقارن للتغطية وفقاً لتغطية أدوات أخرى، وقد يكون :

     - ثنائي: أداة / أداة

     - متعدد: أداة / أدوات

3- قياس مقارن للتغطية وفقاً لقائمة ببليوجرافية قياسية

( أي قياس تغطية أداة ما اعتماداً على تجميع ببليوجرافي يعد تمثيلاً لما هو منشور ومتوافر بالفعل على الإنترنت وليس فقط ما تضمه أدوات البحث، وهو مثل تقييم مجموعات أو مقتنيات المكتبات اعتماداً على القوائم الببليوجرافية )

 

ثانياً: التجربة:

     سيتم استخدام أسلوب قياس مقارن مزدوج، بمعنى أنه سيتم استخدام أسلوبين معاً في قياس التغطية، ألا وهما (قياس مقارن وفقاً لتغطية أدوات أخرى، وسأستخدمه في صورته الثنائية أداة / أداة ) و(قياس مقارن وفقاً لقائمة ببليوجرافية قياسية)، وسيتم القياس جزئياً في حجم التغطية، وسيتم اتخاذ جوجول هو الأداة الأخرى (السبب الرئيسي لهذا الاختيار هو الحديث الدائر في بعض ما نشر عن محرك البحث "عربي" حول احتمالات منافسته لجوجول).

 

1- غرض التجربة:

 قياس تغطية أداة البحث "عربي" من إجمالي مصادر المعلومات المتاحة على الإنترنت

 

2- الأدوات الخاضعة للتجربة:

محرك بحث " عربي"، ومحرك بحث " جوجول"

 

3- توقيت إجراء التجربة:

يوم السبت الموافق 28 أكتوبر 2006، بداية من 12.17 ظهراً حتى 2.45 ظهراً

 

4- استراتيجية البحث:

     تم البحث بالعناوين الإلكترونية للمواقع التي يراد اختبار توافرها في قاعدتي بيانات الأداتين، وذلك بعد اختبار أداتي البحث من حيث الصياغة الأصح التي تعتمدها الأداة في البحث بالعنوان الإلكتروني، وتم الاتفاق على استخدام العنوان باسم النطاق الأساسي في البحث بدون البروتوكول أي كالمثال التالي www.oscartours.com ، وقد تم اختيار البحث بالعنوان الإلكتروني لأنه عنصر متفرد Unique لكل موقع، ولا يتأثر البحث بواسطته باحتمالات مختلفة في بناء الأداة تؤثر على البحث ، ويتوافق ذلك مع غرض التجربة لمعرفة توافر أو عدم توافر موقع بعينه في قاعدة بيانات الأداة.

 

5- وصف التجربة:

     تم اختيار مجال موضوعي بعينه لقياس تغطية الأداة لمصادره وهو السفر والسياحة (تم اختيار هذا الموضوع لأنه يتوافر لي إتاحة ما لعدد من التجميعات الببلوجرافية الخاصة بهذا الموضوع يمكن اتخاذها أساساً للقياس عليها، وقد تم اختيار القائمة الخاصة بمواقع شركات السياحة المصرية وهي تضم أكثر من 400 موقع، حيث تم اختيار آخر 100 موقع أضيفت للقائمة ليتم قياس توافرهم في قاعدتي الأداتين محل الدراسة، وقبل تنفيذ القياس الفردي لكل موقع في الأداتين تم التأكد من أن كل موقع هو موقع نشط وغير متوقف لأي سبب من الأسباب. وكان القياس يعتمد على أن تظهر تسجيلة مستقلة للموقع في النتائج بغض النظر عن ترتيبها في النتائج  أو كونها صفحة رئيسية أو فرعية ( لأن الغرض هو قياس توافرها من عدمه فقط)، والتسجيلة التي لا تعتبر تسجيلة مستقلة هي التي ليست تسجيلة الموقع نفسه بل موقع آخر ذكر العنوان الإلكتروني للموقع عليه وتم استرجاعه مع النتائج. وعلى هذا تم تنفيذ 200 عملية بحث يدوياً في الأداتين.

 

6- نماذج للعناوين الإلكترونية للمواقع وتوافرها:

      العنوان الإلكتروني           عربي                جوجول

1- www.cairoint.com      غير متوافر          غير متوافر

2- www.exceltrvl.com     غير متوافر             متوافر

3- www.coralon.com      غير متوافر           غير متوافر

4- www.italoteltours.com         غير متوافر             متوافر

5- www.royalvalleytours.com غير متوافر             متوافر

6- www.academytravel.net      متوافر                   متوافر

7- www.skybirdtravel.net                          غير متوافر             متوافر

8- www.petratravel.net             غير متوافر            غير متوافر

9- www.alfalouga.com.eg                         غير متوافر             متوافر

10-www.bestwaytravel.org                      غير متوافر              متوافر

 

7- نتائج التجربة:

أظهرت التجربة النتائج التالية:

أولاً: بالنسبة للتغطية الخاصة بمحرك البحث "عربي" ومدى توافر مفردات القائمة الببليوجرافية في قاعدة بياناته هي كالتالي :

من إجمالي 100 موقع غطى موقعاً واحداً ولا يتوافر في قاعدته 99 موقعاً، بنسبة تغطية 1% ، ونسبة عدم تغطية 99% .

ثانياً: بالنسبة للتغطية الخاصة بمحرك البحث "جوجول" ومدى توافر مفردات القائمة الببليوجرافية في قاعدة بياناته هي كالتالي:

من إجمالي 100 موقع غطى 88 موقعاً ولا يتوافر في قاعدة بياناته 12 موقعاً، بنسبة تغطية 88% ، ونسبة عدم تغطية 12%.

 

ويتضح من ذلك الآتي:

أولاً: تعتبر تغطية "عربي" ضعيفة جداً وتكاد تكون منعدمة في مدى توافر مفردات القائمة المستخدمة في القياس داخل قاعدة بياناته، وهذا يعني زيادة احتمالية فقد المستفيد الذي يبحث في الأداة لمصادر معلومات ذات صلة وثيقة ببحثه.

ثانياً: في مجال المقارنة بين تغطيتي "عربي" و"جوجول" ببعضهما البعض، يتضح أن نسبة تغطية الأول إلى الثاني هي 1.14% تقريباً من إجمالي ما قام جوجول بتغطيته، ويوضح ذلك الفارق الهائل بين تغطيتاهما.

 

 

 ——————————–

       تقدم نتائج هذه التجربة كما رأينا مؤشرات هامة في النظر إلى التغطية الخاصة بأداة البحث "عربي"، ومن خلال ذلك يمكن أن نرى الاتساق مع ما يشير إليه "عربي" أنه يفهرس "جميع مواقع الإنترنت العربية" أو "جميع مواقع الإنترنت" كما تحدثت عن ذلك في تدوينة سابقة، ولهذا السبب تحديداً كان اختياري لقياس التغطية لديه لأقدم شاهداً موضوعياً يؤكد ما ذكرت في هذه التدوينة السابقة.

 

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
التصنيفات : غير مصنف | أرسل الإدراج  |   دوّن الإدراج  

تعليق واحد على “التجربة الأولى: قياس مقارن للتغطية في محرك البحث "عربي"”

  1. لقد قرأت تعليقكم مع اني لا اؤيد ما جاء فيه فانا طبعا أعرف الفرق بين

    crawling and indexing

    ولكن في بعض الاحيان يجب عليك مخاطبة المستمعين حسب اختصاصاتهم فنبسط الامور للمستخدم العادي ولا نقحمه في تفاصيل هو في غنى عنها.

    أما الادلة فانا عند رأي وهيي فهي ليست محركات بحث حسب تصنيفي ولا تستطيع مجاراة ازدياد محتوى الانترنت وفهرسته بشكل مستمر والدليل تحول ياهوو من دليل الى محرك بحث.

    أما من حيث قدرات المحرك اللغوية فلم يكن قياسكم كاملا

    . أحد الامثلة البسيطة: قم بتجربة البحث في غوغل عن كلمة “الاردن” ومن ثم كلمة “الأردن” وسترى الاختلاف في عدد النتائج أما عربي فيعتبرها كلمة واحدة.

    أما من حيث قياس التغطية فنحن قلنا أن المحرك في نسخة بيتا فيرجى منك اعادة القياس والتقييم كل فترة من الزمن.

    شكرا مرة أخرى وصدرنا رحب ونقبل كل الانتقادات البنائة



اكتب تعليــقك
الإسم الذي سيظهر على التعليق
مشتركي مكتوب
اسم آخر