جامعاتنا العربية وأدوات البحث العربية: ملاحظة حول دور مفقود وأمل غير معقود

كتبها هشام طليب ، في 14 ديسمبر 2007 الساعة: 05:25 ص

      في قراءاتي ومتابعاتي حول أدوات البحث لاحظت ارتباط اسم أكثر من محرك بحث بجامعة ما، حيث الارتباط بين ظهور ونشأة كثير من أدوات البحث في العالم الغربي بالمؤسسات الجامعية في المجتمعات الغربية، بغض النظر عن التخصصات العلمية التي ينتمي إليها القائمون على هذه الأدوات وهم في أغلب الأحوال من المتخصصين في علوم الحاسب. وتمثلت بذرة هذه الملاحظة في محركي البحث الشهيرين (ياهوYahoo) و(جوجول Google) حيث كانت بدايتهما ثمرة جهد داخل مؤسسة جامعية، حيث كان الأول ثمرة جهد طالبي دكتوراة في جامعة ستانفورد في الولايات المتحدة الأمريكية لتنظيم مصادر المعلومات المتاحة على الإنترنت وذلك للاستخدام داخل الحرم الجامعي. وكان الثاني نتاج جهد علمي في إطار مشروع بحثي لاثنين من طلبة الدكتوراة في الجامعة نفسها. ووجدت أن هذه الظاهرة لم تقتصر على الولايات المتحدة الأمريكية فقط بل تحققت في أوروبا أيضاً. 

     ويستعرض الجدول التالي بعضاً من هذه الأدوات والمؤسسات الجامعية التي ولدت فيها وخرجت منها، حيث يرصد 11 أداة بحث وارتباطها بتسع جامعات في ثلاث دول هي الولايات المتحدة الأمريكية واسكتلندا والبرتغال، وتجدر الإشارة إلى أن بعض هذه الأدوات ليس له وجود فعلي الآن.

     وبإلقاء نظرة سريعة على الخط الزمني الممثل في هذا الجدول، الذي يمتد من 1994 إلى 2001 وبالتأكيد هناك جهود سبقت هذا التاريخ وأخرى تأتي بعده. تشير هذه النظرة إلى امتداد الخط الزمني، وعلى طول هذا الامتداد يتكرر ظهور الجهود المرتبطة بأدوات البحث من داخل المؤسسات الجامعية بما ينفي بقدر معقول أن هذا الارتباط من قبيل الحوادث العارضة، بل هو نتاج بيئة ما ( بيئة بحث تخدم مجتمعاً؛ في اتصال بين مجتمع علمي أصغر ومجتمع أكبر يضمه ويحتويه، ويوفر له سبل النمو وينتظر منه ما يثري المجتمع الأكبر). ومما يشير إلى تأكيد ذلك أيضاً أن هذه الجهود تتكرر على مستوى الجامعة الواحدة (مثل جامعتي ستانفورد وواشنطون).

     ويبدو أن هذه الجملة " ارتباط مؤسسات جامعية بأدوات بحث" تشير إلى عدد آخر من الارتباطات ساعدت على ظهور هذا الارتباط محور حديثنا. وهذه الارتباطات الأخرى غير منفصلة، بل هي متصلة ومتداخلة، تظهر في وجودها المستقل كما تظهر في وجودها المتداخل. ويمكن توضيح بعض هذه الارتباطات على النحو التالي:

1- ارتباط مجتمعي:

من حيث ارتباط الوحدات المكونة للمجتمع لتحقيق أهداف مجتمعية متفق عليها لصالح ارتقاء كامل المجتمع من أفراد ومؤسسات على ا

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

عام قد مضى …

كتبها هشام طليب ، في 26 أكتوبر 2007 الساعة: 08:30 ص

اليوم يكون قد مر عام على هذه المدونة … كل عام وأنتم جميعاً بخير

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

وتبقى دائرة التواصل مفتوحة: ثلاثة ردود أخيرة

كتبها هشام طليب ، في 7 مارس 2007 الساعة: 00:01 ص

استكمل معكم في هذه التدوينة تدوينة "في دائرة التواصل" السابقة .. وإلى بقية الردود …

ثانياً: الأستاذ أحمد ناجح :

قد وضع تعليقاً على تدوينة محرك البحث "عربي": القول والقول المردود (أولاً)

      أستاذ أحمد، في تصوري الشخصي أن محركات البحث العربية ليست في بداية خطواتها، أو المفترض أنها لا تكون كذلك الآن، ففترة زمنية تقترب من عشر سنوات في هذا المجال ليست مرحلة بدايات، ولكن أتفق معك أنها في طور النمو بطبيعة الحال. أعاقها الكثير عن أن تخرج من منطقة البدايات، ومن هذه المعوقات ما تشترك فيه مع أدوات البحث عالمياً ومنها ما تنفرد به .

      أما الاهتمام الذي تناله أدوات البحث وتطويرها فهو أمر طبيعي مثله مثل الاهتمام بالأدوات الببليوجرافية الأخرى فكل هذه الأدوات بما فيها أدوات البحث تقع في إطار الضبط الببليوجرافي لمصادر المعلومات أياً كان نوعها أو شكلها، فلنأمل فقط أن يكون اهتماماً حقيقياً وسليماً في منطلقه واتجاهه وهدفه وفي تفاصيله حتى نضمن سلامة وصوله إلى مبتغاه .

      وتجدر الإشارة هنا إلى  عزوف الواقع العربي في أغلبه عن إنتاج أعمال ببليوجرافية أصيلة تسد العجز الملحوظ، ويرجع ذلك العزوف لأسباب عديدة تؤدي إما إلى عزوف تام عن الإنتاج  أو الإنتاج بمعايير الاتباع لا الابداع ، وبأساليب لا تراعي المستقر من علوم وممارسات، أو ما هو مفترض من مستويات الكفاءة المفترض توافرها، وقد ينطبق ذلك على الأعمال الببليو

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

في دائرة التواصل: اعتذار وشكر، وردود متأخرة

كتبها هشام طليب ، في 6 مارس 2007 الساعة: 11:55 ص

     أعلم أني لم أكتب منذ فترة في مدونة أدوات البحث، وقد ذكرت في أول تدوينة فيها لمن يتذكرها ممن فيكم يتابع هذه المدونة أني لا أعرف دورية ما للكتابة فيها وسأكتب فيها وفقا لما يسمح به الوقت، انشغلت كثيراً في الفترة السابقة وسيستمر ذلك لفترة قادمة، بدون الدخول في تفاصيل قد لا تهمكم بالطبع، أقدم اعتذاراً لقارئ هذه المدونة – إن كان لها قارئاً منتظراً لما يسجل فيها-  عن انقطاعي الفترة السابقة، وعن أي انقطاع محتمل في الفترة القادمة، وسأستغل أي فترة يسمح لي فيها بالكتابة أن أكتب قدر الإمكان.

 

     كل الشكر مقدم لكل من تفاعل مع المدونة بالتعليق فيها، أو إرسال رسائل إلكترونية بشأنها و بشأن ما يرد فيها، وأرجو أن يعتبر كل من تفاعل معها أن هذا الشكر هو شكر شخصي له أو لها.

 

     كل الشكر مقدم أيضاً لمن اقتبس عن المدونة وراعى التقاليد العلمية في الاستشهاد والإشارة إلى المصدر، وأخص الأستاذ محمود قطر بشكر خاص في هذا الصدد.

 

     وشكر خاص لمجموعة مكتوب صاحبة محرك البحث "عربي" الذي تناولته في بعض تدوينات هذه المدونة، على موقفهم الإيجابي المتحضر ومبادرتهم بالاتصال ومناقشة ماورد فيما يخص محركهم، وأخص بالشكر الأستاذ عصام بايزيدي رئيس إدارة تطوير المنتجات بالمجموعة ومدير محرك البحث عربي.

     لى بعض الردود على بعض التعليقات التي وردت من قراء المدونة، وليس الغرض بالطبع أن ندخل دوائر مفرغة من الرد والرد المضاد، ولكن الردود هنا تأتي مناسبة جيدة لتوضيح بعض الأمور التي قد لا أفرد لها تدوينات مستقلة ، وتعد منطلقات للحديث عن مواضيع ذات علاقة :

أولاً : الأستاذ سميح طوقان

1- قد ذكرتم أنكم لا تؤيدون ما جاء في تعليقي وإن كنتم تحديداً لم تذكروا أي جانب منه لا تؤيدونه، فقد وضعتم تعليقكم على التدوينة التي ضمت تجربة علمية لقياس تغطية محرك البحث "عربي"، يخرج التعليق عليها عن مجرد التأييد أو عدم التأييد، ويمكن أن ينتقل لمناطق أخرى كالخطأ في تخطبط التجربة، أو عدم السلامة في تنفيذها، أو ما قد يشوبها من خلط منطقي إن وجد، أو عدم صحة في المنهج المتبع، إلى غير ذلك من الأمور. على أية حال أعلم أن تعليقي إجمالاً قد تضمن الكثير مما أراه قد يشوب محرككم، والجدير بالذكر أنه ليس محرككم فقط  بل أغلب أدوات البحث عربياً وعالمياً التي مازال أمامها الكثير لتنجزه.

2- أما فيما يخص الأدلة، فقد أكدتم أنكم عند رأيكم أنها ليست محركات بحث وأنها لا تستطيع مجاراة ازدياد المواقع على الإنترنت، وفي الأولى أنا معكم فالأدلة ليست محركات بحث search engines  إنما هي أدوات بحث search tools ومحركات البحث أيضاً هي أدوات بحث، فأدوات البحث هي الفئة الأعم ويندرج تحتها الفئات الأخرى وقد توجد أداة تضم الدليل والمحرك معاً أي أداة مختلطة أو هجينة hybrid مثل ياهوو ، أما فيما يخص الدليل الذي ذكرته وهو تحول ياهو من دليل إلى محرك بحث؛ فعليه أقوال كثيرة منها التاريخي ذو العلاقة بتطور ياهو نفسه، ومنها الفني المتعلق ببنائه، ومنها ماهو متعلق بمكتوب نفسها أليست مكتوب نفسها هي التي أصدرت دليل المواقع daleel.maktoob.com ؟!

3- أما فيما يخص عدم قدرة الأدلة على مجاراة الازدياد في المواقع لقد ناقشت ذلك سريعاً في تدوينة سابقة، وبعيداً عن اختلاف مستويات المعالجة الوعائية، واختلاف التخصص في التغطية بينهما ، فإن هذا الأمر مرتبط بأكثر من عنصر:

1- طبيعة الحاجة إلى المعلومات Information Need Nature

 يتوقف ذلك

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

"أنا أشرب الكوكاكولا، هي المشروب الأكثر مبيعاً في العالم، ولا أعرف إن كانت الأهم، ولكني أشربها"

كتبها هشام طليب ، في 9 فبراير 2007 الساعة: 13:31 م

      قد يرى البعض أن ليس في هذه الجملة التي تشغل عنوان هذه التدوينة أية علاقة بأدوات البحث، ولكنها –عجباً-  دفعتني دفعاً لقطع صمت الكتابة في هذه المدونة طوال الفترة السابقة، فما أن قرأتها حتى أصابتني هذه الحالة المحببة لكثير ممن "يقترفون" فعل القراءة. عندما تقف مشدوهاً لبرهة وتتوقف عن القراءة في موضع محدد من النص الذي تقرأه أياً كان، وتشرد قليلاً برأسك وتنطلق حالة ذهنية من التأمل والتداعي ومحاولات الربط بين المقروء وبين سابقات الحياة والقراءة، ثم تعود مرة أخرى إلى النص المقروء.

 

      منذ ما يقل عن الساعة كنت أقرأ صحيفة أخبار الأدب القاهرية، وشُددت إلى حوار فيها مع الروائي الإيطالي "أنطونيو تابوكي" وإن كنت لا أعرف عنه الكثير، وكنت مستمراً في القراءة حتى توقفت عند رده على سؤال عن أحد الروائيين الإيطاليين وإن كان يراه الأهم؟، فكان رده قائلاً "أنا أشرب الكوكاكولا، هي المشروب الأكثر مبيعاً في العالم، ولا أعرف إن كانت الأهم، ولكني أشربها" ويعني بها أن هذا الروائي "يبيع كثيراً لكننا لسنا متأكدين من القيمة".

 

      أليس جوجول يبيع كثيراً ولكننا لسنا متأكدين من القيمة؟!، أليس ياهو يبيع كثيراً ولكننا لسنا متأكدين من القيمة؟!، أليس بحث  الإم إس إنMSN search  يبيع كثيراً ولكننا لسنا متأكدين من القيمة؟!، نعم هو مبدأ هام جداً في سياق أدوات البحث. أن ننظر في القيمة الحقيقية لأدوات البحث وليس في قدر رواجها والشائع عنها الذي قد تتدخل في تشكيله عوامل أخرى غير القيمة الحقيقية ويتم تناقله كمسلمات لا يمكن الاقتراب منها. وفي هذا الأمر أي القيمة الحقيقية لأدوات البحث على الإنترنت كأدوات للاسترجاع في البيئة الإلكترونية تتساوى الأدوات العربية والعالمية في أن هذه القيمة الحقيقية وشكل أداء الأدوات لدورها المفترض يشوبه الكثير. يرتبط ذلك بالنظرة العامة "الأسطورية" وغير الموضوعية في النظر إلى الإنترنت عموم

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

جوجول الشرق الأوسط: نظرة أخرى

كتبها هشام طليب ، في 3 نوفمبر 2006 الساعة: 13:32 م

     جوجول هنا ؟! نعم سيتواجد جوجول في المنطقة من خلال مكتب إقليمي اختير له أن يكون في القاهرة، هلل لذلك البعض على اعتبار أنهم اختاروا القاهرة لهذا المكتب وليس دبي (ولجوجول أسبابه في هذا الاختيار)، وهلل لذلك البعض على اعتبار أن مجرد تواجد هذا المكتب سيغير شكل التواجد الإلكتروني في المنطقة ويدفعه دفعاً إلى الأمام (خاصة أن الأخبار المتناثرة تشير إلى أن جوجول سيفتتح مكتبين آخرين في الوطن العربي أحدهما في المغرب والآخر في الإمارات، ويدعم هذه الأخبار الوظائف المعلن عنها في جوجول حاجته لـ  Country Consultantفي البلدين)، ولكن دعونا ننظر للأمر نظرة أخرى بعيداً عن هذه التهليلات (خاصة فيما يخص أداة البحث بعيداً عن منتجات جوجول الأخرى) …

أولاً: في البداية لابد أن أسجل تحفظاً شخصياً حول الاسم الرسمي لمكتب جوجول في القاهرة وهو:

Google Regional Office For Middle East And North Africa (MENA)

مكتب جوجول الإقليمي للشرق الأوسط وشمال أفريقيا

وفي حقيقة الأمر هو مصطلح أصبح شائعاً إلى حد كبير (الشرق الأوسط وشمال أفريقيا)، ويستخدم غالباً عند الإشارة إلى الوطن العربي Arab World، وهي لعبة غير بريئة على اللغة في نظري، وربما قد يكون جوجول استخدمها عن حسن نية أو العكس، على أية حال من قام بذلك في الأصل يدرك تماماً تأثير (الاستخدام اللغوي الموجه) في الأذهان على المدى الطويل، فهو استخدام لفظي على أساس التقسيم الجغرافي، مثله في ذلك مثل التعبير الذي تستخدمه بعض الجهات الأخرى وهو الدول الناطقة بالعربية Arabic-Speaking Countries وهو استخدام آخر في نفس الفكرة، فلماذا لا يستخدم التعبير (الوطن العربي)؟!، الفكرة تنحصر في الدلالات الذهنية والنفسية التي يعكسها كل مصطلح؛ فالمصطلحات الأولي لها دلالاتها التفريقية والتقسيمية وتسرب فكرة الفصل بشكل غير محسوس، بينما مصطلح الوطن العربي أو العالم العربي له دلالاته التجميعية لا التفريقية ويكرس فكرة الانتماء لمجتمع واحد وثقافة واحدة (في أطرها العامة). فلماذا لانقول جوجول الوطن العربي أو العالم العربي بدلاً من هذه الاستخدامات اللغوية غير المريحة ( على الأقل بالنسبة لي).

ثانياً: ما لا يعلمه الكثيرون أن جوجول له مكتب بالفعل في المنطقة حتى قبل افتتاح مكتب القاهرة، وهو موجود في فلسطين المحتلة أو ما يسمى [إسرائيل](سأستخدم هذه اللفظة المتأخرة في هذه التدوينة متعمداً نقل كل الدلالات البغيضة المرتبطة بها إلى أذهانكم ونفوسكم وأنتم تقرأون هذه التدوينة)، وليس مكتباً واحداً بل يملك هناك مكتبين في كل من [تل أبيب] و[حيفا]، وتشير الأخبار أن جوجول افتتح هناك معملاً للبحث والتطوير R & D Lab يعمل على تطوير المنتج لخدمة الاسترجاع باللغة العبرية أساساً في محرك جوجول العام، ومحرك جوجول [إسرائيل] ( يمكنك الإطلاع على هذا المحرك على العنوان الإلكتروني التالي www.google.co.il )

ثالثاً: ما لا يعلمه الكثيرون أيضاً أن جوجول متواجد في الوطن العربي من خلال محركات بحث قطرية لكل دولة على حدة حتى قبل افتتاحه لمكتب في المنطقة، فهو له 11 محركاً في 11 دولة عربية حتى الآن، هذه المحركات كالتالي (بغض النظر عن طبيعة تواجدها وطبيعة الأداء في هذه المحركات والاختلاف بينها وبين المحرك الأصلي جوجول فهذا يحتاج نظرة أكثر عمقاً وتحليلا

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

التجربة الثانية: قياس مقارن لدقة الاسترجاع في محرك البحث "عربي" (قياس التحقق)

كتبها هشام طليب ، في 30 أكتوبر 2006 الساعة: 13:29 م

أولاً: مقدمة:

      يعد قياس التحقق Precision من أهم الأساليب لتقييم كفاءة أداء الاسترجاع في نظم استرجاع المعلومات ومنها بالطبع أدوات البحث، وغالباً ما يلازمه الاستدعاء Recall في قياس كفاءة الأداء:

الاستدعاء هو نسبة عدد الوثائق ذات العلاقة بموضوع البحث التي يسترجعها النظام إلى إجمالي الوثائق الصالحة أو ذات العلاقة في قاعدة بيانات النظام، وهو يقيس قدرة النظام على الاسترجاع .

- التحقق هو نسبة عدد الوثائق الصالحة أو ذات العلاقة بموضوع البحث إلى إجمالي الوثائق المسترجعة، وهو يقيس دقة النظام في الاسترجاع.

 

     ويشير Michael Buckland و Fredric Gey إلى الاستدعاء بأنه "اكتمال الاسترجاع" Completeness of Retrieval بينما يشيرا إلى التحقق بأنه "نقاء الاسترجاع" Purity of Retrieval (في مقالتهما:

The Relationship between Recall and Precision . Journal of American Society for Information Science. Vol. 45, No 1 (1994) , pp 12-19 . p 12 )

     ومن الجدير بالذكر الإشارة إلى أن قدرة أي نظام على ضمIncluding  المصادر ذات العلاقة أو الصالحة لموضوع البحث في قاعدة بياناته  إلى الوثائق المسترجعة، وفصل Excluding المصادر غير الصالحة وغير ذات العلاقة بموضوع البحث عن الوثائق المسترجعة تؤثر على معدلات الاستدعاء والتحقق.

     ويحتاج كلاهما إلى نسق ما لتحديد كيفية الحكم على المصادر بصلاحيتها أو عدم صلاحيتها، كما أن الاستدعاء يتطلب معرفة إجمالي عدد الوثائق/المصادر الصالحة في قاعدة بيانات الأداة، ولهذا سيتم قياس التحقق هنا.

 

ثانياً: التجربة:

1- غرض التجربة:

قياس التحقق أو دقة نظام الاسترجاع

 

2- الأدوات الخاضعة للتجربة:

محركا البحث "عربي" و "جوجول"

 

3- توقيت إجراء التجربة:

يوم الأحد الموافق 29 أكتوبر 2006 ، من 11 صباحاً حتى 12.15 ظهراً

 

4- استراتيجية البحث:

      تم استخدام استراتيجية بحث ( للسفر والسياحة ) مصاغة بشكل يماثل صياغة المصطلحات في الأوعية الموجودة على الإنترنت، لأن الاسترجاع يتم بالكلمات المفتاحية في بيئة حرة غير مضبوطة فهذا يلقي بعبء أكبر على المستفيد لتوقع كيف يمكن أن تكون استراتيجية البحث الناجحة وكلما كانت أقرب للاستخدام الطبيعي ومراعاة الاستخدامات اللغوية المختلفة في النطاق الموضوعي المبحوث فيه كلما كانت النتائج أفضل. (بإمكانك أن تجرب مثلاً البحث بالاستراتيجية التالية (شركة سياحة) ستجد أن مواقع شركات السياحة المسترجعة تكاد تكون منعدمة في أول 100 نتيجة وذلك في جوجول وعربي)

 

5- وصف التجربة:

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

التجربة الأولى: قياس مقارن للتغطية في محرك البحث "عربي"

كتبها هشام طليب ، في 30 أكتوبر 2006 الساعة: 08:10 ص

أولاً: مقدمة:

     يعد قياس التغطية Coverage من عناصر تقييم أدوات البحث، وتعني التغطية إجمالي الوثائق أو المصادر التي تضمها قاعدة البيانات الخاصة بأداة البحث، أي مجتمع الوثائق أو الأوعية التي تضمها الأداة وغالباً لا تكون مساوية لحجم المصادر المتاح عموماً على الإنترنت.

* عند تقدير التغطية يمكن النظر إليها من زاويتين:

1- نسبة تغطية الأداة إلى إجمالي حجم المصادر المتوافرة على الإنترنت.

2- نسبة تغطية الأداة إلى إجمالي تغطية أدوات البحث الأخرى (منفردة أو مجتمعة)

* ويمكن لحجم التغطية المراد قياسه أن يكون:

1- كلياً: أي إجمالي حجم تغطية الأداة.

2- جزئياً: أي جزء محدد من حجم تغطية الأداة (كقياس تغطية الأداة لمواقع دور النشر العربية مثلاً)

* ويمكن قياس التغطية بأكثر من أسلوب:

1- قياس منفرد للتغطية الخاصة بأداة بعينها

2- قياس مقارن للتغطية وفقاً لتغطية أدوات أخرى، وقد يكون :

     - ثنائي: أداة / أداة

     - متعدد: أداة / أدوات

3- قياس مقارن للتغطية وفقاً لقائمة ببليوجرافية قياسية

( أي قياس تغطية أداة ما اعتماداً على تجميع ببليوجرافي يعد تمثيلاً لما هو منشور ومتوافر بالفعل على الإنترنت وليس فقط ما تضمه أدوات البحث، وهو مثل تقييم مجموعات أو مقتنيات المكتبات اعتماداً على القوائم الببليوجرافية )

 

ثانياً: التجربة:

     سيتم استخدام أسلوب قياس مقارن مزدوج، بمعنى أنه سيتم استخدام أسلوبين معاً في قياس التغطية، ألا وهما (قياس مقارن وفقاً لتغطية أدوات أخرى، وسأستخدمه في صورته الثنائية أداة / أداة ) و(قياس مقارن وفقاً لقائمة ببليوجرافية قياسية)، وسيتم القياس جزئياً في حجم التغطية، وسيتم اتخاذ جوجول هو الأداة الأخرى (السبب الرئيسي لهذا الاختيار هو الحديث الدائر في بعض ما نشر عن محرك البحث "عربي" حول احتمالات منافسته لجوجول).

 

1- غرض التجربة:

 قياس تغطية أداة البحث "عربي" من إجمالي مصادر المعلومات المتاحة على الإنترنت

 

2- الأدوات الخاضعة للتجربة:

محرك بحث " عربي"، ومحرك بحث " جوجول"

 

3- توقيت إجراء التجربة:

يوم السبت الموافق 28 أكتوبر 2006، بداية من 12.17 ظهراً حتى 2.45 ظهراً

 

4- استراتيجية البحث:

     تم البحث بالعناوين الإلكترونية للمواقع التي يراد اختبار توافرها في قاعدتي بيانات الأداتين، وذلك بعد اختبار أداتي البحث من حيث الصياغة الأصح التي تعتمدها الأداة في البحث بالعنوان الإلكتروني، وتم الاتفاق على استخدام العنوان باسم النطاق الأساسي في البحث بدون البروتوكول أي كالمثال التالي www.oscartours.com ، وقد تم اختيار البحث بالعنوان الإلكتروني لأنه عنصر متفرد Unique لكل موقع، ولا يتأثر البحث بواسطته باحتمالات مختلفة في بناء الأداة تؤثر على البحث ، ويتوافق ذلك مع غرض التجربة لمعرفة توافر أو عدم توافر موقع بعينه في قاعدة بيانات الأداة.

 

5- وصف التجربة:

     تم اختيار مجال موضوعي بعينه لقياس تغطية الأداة لمصادره وهو السفر والسياحة (تم اختيار هذا الموضوع لأنه يتوافر لي إتاحة ما لعدد من التجميعات الببلوجرافية الخاصة بهذا الموضوع يمكن اتخاذها أساساً للقياس عليها، وقد تم اختيار القائمة الخاصة بمواقع شركات السياحة المصرية وهي تضم أكثر من 400 موقع، حيث تم اختيار آخر 100 موقع أضيفت للقائمة ليتم قياس توافرهم في قاعدتي الأداتين محل الدراسة، وقبل تنفيذ القياس الفردي لكل موقع في الأداتين تم التأكد من أن كل موقع هو موقع نشط وغير متوقف لأي سبب من الأسباب. وكان القياس يعتمد على أن تظهر تسجيلة مستقلة للموقع في النتائج بغض النظر عن ترتيبها في النتائج  أو كونها صفحة رئيسية أو فرعية ( لأن الغ

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

محرك البحث "عربي": القول والقول المردود (ثانيا ً)

كتبها هشام طليب ، في 29 أكتوبر 2006 الساعة: 03:51 ص

ثانياً: تعليق على الآراء الواردة في نقاش حول " عربي" على إحدى المدونات

( يجب الإشارة في البدء أن المدونة التي ورد عليها هذا النقاش هي المدونة الخاصة بالأستاذ سميح طوقان الرئيس التنفيذي لمجموعة مكتوب، وشاركه من مسئولي مكتوب أحد الأشخاص تحت اسم "عصام" وأغلب الظن أنه الأستاذ عصام بايزيدي رئيس قسم تطوير المنتجات بمكتوب، ويمكن الوصول إلى المدونة من خلال الرابط التالي samih.maktoobblog.com ، وسيكون تعليقي على ما ورد بها حتى يوم 19 سبتمبر/ أيلول 2006 الساعة 12.10 مساء وهو توقيت آخر تعليق تم إرساله في المدى الزمني الذي أعلق عليه )

 

   :أ- تعليقات عامة 

1- "هذا يوم مهم في تاريخ الإنترنت العربية"

( ذكر ذلك الأستاذ سميح في سياق تأكيده على أهمية وجود محرك بحث عربي )

بالفعل هو كذلك أو بالأحرى سيكون كذلك عندما يوجد محرك البحث العربي الحقيقي الفعال الذي يقوم بدوره على الوجه الأمثل، وتكون سلبياته أقل من إيجابياته، ولكن التساؤل أين نحن الآن من ذلك؟!

2- أتفق تماماً مع الأستاذ سميح أن وجود أداة بحث عربية فعالة هو مشروع وطني حقاً، و يخدم المجتمع العربي والثقافة العربية والمواطنين العرب على اختلاف احتياجاتهم المعلوماتية في أنحاء وطننا العربي.

3- وأؤكد على أنه لابد من التفريق بين من يحبط العزائم وبين من يفيد في إنارة الطريق وتصحيح الأوضاع.

4- وأؤكد أيضاً أنه ليس مما يعيب الإنسان وطنيته أبداً، ولكن العيب في اختلال القيم الذي أصبح فيه من يلفظ كلمة الوطن والوطنية قبلة للتهكم والمتهكمين.

 

ب- تعليقات في قلب الموضوع:

 1- "إذا كانت محركات البحث موجودة دلنا على واحد منها؟؟؟؟"

رد بذلك الأستاذ سميح على الأستاذ قويدر عندما قال له "أنا لا أعلم ما الجديد في الموضوع …لكن ومنذ 1996 ومحركات البحث العربية موجودة" أحيلك إلى تدوينة سابقة بها ذكر لعدد من محركات البحث فقط وردوا كمثال، وإذا كانت حجتك أنهم ليسوا محركات بل أدلة وأنهم يفهرسون المواقع ككل وليس الصفحات كما رددت في مدونتك : "أنت تتكلم على مواقع عبارة عن أدلة تسمي نفسها محركات بحث وهي عبارة عن قاعدة بيانات لأسماء المواقع" و " أن محرك البحث مشروع ضخم يفهرس عشرات الملايين من الصفحات"، عذراً أستاذ سميح فالكثير من الأدوات المذكورة في التدوينة التي أشرت إليك بالرجوع إليها ليس بها أي أدلة إطلاقاً (هذه واحدة)، وأيضاً تفهرس صفحات المواقع (هذه واحدة أخرى) مثل محركي أجوب و أمامك (وليلقي القارئ نظرة عليهما ويحكم بنفسه إذا ما كان هذين العنصرين متوافرين أم لا؟). وبما أني أكتب في سياق متخصص هنا فيجب أن أشير إلى تصويب مصطلح معين؛ هي عناوين المواقعTitles وليس "أسماء المواقع". وكما قلت لواحد من محدثيك في هذا النقاش "معلوماتك في الموضوع تحناج إلى توضيح" دعني أقول لك إن معلوماتك في الموضوع تحتاج إلى توضيح أيضاً، واسمح لي أن أوضح لك لماذا:

أولاً: الدليل ومحرك البحث فئتان أساسيتان من فئات أدوات البحث، كل من هما له دوره و أهميته ووظيفته، لا يغني أحدهما عن الآخر، فالذي يحكم التفضيل بينهما هي عوامل مرتبطة بحاجة المستفيد أو المستخدم وطبيعتها وطبيعة المجال الموضوعي المرتبطة به وغير ذلك من الأمور (وأعتقد أنه ستكون هناك تدوينة لاحقة عن عناصر البناء الفارقة بينهما والخصائص المميزة لكل منهما)

ثانياً: يحتوي مفهومك عن محركات البحث على لبس وخلط، فظنك أن محركات البحث هي تلك أدوات البحث التي تفهرس صفحات المواقع فقط هو أمرغير صحيح، وللعلم هناك دراسات تقيم أداء محركات البحث من حيث درجة استرجاعها للصفحات الرئيسية فقط للمواقع ( أي الموقع ككل وليس صفحات) مثل الدراسة

Which search Engine is best at finding airline site home pages?

http://research.microsoft.com/users/nickcr/pubs/craswell_tr01.pdf

(هذه الدراسة مجرد مثال فقط قريب من ذهني)، وربما يكون هذا اللبس نتيجة وسبب في نفس الوقت، وفي الحالتين هو نتيجة لإغفال أمور منطقية مبدئية وسبب لإغفال نفس الأمور أيضاً، ما هي هذه الأمور إذن؟، دعني أستعرضها لك:

- مستويات التحليل في المعالجة؛  فهناك المستوى الكلي Macro  والمستوى الجزئي Micro أو التحليلي Analytical ، فهناك الموقع كوحدة كلية وهناك صفحة الموقع كوحدة تحليلية (وتضم محركات البحث الإثنين معا

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

محرك البحث “عربي”: القول والقول المردود (أولاً)

كتبها هشام طليب ، في 28 أكتوبر 2006 الساعة: 21:26 م

     كان هذا المحرك هو موضوع الرسالة التي أرسلها زميل إلى منتدى موقع قسم المكتبات والوثائق والمعلومات بجامعة القاهرة، وكانت الرسالة واحدة من الخبطات الثلاثة التي ذكرتها في التدوينة الأولى في هذه المدونة، وقد ذكر الزميل نص الخبر وعلق عليه كالتالي “وهو محرك بحث جيد وذلك عن تجربة لهذا المحرك”، ويا زميلي العزيز أرجو أن تقرأ ما سأعلق به على هذا الأمر هنا وتتفاعل معه، ولا أنسى أن أشكرك رغم أني لا أعرف من أنت، فقد كنت مع زميلنا الآخر في حلوان من أسباب دفعي لكتابة هذه المدونة كما ذكرت سلفاً …

أولاً: تعليق على الخبر الخاص بانطلاق المحرك الذي نشر في 14 سبتمبر 2006 على أخبار مكتوب

1- أول وأقوى محرك بحث عربي على شبكة الإنترنت يستخدم قواعد اللغة العربية في عمليات ونتائج البحث

 

- بالنسبة لموضوع أول هذه لقد تحدثت فيها في المدونتين السابقتين.

- ولكنه هنا جاء بصفة جديدة وهي “أقوى” وينطبق عليها أيضاً كثيراً مما قلته سلفاً.

- لكن الجديد الأهم هنا هو ربطه بقيمة موضوعية ( الأول الذي يفعل كذا ) وهي هنا “يستخدم قواعد اللغة العربية”، ولهذا الأمر ثلاثة أبعاد :

أولهم: هل هو الأول بالفعل الذي يقوم بذلك أي استخدام قواعد اللغة العربية ومراعاة خصائصها في عملية الاسترجاع؟! أشك في ذلك، لماذا؟، سأضرب مثالاً واحداً جاء بذهني يجعلني أشك في العبارة ألا وهو محرك البحث الهدهد فنظرة سريعة إلى صفحة(البحث التفصيلي) وصفحة (عن الهدهد) تؤكد أنه يستخدم ( أو كان يستخدم ) قواعد اللغة العربية، وهذا المحرك قد ظهر في عام 2004، وهناك غيره من قام بذلك أيضاً في السنوات السابقة.

ثانيهم: إن بناء أداة بحث عربية على الإنترنت لا تقوم فقط على معالجة اللغة العربية آلياً ومدى توافر ذلك في الأداة، فهذا هو مجرد جانب واحد فقط ( بتفاصيله المتعددة ) من جوانب وعناصر بناء أداة البحث كنظام استرجاع للمعلومات، ولعلي لا أكون متجاوزاً إن قلت أنه ليس هو الجانب الأهم، قد تتسا

المزيد

أضف الى مفضلتك
  • del.icio.us
  • Digg
  • Facebook
  • Google
  • LinkedIn
  • Live
  • MySpace
  • StumbleUpon
  • Technorati
  • TwitThis
  • YahooMyWeb

التالي