الأربعاء، 29 أغسطس 2012

كيفية عدم السماح Googlebot من الوصول إلى موقع الويب الخاص بك


غوغلبوت هو برنامج بوت البحث غوغل، التي تقوم بجمع الوثائق والمعلومات من صفحة ويب لبناء فهرس البحث لمحرك البحث جوجل. يكتشف Googlebot الصفحات عن طريق حصاد جميع الروابط على كل صفحة يجدها. ويترتب على هذه الروابط ثم إلى صفحات ويب أخرى. يجب أن تكون مرتبطة صفحات الويب الجديدة لصفحات أخرى على الويب المعروفة لكي يتم الزحف إليها وفهرستها أو المقدمة يدويا من قبل اصحاب المواقع.









وهي مشكلة أصحاب المواقع والمعنية في كثير من الأحيان مع برنامج Googlebot هو ذلك، فإنه يلتهم كمية هائلة من عرض النطاق الترددي. هذه المواقع السبب أن يتجاوز الحد الزمني الأقصى لعرض النطاق الترددي وأن يسحب مؤقتا. هذا مقلق جدا لمواقع المرآة التي تستضيف غيغا بايت من البيانات إذا كان اصحاب المواقع يرغبون في عدم السماح غوغلبوت لجمع المعلومات على موقعهم، فإنها يمكن أن تفعل ذلك مع التوجيهات المناسبة في ملف robots.txt، أو عن طريق إضافة الفوقية خاصة العلامة إلى صفحة ويب. يمكن إصلاح هذه المشكلة بطريقتين. يمكنك إصلاح من قبل أي ملف robots.txt أو علامة وصفية مناسبة لوجهة نظري أنه من الأفضل لاختيار علامة وصفية. فقط إضافة العلامة الوصفية التالية 
قبل 


before < / head >




<meta NAME="GOOGLEBOT" content="nofollow" />

ليست هناك تعليقات:

إرسال تعليق