تعتبر Google شمولية نتائج بحثنا أولوية ذات أهمية قصوى. نحن ملتزمون بتقديم نتائج بحث كاملة وموضوعية لمستخدمينا؛ وعليه، فنحن لا نستطيع أن نشارك في ممارسة الرقابة. نقوم فقط بإيقاف فهرسة موقع ما عندما يطلب مشرف الموقع المسؤول عن تلك الصفحات ذلك، وعندما تقوم تلك الصفحات بإرسال رسائل بريد مزعجة لفهرسنا، أو عندما يكون ذلك مطلوبًا من قِبل القانون. فهذه السياسة تكون ضرورية للتأكد من أن تلك الصفحات لم يتم إزالتها على نحو غير ملائم من فهرسنا.
| خيارات الإزالة |
الرجاء اختيار احد الخيارات الموجودة أدناه للحصول على التعليمات. سوف تصبح أوامر الإزالة نافذة المفعول في المرة القادمة عندما يقوم Google بالزحف إلى موقعك.
- إزالة موقعك بالكامل
- إزالة جزء من موقعك
- إزالة القصاصات
- إزالة صفحات مخبأة
- إزالة وصلة غير مُحدثة ("قديمة")
- إزالة صورة من صور بحث Google
| إزالة موقعك بالكامل |
إذا كنت ترغب في استبعاد موقعك بالكامل من فهرس Google، يمكنك وضع ملف في المجلد الرئيسي لمركز الخدمة الخاص بك باسم robots.txt. فهذا هو البرتوكول القياسي الذي تلاحظه أغلب برامج الزاحف الخاصة بالويب من أجل استبعاد مركز خدمة ويب أو دليل ما من فهرس. المزيد من المعلومات حول robots.txt متاحة هنا: http://www.robotstxt.org/wc/norobots.html (وصلات لموقع إنجليزي). الرجاء ملاحظة أن برنامج الروبوت Googlebot لا يقوم بترجمة رد 401/403 ("محظور"/"ممنوع") لملف إحضار robots.txt وليس للزحف إلى أي صفحة على الموقع.
لإزالة موقعك من محركات البحث ومنع برامج الروبوت من الزحف إليه في المستقبل، قم بوضع الملف robots.txt التالي في المجلد الرئيسي لمركز الخدمة الخاص بك.
User-agent: *Disallow: /
لإزالة موقعك من Google فقط ومنع برنامج Googlebot من الزحف إلى موقعك، قم بوضع الملف robots.txt التالي في المجلد الرئيسي لمركز الخدمة الخاص بك.
User-agent: GooglebotDisallow: /
فكل منفذ يجب أن يكون لديه ملف robots.txt خاص به. وبوجه الخصوص، إذا قمت بتقديم محتوى من خلال كلا من بروتوكولات http وhttps، سوف تحتاج ملف robots.txt منفصل لكل من هذه البروتوكولات. على سبيل المثال، للسماح لبرنامج Googlebot بفهرسة جميع صفحات http وعدم فهرسة صفحات https، يجب استخدام ملفات robots.txt الموجودة أدناه.
لبروتوكول http الخاص بك (http://yourserver.com/robots.txt):
User-agent: *Allow: /
لبروتوكول https(https://yourserver.com/robots.txt):
User-agent: *Disallow: /
|
| إزالة جزء من موقعك |
الخيار الأول: Robots.txt
لإزالة أدلة أو صفحات فردية من موقع الويب الخاص بك، يمكنك وضع ملف robots.txt في المجلد الرئيسي لمركز الخدمة الخاص بك. لمزيد من المعلومات عن كيفية إنشاء ملف robots.txt، انظر بروتوكول استبعاد برنامج الروبوت (وصلات لموقع إنجليزي). عند إنشاء ملف robots.txt الخاص بك، الرجاء تذكُّر ما يلي: عند تقرير أية صفحات يتم الزحف إليها على مُضيف معين، سوف يتبع برنامج الروبوت Googlebot أول سجل في ملف robots.txt مع برنامج User-agent بادئ مع برنامج الروبوت "Googlebot." إذا لم يوجد مثل هذا القيد، فإنه سوف يقوم بإتباع القيد الأول مع وكيل مستخدم لـ "*". علاوة على ذلك، لقد قام Google بتقديم مرونة زائدة لملف robots.txt القياسي من خلال استخدام العلامات النجمية. قد يتضمن عدم السماح للنماذج "*" لمطابقة أي تسلسل من الحروف، وقد تنتهي النماذج بـ "$" لتشير إلى نهاية اسمًًا.
لإزالة كافة الصفحات تحت دليل معين (على سبيل المثال، lemurs)، يجب أن تستخدم قيد robots.txt التالي:
وكيل مستخدم: برنامج GooglebotDisallow: /lemurs
لإزالة كافة الملفات الخاصة بنوع ملف محدد (على سبيل المثال، .gif)، يجب أن تستخدم قيد robots.txt التالي:
User-agent: GooglebotDisallow: /*.gif$
لإزالة الصفحات المنشأة بطريقة ديناميكية، يجب أن تستخدم القيد robots.txt:
User-agent: GooglebotDisallow: /*?
الخيار الثاني: Meta tags
فهناك معيار أخر، والذي من الممكن أن يكون أكثر تلائمًا لاستخدام صفحة بصفحة، حيث يشتمل على إضافة <META> tag لصفحة HTML لإخبار برامج الروبوت بعدم فهرسة تلك الصفحة. يتم وصف هذا المعيار في http://www.robotstxt.org/wc/exclusion.html#meta (وصلات لموقع إنجليزي).
لمنع جميع برامج الروبوت من فهرسة صفحة على موقعك، يجب وضع العلامة الوصفية التالية في قسم <HEAD> الخاص بصفحتك:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
للسماح لبرامج الروبوت الأخرى بفهرسة الصفحة على موقعك، ومنع برامج الروبوت الخاصة بـ Google فقط من فهرسة الصفحة، يجب استخدام العلامة التالية:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
للسماح لبرامج الروبوت بفهرسة الصفحة على موقعك ولكن بعد توجيها بعدم تتبع الوصلات الصادرة، يجب استخدام العلامة التالية:
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
|
| إزالة القصاصات |
فالقصاصة هي عبارة عن نص مُقتبس يظهر أسفل عنوان صفحة في نتائج بحثنا ويقوم بوصف المحتوى الخاص بتلك الصفحة..
لمنع Google من عرض قصاصات لصفحتك، قم بوضع تلك العلامة في قسم <HEAD> الخاص بصفحتك:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
ملاحظة: تؤدي إزالة القصاصات أيضًا إلى إزالة الصفحات المخبأة.
|
| إزالة الصفحات المخبأة |
يقوم Google آليًا بأخذ لقطات مؤقتة من كل صفحة يقوم بالزحف إليها وحفظها في أرشيف. يسمح ذلك الإصدار "المخبأ" بجلب صفحة ويب لمستخدميك إذا كانت الصفحة الأصلية غير متاحة (بسبب فشل مؤقت في مركز خدمة صفحة الويب). يتم ظهور الصفحة المخبأة للمستخدمين تمامًا كما كانت تظهر عندما قام Google بالزحف آخر مرة إليها، ونقوم أيضًا بعرض رسالة في الجزء العلوي من الصفحة لتشير إلى أنها صفحة مخبأة. يمكن للمستخدمين الوصول إلى الإصدار المؤقت وذلك باختيار الوصلة "مخبأة" على صفحة نتائج البحث.
لمنع كافة محركات البحث من عرض وصلة "مخبأة" لموقعك، قم بوضع تلك العلامة في قسم <HEAD> الخاص بصفحتك::
