اخبار

چگونه تعامل گوگل بات با وب سایت خود را کنترل کنیم

تیم روابط جستجوی Google در آخرین پادکست «Search Off The Record» اطلاعاتی در مورد کنترل تعاملات گوگل بات با صفحات وب ارائه می دهد.

  •   شما نمی توانید گوگل بات را از خزیدن بخش های خاصی از صفحه HTML مسدود کنید.
  •   استفاده از ویژگی data-nosnippet HTML یا iframe می‌تواند نحوه نمایش محتوا در قطعه‌های جستجو را کنترل کند.
  •   یک قانون غیر مجاز در robots.txt یا قوانین فایروال با استفاده از آدرس های IP Googlebot می تواند Googlebot را از یک سایت مسدود کند.

کنترل تعامل گوگل بات با وب سایت

Google’s Search Relations به چندین سوال در مورد نمایه سازی صفحات وب در آخرین قسمت پادکست “Search Off The Record” پاسخ داد.

موضوعات مورد بحث این بود که چگونه گوگل بات را از خزیدن در بخش‌های خاصی از صفحه مسدود کنیم و چگونه از دسترسی کامل Googlebot به یک سایت جلوگیری کنیم. جان مولر و گری ایلیس از گوگل به سوالات بررسی شده در این مقاله پاسخ دادند.

مولر وقتی از او پرسیده شد که چگونه می‌توان Googlebot را از خزیدن در بخش‌های خاص صفحه وب، مانند مناطق «هم‌چنین خرید» در صفحات محصول، جلوگیری کرد، گفت غیرممکن است. مولر گفت:

نسخه کوتاه این است که نمی‌توانید خزیدن یک بخش خاص در یک صفحه HTML را مسدود کنید.

وی در ادامه دو راهبرد بالقوه برای مقابله با این موضوع ارائه کرد که هیچکدام راه حل ایده آل نیستند. مولر استفاده از ویژگی HTML data-nosnippet را برای جلوگیری از ظاهر شدن متن در یک قطعه جستجو پیشنهاد کرد.

از طرف دیگر، می توانید از iframe یا جاوا اسکریپت با منبع مسدود شده توسط robots.txt استفاده کنید، اگرچه او هشدار داد که این ایده خوبی نیست. مولر اظهار داشت:

استفاده از فایل iframe روباتی یا جاوا اسکریپت می‌تواند مشکلاتی در خزیدن و نمایه‌سازی ایجاد کند که تشخیص و رفع آن‌ها سخت است.

او اطمینان داد که اگر محتوای مورد نظر در چندین صفحه دوباره استفاده شود، مشکلی نیست که نیاز به اصلاح داشته باشد.

در پاسخ به سوالی در مورد جلوگیری از دسترسی Googlebot به هر قسمت از سایت، Illyes راه حلی را ارائه کرد که به راحتی قابل پیگیری است.

ایلیز توضیح داد:

ساده‌ترین راه robots.txt است: اگر یک Disallow: / برای عامل کاربر Googlebot اضافه کنید، Googlebot تا زمانی که این قانون را در آنجا نگه دارید، سایت شما را تنها می‌گذارد. اگر می خواهید حتی دسترسی به شبکه را مسدود کنید، باید قوانین فایروال ایجاد کنید که محدوده IP ما را در یک قانون انکار بارگذاری کند.

اگرچه جلوگیری از دسترسی Googlebot به بخش‌های خاصی از یک صفحه HTML غیرممکن است، روش‌هایی مانند استفاده از ویژگی data-nosnippet می‌تواند کنترل را ارائه دهد. هنگامی که در نظر دارید Googlebot را به طور کامل از سایت خود مسدود کنید، یک قانون غیرمجاز ساده در فایل robots.txt شما این کار را انجام می دهد. با این حال، اقدامات شدیدتر مانند ایجاد قوانین خاص فایروال نیز در دسترس هستند.

امتیاز دهید
مشاهده بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

+ 18 = 19

دکمه بازگشت به بالا
بستن