تگ Canonical: راهنمای جامع + نحوه استفاده و جلوگیری از محتوای تکراری

اگر وب‌سایت شما دارای محتوای تکراری یا مشابه است (به‌ویژه در سایت‌های داده‌محور)، استفاده از تگ Canonical برای معرفی نسخه اصلی به موتورهای جستجو حیاتی است. موتورهای جستجو، مانند گوگل، می‌توانند محتوای تکراری را شناسایی کنند. اما اگر به آن‌ها اطلاع ندهید کدام نسخه اصلی است، خودشان تصمیم می‌گیرند کدام صفحه را در نتایج جستجو نمایش دهند.

این انتخاب خودکار موتورهای جستجو همیشه بهینه نیست. ممکن است صفحه‌ای قدیمی یا منسوخ‌شده را به عنوان نسخه اصلی در نظر بگیرند و به کاربران نمایش دهند. استفاده از تگ Canonical به شما این امکان را می‌دهد تا کنترل بهتری بر نحوه نمایش محتوایتان در نتایج جستجو داشته باشید و از این طریق، تجربه کاربری را بهبود بخشید و رتبه سئوی سایت خود را ارتقا دهید. با استفاده درست از تگ Canonical، می‌توانید اطمینان حاصل کنید که موتورهای جستجو همیشه به‌روزترین و مرتبط‌ترین نسخه از محتوای شما را به کاربران نشان می‌دهند.

نحوه تعیین URL کانونیکال (Canonical)

تعیین URL کانونیکال و معرفی آن به موتورهای جستجو بسیار ساده است. دو روش اصلی برای انجام این کار وجود دارد:

روش اول: استفاده از تگ لینک (Link) در بخش Head

این روش رایج‌ترین و ساده‌ترین راه است. کافی است تگ زیر را در قسمت <head> تمامی صفحاتی که نسخه اصلی نیستند (صفحات تکراری یا مشابه) قرار دهید:

<link rel="canonical" href="URL صفحه اصلی" />

در این تگ، به جای "URL صفحه اصلی"، آدرس URL کامل صفحه اصلی و کانونیکال را وارد کنید. این کار به موتورهای جستجو می‌گوید که این صفحه، نسخه اصلی محتوا است.

روش دوم: استفاده از هدرهای HTTP

اگر به هدرهای HTTP وب‌سایت خود دسترسی دارید (مثلاً از طریق فایل .htaccess یا زبان PHP)، می‌توانید URL کانونیکال را برای فایل‌هایی که بخش <head> ندارند (مانند فایل‌های PDF) تعیین کنید. برای این کار، هدر زیر را برای صفحاتی که کانونیکال نیستند تنظیم کنید:

Link: <URL صفحه اصلی>; rel="canonical"

در این روش نیز، به جای "URL صفحه اصلی"، آدرس URL کامل صفحه اصلی و کانونیکال را وارد کنید.

با استفاده از این دو روش، می‌توانید به سادگی URL کانونیکال را به موتورهای جستجو معرفی کنید و از بروز مشکلات ناشی از محتوای تکراری جلوگیری کنید.

تگ Canonical چگونه کار می‌کند و چه زمانی کار نمی‌کند؟

تگ Canonical به عنوان یک راهنما برای موتورهای جستجو عمل می‌کند تا صفحه اصلی و معتبر را شناسایی کنند. موتورهای جستجو با استفاده از این راهنمایی، فهرست خود را به‌روز می‌کنند و در نتایج جستجو، صفحه‌ای را نمایش می‌دهند که باور دارند نسخه اصلی است.

با این حال، همیشه اینطور نیست که موتورهای جستجو دقیقاً همان صفحه‌ای را نمایش دهند که شما به عنوان Canonical مشخص کرده‌اید. دلایل مختلفی برای این موضوع وجود دارد:

  • صفحه 404: اگر URL مشخص‌شده به عنوان Canonical، با خطای 404 (یافت نشدن صفحه) مواجه شود، موتورهای جستجو سعی می‌کنند دومین URL مرتبط را برای نمایش پیدا کنند.
  • مشکوک به هک: اگر موتور جستجو مشکوک شود که وب‌سایت شما هک شده و یک URL جعلی به عنوان Canonical اضافه شده است، از آن استفاده نخواهد کرد. در این صورت، مشکلات جدی‌تری در وب‌سایت خود خواهید داشت.
  • محل نادرست تگ: اگر تگ link rel="canonical" در جای نامناسبی قرار گیرد (مثلاً در تگ body یا خارج از تگ head) یا تگ head به درستی بسته نشده باشد، موتورهای جستجو ممکن است آن را نادیده بگیرند. دلیل این امر این است که بسیاری از وب‌سایت‌ها به کاربران اجازه می‌دهند تا محتوا را در داخل تگ body ویرایش کنند، بنابراین یک تگ Canonical در آنجا قابل اعتماد نخواهد بود.

تگ Rel=Canonical چه کاری انجام نمی‌دهد؟

بسیاری از افراد تصور می‌کنند که با اضافه کردن تگ rel=canonical، صفحه به نسخه اصلی ریدایرکت (تغییر مسیر) می‌شود، مشابه ریدایرکت 301. اما این تصور نادرست است.

تگ rel=canonical صرفاً اطلاعاتی را در اختیار موتورهای جستجو قرار می‌دهد و هیچ تاثیری بر نحوه نمایش صفحه یا ریدایرکت در سطح سرور ندارد. در واقع، تگ canonical فقط یک پیشنهاد است و موتورهای جستجو مجبور نیستند آن را رعایت کنند. اگرچه بیشتر موتورهای جستجو سعی می‌کنند به خواسته صاحبان وب‌سایت احترام بگذارند، اما در نهایت تصمیم‌گیری درباره نتایج جستجو بر عهده خودشان است و ممکن است صفحه کانونیکال شما را نمایش ندهند.

چه زمانی از تگ Canonical استفاده کنیم؟

همانطور که قبلاً اشاره شد، باید از تگ canonical در تمام صفحات تکراری که نسخه اصلی نیستند، استفاده کنید. اگر صفحاتی دارید که مشابه هستند اما کاملاً یکسان نیستند، گاهی اوقات بهتر است یکی از آنها را تغییر دهید تا تفاوت بیشتری داشته باشند، تا اینکه یکی را canonical کنید. اشکالی ندارد که دو صفحه را که کاملاً یکسان نیستند به عنوان canonical علامت‌گذاری کنید. آنها باید مشابه باشند، اما هرگز نباید به سادگی همه صفحات را به صفحه اصلی خود هدایت کنید. Canonical به این معنی است که صفحه، نسخه اصلی آن سند است، نه فقط یک لینک در سایت شما.

تکرار این نکته مهم است: هرگز نباید تمام صفحات خود را به عنوان صفحه canonical به صفحه اصلی خود هدایت کنید، مهم نیست چقدر وسوسه انگیز باشد. انجام این کار، حتی به طور تصادفی، می‌تواند باعث شود هر صفحه‌ای که canonical نیست (یعنی هر صفحه‌ای که صفحه اصلی شما نیست و لینک rel=canonical را دارد) از فهرست موتورهای جستجو حذف شود. این کار از روی بدجنسی گوگل (یا بینگ یا یاهو یا هر موتور جستجوی دیگر) نیست. آنها کاری را انجام می‌دهند که از آنها خواسته‌اید - در نظر گرفتن هر صفحه به عنوان تکراری از صفحه اصلی شما و بازگرداندن تمام نتایج به آن صفحه. سپس، هنگامی که مشتریان از رفتن به صفحه اصلی شما به جای یک سند مرتبط‌تر ناامید می‌شوند، آن صفحه کمتر محبوب می‌شود و در نتایج جستجو سقوط می‌کند. حتی اگر مشکل را برطرف کنید، ممکن است نتایج جستجوی خود را برای یک ماه از بین ببرید و هیچ تضمینی وجود ندارد که رتبه‌بندی سایت شما بهبود یابد.

نباید صفحه‌ای را که به دلیلی از جستجو حذف شده است (مانند متا تگ noindex یا توسط فایل robots.txt حذف شده است) canonical کنید. برای اینکه یک موتور جستجو بتواند به صفحه‌ای به عنوان canonical ارجاع دهد، ابتدا باید بتواند به آن ارجاع دهد.

موارد مناسب برای استفاده از لینک rel=canonical:

  • سایت‌هایی با URLهای پویا: می‌توانید از آن برای تعریف فرمت URL مورد نظر خود استفاده کنید.
  • سایت‌های تجارت الکترونیک، به خصوص در لیست محصولات: هنگامی که مشتریان شما معیارهای مرتب‌سازی را تغییر می‌دهند، نیازی نیست آن URL جدید ایندکس شود.
  • محتوای سندیکا شده: ناشرانی که از محتوای شما استفاده می‌کنند باید لینک rel=canonical را در صفحات خود به سند اصلی شما اضافه کنند.

چه زمانی از تگ Canonical استفاده نکنیم؟

اولین انتخاب شما همیشه باید ریدایرکت 301 باشد. این کار نه تنها به موتورهای جستجو اطلاع می‌دهد که URL صفحه تغییر کرده است، بلکه کاربران را مستقیماً به جدیدترین (و به اصطلاح Canonical) نسخه صفحه هدایت می‌کند.

تنبلی نکنید! اگر ساختار URL وب‌سایت خود را تغییر می‌دهید، از روش‌های مدیریت هدرهای HTTP (مانند فایل .htaccess، زبان PHP یا اسکریپت‌های دیگر) برای اعمال خودکار ریدایرکت‌های 301 استفاده کنید. در حالی که می‌توانید از تگ rel=canonical استفاده کنید، اما این کار باعث حذف صفحات قدیمی نمی‌شود و همچنان در دسترس خواهند بود. در واقع، اگر کاربری یک صفحه را نشانه‌گذاری کرده باشد و شما URL آن را تغییر دهید اما فقط با استفاده از تگ rel=canonical موتورهای جستجو را به‌روزرسانی کنید، آن کاربر هرگز صفحه جدید را نخواهد دید.

تگ rel=canonical ابزاری مفید برای سایت‌هایی با محتوای تکراری زیاد است. با درک نحوه عملکرد آن، می‌توانید به طور موثر از آن استفاده کنید. اما در نهایت، این ابزاری است که توسط موتورهای جستجو برای کمک به به‌روز نگه داشتن فهرست‌های جستجوی خود منتشر شده است. اگر سرورهای خود را تمیز و به‌روز نگه ندارید، مشتریان شما آسیب خواهند دید و ممکن است به سایت شما نیز صدمه وارد شود. از آن مسئولانه استفاده کنید.

طراحی سایت

بیشتر