طبق گزارش موسسه بازاریابی محتوا (CMI)، 73 درصد از سایتهای B2B و 70 درصد از سایتهای B2C از بازاریابی محتوا به عنوان بخشی از استراتژی بازاریابی کلی خود استفاده میکنند. از سوی دیگر طبق گزارشات در سال 2023 حدود 36.1 درصد از کسب و کارها به تولید محتوا روی آوردهاند. فکر میکنید چرا این مشاغل حاضرند برای تولید محتوا این همه هزینه کنند؟ چه چیزی آنها را به تولید محتوا تشویق میکند؟ چرا نباید محتوا را از سایر سایتها کپی کرد؟ آیا محتوای تکراری به سایت آسیب میزند؟ ما هم به همین دلیل است که تصمیم گرفتیم در اینجا در مورد محتوای تکراری (داپلیکیت کانتنت) صحبت کنیم.
محتوای تکراری یا کپی (Duplicate Content) چیست؟
محتوای تکراری به آن دسته از محتوایی گفته میشود که دقیقا شبیه به محتوای سایر وب سایتها یا صفحات مختلف همان سایت نوشته شده است. یعنی محتوا میتواند تکرار محتوای سایر سایتها و یا صفحات دیگر همان سایت باشد. محتوا شامل متن، تصویر، ویدئو و یا پادکست است و موتورهای جستجو هم به خوبی انواع محتوا را میشناسند و آنها Index میکنند. بنابراین میتوانند به خوبی محتوای کپی شده را تشخیص دهند.
برخی به اشتباه فکر میکنند فقط کپیبرداری از محتوای سایر سایتها، داپلیکیت کانتنت است. در حالی که اگر محتوای یک صفحه از روی محتوای صفحه دیگری از سایت (عیناً و بدون تغییر) برداشته شود، محتوای تکراری محسوب میشود. حالا اگر یک سایت حجم زیادی محتوای تکراری داشته باشد، روی رتبهبندی آن تاثیر منفی میگذارد.
گوگل از یک سو میخواهد مانع از کپی برداری محتوای سایتهای معتبر توسط سایتهای دیگر شود. از سوی دیگر تشویق سایتها برای تولید محتواهای جدید برای کاربران یکی دیگر از اهداف گوگل است. به هر حال اگر گوگل هیچ واکنشی نسبت به محتواهای تکراری و کپی شده نشان ندهد، همه سایتها به همین رویه روی میآورند و دیگر هیچ سایتی برای تولید محتوای یونیک تلاش نمیکند. حتی کسی به دنبال این نخواهد بود که تولید محتوا چیست و چرا باید برای آن هزینه کنید.
اما چون گوگل به نیاز کاربران اهمیت زیادی میدهد و میخواهد مدام در سایتها محتواهای جدید، بهروز و علمی منتشر شود، صفحات حاوی محتوای تکراری را در صفحه اول نتایج جستجو قرار نمیدهد. وقتی گوگل حتی محتوای بازنویسی شده را هم در ردیف محتواهای تکراری و کپیشده قرار میدهد، یعنی باید به دنبال منابع جدید برای تولید محتوا باشید.
انواع محتوای تکراری کدامند؟
داپلیکیت کانتنت شامل دو نوع است که در زیر بررسی شدهاند:
محتوای تکراری از داخل سایت
اگر چند صفحه شما محتوای شبیه به هم داشته باشد، کنیبالیزیشن اتفاق میافتد. اما کنیبالیزیشن چیست و چرا اتفاق میافتد؟ کنیبالیزیشن (cannibalization) به معنای همنوعخواری است که طی آن دو یا چند صفحه به دلیل داشتن محتوای یکسان و کلمات کلیدی مشابه، برای گرفتن رتبه در نتایج گوگل با هم رقابت میکنند.
وقتی محتوای یک صفحه کپی محتوای سایر صفحات باشد، CTR، لینکها، محتوا و حتی نرخ تبدیل بین آن دو صفحه تقسیم میشود.
پس برای اینکه الگوریتم پاندا به محتوای سایت شما غضب نکند، لازم است با استراتژی محتوا پیش بروید. وقتی برای تولید محتوا برنامهریزی داشته باشید و مشخص باشد هر صفحه از چه کلمات کلیدی استفاده کند، به مشکل محتوای کپی (از داخل سایت) گرفتار نمیشوید.
گاهی اوقات محتوای تکراری بین صفحات یک سایت ناخواسته اتفاق میافتد که در ادامه همین مطلب به آن میپردازیم.
محتوای تکراری از خارج سایت
یکی دیگر از انواع داپلیکیت کانتنت با برداشتن محتوا از سایر سایتها اتفاق میافتد. برخی از سایتها برای اینکه در تولید محتوا هزینه نکنند و یا با هدف اینکه سریعتر به صفحه اول نتایج جستجو بروند، از محتوای سایر سایتها استفاده میکنند. با کپیبرداری محتوا از سایر سایتها شما جریمه نمیشوید؛ البته تا زمانی که صاحب محتوا از شما به گوگل شکایت نکند. با این حال نباید منتظر رشد سایت خود بمانید. هیچ سایتی با محتوای سایتهای دیگر رشد نمیکند.
تاثیر محتوای تکراری در سئو چیست؟
گوگل اعلام کرده است که از طریق الگوریتم پاندا به شدت محتوای سایتها را بررسی میکند و در صورتی که محتوای تکراری تولید کنند روی بهینهسازی سایت آنها تاثیر منفی میگذارد. از جمله اثرات داپلیکیت کانتنت باید به موارد زیر اشاره کنیم:
رتبهبندی نامطلوب صفحه حاوی محتوای کپیشده
اگر در یکی از صفحات سایت خود محتوای کپیشده (از سایت خود یا سایر سایتها) داشته باشید، گوگل به شدت رتبه آن صفحه را کاهش میدهد. به طوری که هیچ امیدی برای قرار گرفتن این صفحه در صفحه اول نتایج جستجو وجود ندارد. این موتور جستجو میخواهد همیشه بهترین صفحات را برای کاربران نمایش دهد و اگر قرار باشد یک محتوای کپی شده را در رنک بالا قرار دهد، گویی در حق سایر سایتهایی که برای تولید محتوای جذاب و باکیفیت تلاش کردهاند، اجحاف کرده است.
جذب بک لینک برای URL با محتوای تکراری
اگر دو یا چند صفحه از سایت شما محتوای تکراری داشته باشد، وقتی برای یک کوئری بک لینک دریافت کرده و رپورتاژ منتشر میکنید، صفحه حاوی محتوای کپی نیز بکلینکها را جذب میکند. پس بدون اینکه قصد داشته باشید رنک یک صفحه را ارتقا دهید، خود به خود گوگل به آن اعتبار میبخشد. در نتیجه حتی با وجود اینکه برای رپورتاژ گرفتن هزینه میکنید، اما صفحه مورد نظر رشد نمیکنید. اگر میخواهید بدانید رپورتاژ چیست و چطور باید آن را انجام دهید، مطلب دیگر ما را مطالعه کنید.
هدر رفت بودجه رشد سایت
اگر سایت بزرگی دارید و به طور مداوم محتواهای جدید را بروزرسانی میکنید، اما هیچ توجهی به تکراری بودن محتوای برخی از صفحات ندارید، در واقع در حال هدر دادن هزینههای تولید محتوا هستید. در این سایتها رباتهای موتورهای جستجو به جای ورود به صفحات جدید و به روز شده، تمام نسخههای محتوای تکراری را بررسی کرده و دوباره ایندکس میکنند. پس مدت زمان بیشتری طول میکشد تا صفحات و محتواهای جدید توسط گوگل Index شوند.
بیاعتبار شدن در نزد کاربران
وقتی در سایت محتوای تکراری قرار میدهید، کاربران متوجه میشوند. در نتیجه به مرور زمان سایت اعتبار خود را از دست میدهد. چرا که آنها به دنبال مرجع و منبع اصلی هستند و وقتی میدانند این محتوا از چه سایتی برداشته شده است، به سراغ همان سایت میروند تا اطلاعات کاملتری دریافت کنند.
بیاعتبار شدن در نزد گوگل
شاید بارها دیده باشید که وقتی یک سایت تعداد زیادی صفحه معتبر و کاربرپسند دارد، سایر صفحات آن نیز در نتایج جستجو دیده میشود. ممکن است حتی از نظر ارزش محتوایی نسبت به رقبایی که در رنکهای پایینتر SERP قرار گرفتهاند، این محتوا از ارزش کمتری برخوردار باشد، اما چون تعداد زیادی از صفحات سایت توانستهاند در نزد گوگل اعتبار بالایی کسب کنند، سایر صفحات هم در نتایج جستجو دیده میشوند.
احتمالا بپرسید گوگل چگونه محتوای بی کیفیت را تشخیص میدهد؟ که باید در پاسخ به الگوریتم پاندا اشاره کنیم. در بالاتر هم به همین مورد پرداختیم. بنابراین یک تاثیر محتوای تکراری در سئو به بیاعتباری سایت نزد Google مربوط میشود.
شکایت مدیران سایر سایتها و جریمه شدن توسط گوگل
کپی کردن محتوا از سایر سایتها باعث جریمه سایت شما نمیشود. اما اگر صاحب سایتی که محتوا را از آن برداشتهاید، از شما شکایت کند، گوگل بعد از بررسی تاریخ انتشار محتوا و تشخیص اینکه صاحب اصلی محتوا کدام سایت است، شما را به دلیل کپی کردن محتوای سایت اصلی جریمه میکند.
چگونه مشکل محتوای تکراری ایجاد می شود؟
در بسیاری از مواقع وبمسترها محتوای سایر سایتها را کپی نمیکنند. حتی برای نوشتن محتوای سایت خود تلاش زیادی کرده و بابت آن هزینه پرداخت میکنند. با این حال ممکن است باز هم در سایت آنها محتوای کپیشده وجود داشته باشد. در این مواقع باید با بررسی محتوای تکراری برای رفع آن اقدام کرد.
اما قبل از هر چیز باید دلایل تکراری شدن محتوای صفحات یک سایت مشخص شود که در زیر به آن پرداختهایم.
تکرار همسان محتوا در چند صفحه سایت
برخی از سایتها ممکن است دارای چند URL مشابه و یکسان باشند. این مشکل بیشتر برای سایتهایی ایجاد میشود که برای سایت گواهینامه SSL خریداری میکنند تا دادههای سایت ایمن باشند. در این صورت دو نسخه HTTP و HTTPS از سایت ایجاد میشود که در آن URLها تکراری هستند.
همچنین برخی دیگر از سایتها با دو نسخه (با WWW و بدون آن) هستند که باعث میشود لینکهای مشابه ایجاد شود. در نتیجه گوگل را برای ایندکس کردن این URLهای مشابه سردرگم میکند.
ایجاد مشکل در URLهای سایت
یکی دیگر از دلایل ایجاد محتوای تکراری در سایت، وجود متغیر در لینکهای صفحات است که منجر به تولید محتوای تکراری میشود. به این صورت که دو URL متفاوت به یک محتوای همسان در سایت ارجاع داده میشود.
کپی محتوا از سایر سایتها
واضحترین دلیل تکراری شدن محتوای یک صفحه به برداشتن محتوا از سایر سایتها مربوط میشود. این مشکل بیشتر برای فروشگاههای اینترنتی وجود دارد. برخی از این فروشگاههای آنلاین که دارای تعداد زیادی محصول هستند، برای اینکه تولید محتوای یونیک برای آنها هزینه زیادی به دنبال دارد، ترجیح میدهند از محتوای سایر سایتها استفاده کنند.
در حالی که یکی از راه های افزایش ورودی از گوگل تولید محتوای منحصر به فرد و جدید است.
استفاده از Session ID
از دیگر دلایل ایجاد محتواهای تکراری در صفحات سایت، استفاده از Session ID است. در واقع Session IDها نیز محتواهای تکراری در سایت تولید میکنند. وقتی کاربران از سایت بازدید میکنند، برای هر یک از آنها، یک Session ID صادر میشود و این شناسه در آدرس سایت قرار میگیرد و ذخیره میشود. حالا این ID جلسه (حضور کاربر) در آدرس میتواند باعث تولید محتوای تکراری در سایت شود.
قابلیت پرینت صفحه
یکی دیگر از دلایل ایجاد صفحات با محتوای کپی، به صفحاتی مربوط میشود که گزینه «پرینت» را در اختیار کاربران قرار میدهند. زیرا در همین زمان نسخههای متعددی از یک صفحه ایندکس میشود و زمانی که بر روی گزینه پرینت کلیک میکنید، یک صفحه جدید با محتوای یکسان و آدرس متفاوت برایتان نمایش داده میشود.
نحوه رفع مشکل محتوای تکراری
حالا که مشخص شد این صفحات چطور ایجاد میشوند و چه بلایی بر سر سایت و رنک صفحات میآورند، لازم است تا برای رفع این مشکل اقدام کنید. در زیر چندین راهحل ارائه شده است:
رفع مشکل محتوای تکراری با روش ریدایرکت 301
ریدایرکت کردن به این روشی گفته میشود که یک صفحه را به صفحه دیگری ارجاع میدهید. به طوری که وقتی کاربر روی آن لینک کلیک میکند، به صفحه مورد نظر شما وارد میشود.
برای ریدایرکت کردن باید از افزونه یا پلاگین مخصوص به آن استفاده کنید. برای مثال در سایتهای وردپرسی از افزونه Redirection استفاده میشود. سپس با انتخاب کد وضعیت 301، یک صفحه به صفحه دیگری انتقال داده میشود.
حالا صفحهای که محتوای تکراری دارد، به صفحه دیگری انتقال پیدا میکند. البته شما باید از طریق ابزار سرچ کنسول صفحه قویتر و ضعیفتر را پیدا کنید. صفحه قوی را نگهدارید و url ضعیف را بر روی آن انتقال دهید.
استفاده از فایل Robots.txt
دومین روش برای برطرف کردن مشکل محتوای کپی شده در سایت استفاده فایل robots.txt است. این فایل در شاخه اصلی سایت قرار دارد و اگر روی آدرس https://example.com/robots.txt (به جای examle دامنه سایت خودتان را قرار دهید) کلیک کنید، میتوانید این فایل را ببینید.
حالا در این فایل باید تغییراتی ایجاد کرده و به گوگل بگویید که یک صفحه تکراری را ایندکس نکند. فراموش نکنید برای ایجاد فایل Robot.txt باید دانش فنی داشته باشید.
استفاده از متا تگ noindex
روش دیگری که برای رفع مشکل محتوای تکراری کاربرد دارد، قرار دادن متاروبوت noindex در صفحات تکراری و در قسمت متا تگهاست. وقتی این کد در داخل یک صفحه قرار بگیرد، همان کارآیی فایل Robots.txt را دارد و به گوگل میگوید این صفحه را ایندکس نکند. برای اجرای این روش باید دانش فنی داشته باشد. یک اشتباه کوچک ممکن است روی سئو سایت تاثیر منفی بگذارد.
اجرای روش رل کنونیکال
رل کنونیکال (Canonical Rel) یک تگ HTML است که در قسمت head سایت قرار میگیرد و حاوی آدرس یک صفحه است. این تگ میتواند به موتورهای جستجو بفهماند که محتوای این صفحه بسیار شبیه به محتوای صفحهای است که آدرس آن در درون تگ قرار گرفته است. در واقع شما با روش رل کنونیکال به گوگل میگویید که صفحه مهم شما کدام است تا به آن توجه کند.
برای اجرای این روش ابتدا باید از طریق بررسی محتوای تکراری صفحه بهتر و قدرتمند خود را پیدا کنید. سپس آدرس آن را در تگ کنونیکال صفحه ضعیفتر قرار دهید.
نکات مهم در حل مشکل محتوای تکراری
اگرچه وجود محتوای تکراری در سایت ممکن است مشکلاتی را ایجاد کند، اما اگر رفع مشکل درست انجام نشود، نتیجه برعکس میشود. به همین دلیل برای رفع مشکل محتوای تکراری باید به چه نکته دقت داشته باشید:
بررسی محتوای تکراری در لینک های داخلی
بهترین راه برای اینکه متوجه شوید لینکهای شما تکرار نشدهاند و یا محتواها کپی شده نیستند، استفاده از ابزار است. به طوری که با قرار دادن لینک سایت خود در این ابزارها، صفحاتی که داپلیکیت کانتنت شدهاند، مشخص میشوند. برخی از این ابزارها عبارتند از grammarly، plagium و plagiarismchek.
همچنین با استفاده از ابزار گوگل سرچ کنسول هم میتوانید محتواهای کپی شده و تکراری را پیدا کنید. به این صورت یک کلمه کلیدی بسیار مهم را در قسمت Query این ابزار جستجو کنید. بعد تعداد لینکهایی که این کلمه کلیدی در آنها استفاده شده است، برایتان نمایش داده میشود.
بررسی محتوای کپی شده از سایر سایتها
اگر مدیریت سایت از گذشته تاکنون با شما بوده است، حتما میدانید برای کدام قسمتهای سایت محتوای کپی شده از سایر سایتها برداشته شده است. اما اگر به تازگی مدیریت یک سایت را به دست گرفتهاید و نمیدانید کدام قسمت سایت محتوای کپی دارد، بهتر است از ابزارهایی مثل copyscape.com ، Site Liner و یا Edu birdie استفاده کنید.
اگر تولید محتوای سایت را به نویسندگان دورکار سپردهاید، بعد از دریافت آن با استفاده از این ابزارها، یونیک بودن محتوا را بررسی کنید.
برای تولید محتوای هر مقاله از کلمات کلیدی متفاوت استفاده کنید. اما کلمه کلیدی چیست و چطور باید آن را پیدا کنید؟ در مطلب دیگری به این سوال پاسخ دادهایم.
محتوای کپی چه عواقبی دارد؟
وجود محتوای کپی و تکراری روی سایت به عملکرد SEO آسیب میرساند و از دیده شدن صفحات در نتایج جستجو جلوگیری میکند. با این حال تا زمانی که صاحب سایتی که محتوا را از او گرفتهاید، شکایت نکند، گوگل شما را جریمه نمیکند.
از سوی دیگر Google تشخیص دهد که محتوای تکراری برای فریب دادن موتورهای جستجو در سایت قرار گرفته است، روی سایت تاثیر منفی میگذارد. به طور کلی عواقب کپی کردن محتوا از وب سایتهای دیگر عواقب زیر را به دنبال دارد:
- افت شدید رتبه سایت
- هدر رفتن هزینههای تولید محتوا
- بیاعتبار شدن سایت