מהם תכנים משוכפלים באתר?
מרבית המומחים לקידום אתרים ממליצים להמנע מ"תוכן משוכפל" באתר. תוכן משוכפל מוצר כאשר היא בעיקר כאשר אותו התוכן מופיע במספר כתובות אינטרנט בצורה זהה. במקרה שזה קורה בתוך אותו אתר, גוגל יכולה להעניש את האתר בחשד שמדובר בניסיון הונאה לנועד ליצור למראית עין אתר עם מספר דפים גדול יותר מאשר הערך המוסף האמיתי שלו, במטרה לזכות בדירוג טוב יותר.
הסיבות העיקריות שמנועי החיפוש נלחמים בתוכן משוכפל הן :
- שיפור חווית הגלישה של הגולש. אם גולש יראה בתוצאת חיפוש מסויימת 10 מאמרים זהים שכל אחת מופיע באתר אחר, הרי נמנעת ממנו הזכות להתרשם ממוון דעות ומקורות מידע. מנועי החיפוש מעוניינים לספק לגולש מידע רלוונטי ומותאם היטב לחיפושים שלו, כך שאם מאמר אחד לא מתאים לטעמים שלו, אין טעם להציג אותו 10 פעמים, ביתר התוצאות.
- שמירה על זכויות יוצרים - יוצר התוכן הוא זה שצריך להינות המקרדיט עליו. לכן זה שפרסם את התוכן ראשון מקבל את זכות הראשונים של מנועי החיפוש, כל היתר שהעתיקו בצורה חוקית או שלא בצורה חוקית, לא ראויים לקבל קרדיט על היצירה, ולכן מנועי החיפוש פועלים לדלל אותם ככל האפשר.
כאשר מדובר בתוכן זהה באתרים שונים, סביר להניח שאף אחד מהאתרים לא ייענש, אולם גם לא יקבל דירוג טוב יותר כתוצאה מכך, שכן המטרה של גוגל היא להפחית את הערך של אתרים שאינם מוסיפים ערך מקורי לתכנים שיש באינטרנט. אם ישנם מאמרים משוכפלים בין שני אתרים שונים, סביר להניח כי הראשון שפרסם את המאמר יזכה לקרדיט עבור הפרסום, יחד עם זאת יכול להיות שאם ההעתק שבו פורסם ההעתק הוא בעל PageRank גבוה יותר, הוא יזכה להופיע בדירוג לפני האתר שפרסם ראשון.
המקרים הבעייתיים שבהם גוגל צפויה להעניש בגין שכפול תוכן בין שני אתרים:
1. שכפול של אותו אתר תחת דומיין אחר, בניסיון לתפוס מספר מיקומים נוספים באמצעות אותו התוכן בעמוד הראשון של גוגל.
2. אתרים שכל התכנים בהם משוכפלים מאתרים אתרים, והם נבנו כדי ליצור אתרי תוכן אשר לכאורה עשירים בתוכן, מתוך מטרה למשוך גולשים ולהרוויח מפרסום באתר. גם אם רוצים להשתמש במאמר שפורסם במקום אחר ולהציגו לגולשים באתר שלך, יש צורך שחלק מהתכנים האתר יהיו מקוריים לחלוטין, על מנת לא להכנס לקגטורייה הבעייתי של אתרים משוכפלים.
איך להימנע מתוכן כפול?
כאשר מגלים עמודים משוכפלים בתוך אתר אחד ניתן למנוע אותם במספר דרכים:
1. 301 redirect - החלטה על עמוד אחד שאליו יפנו כל העמודים המשוכפלים
2. חסימת גישה - dissallow- באמצעות בגדרת ה URL הבעייתיים ב קובץ robots.txt,
3. חסימת גישה באמצעות תג noindex ,בקידוד של העמודים הבעייתיים.
חסימת העמודים הבעייתיים, "תנקה" את האתר ותפסיק את ה"תחרות" העצמית בין העמודים על הקרדיט של התוכן המשוכפל, ותשפר מאד את הדירוג של העמוד עם התוכן המקורי.
אם יש לך הרבה מקומות באתר שבהם יש תוכן כפול, אשר בהחלט לא ניתן לשכתב, אתה תמיד יכול לחסום עכבישים גוגל גישה באזורים אלה של אתר האינטרנט שלך באמצעות קובץ robots.txt, או תג מטא noindex, זה מעודד מנועי החיפוש לאינדקס רק את הדפים החשובים באתר שלך חוסך את הצורך להתחרות עם עצמך על שטח של תוצאות מנוע החיפוש של Google. עם זאת, גוגל עדיין טוען כי השיטה הטובה ביותר לשמירה על עכבישים שלהם זוחל דפים הכוללים תוכן משוכפל הוא השימוש של ארבע שיטות לקדושה לעיל