Cara Terbaik Dalam Mengatasi Konten Duplikat

Cara Terbaik Dalam Mengatasi Konten Duplikat

Konten duplikat dapat di atasi dengan beberapa cara, dan pada artikel ini Saya akan menjelaskan Cara yang tepat dalam mengatasi konten duplikat di Situs web Anda ok!

Mesin pencari seperti Google memiliki masalah – inilah yang disebut dengan [duplikat konten].

Maksud dari Konten duplikat adalah konten yang serupa muncul di beberapa lokasi (URL) di Situs web, dan sebagai akibatnya mesin pencari tidak tahu persis URL mana yang akan ditampilkan dalam hasil pencariannya.

Ini dapat merusak peringkat halaman Situs web, dan masalahnya hanya menjadi lebih buruk ketika orang mulai menautkan ke versi berbeda dari konten yang sama.

Artikel ini akan membantu Anda untuk memahami berbagai penyebab konten duplikat, dan untuk menemukan solusinya.

Anda Baca dengan benar – benar dan ini juga untuk kepentingan Situs web Anda sendiri, ok Langsung saja kita bahas.

 

1. Apa itu duplikat konten?

Konten duplikat adalah konten yang tersedia di banyak URL di web. Karena lebih dari satu URL menunjukkan konten yang sama, mesin pencari tidak tahu URL mana yang lebih tinggi dalam hasil pencariannya. Oleh karena itu mereka mungkin memberi peringkat kedua URL lebih rendah dan memberikan preferensi ke halaman Situs web lainnya.

Pada artikel ini, kita akan fokus pada penyebab teknis dari konten duplikat dan menemukan solusinya. 

Contoh ilustrasi

Konten duplikat dapat disamakan berada di persimpangan jalan yang berbeda di mana ada rambu-rambu jalan menunjuk ke dua arah berbeda tapi untuk tujuan yang sama: Jalan mana yang harus Anda ambil? Lebih buruknya lagi, tujuan akhir juga berbeda, tetapi hanya sedikit. Sebagai pembaca, Anda tidak keberatan karena Anda mendapatkan konten yang Anda inginkan, tetapi mesin pencari harus memilih halaman mana yang akan ditampilkan dalam hasil pencarian karena, pasti mesin pencar tidak ingin menampilkan konten yang sama dua kali pada Situs web.

Katakanlah artikel Anda tentang  [kata kunci A]  muncul di 

http://www.Contoh.com/katakunci-A/

Dan konten yang sama juga muncul di 

http://www.contoh.com/artikel-kategori/kata-kunci-A/ 

Hal ini tidak fiktif: itu sering terjadi di Sistem Manajemen Konten saat ini. Lalu katakanlah artikel Anda telah diambil oleh beberapa Situs web dan beberapa dari mereka memiliki tautan ke URL pertama, sementara yang lain menghubungkan ke yang kedua.

Inilah saat masalah mesin pencari menunjukkan sifat aslinya: itu   masalah Anda . Konten duplikat adalah masalah Anda karena kedua tautan tersebut mempromosikan URL yang berbeda. Jika mereka semua menautkan ke URL yang sama, peluang Anda untuk menentukan peringkat untuk   [katakunci A]  akan lebih tinggi.

Mungkin saja Anda belum tahu apakah Situs web Anda menderita masalah duplikat konten, di sini ada alat yang akan membantu Anda dalam menemukan konten duplikat di situs web Anda.

2. Penyebab duplikat konten

Ada beberapa alasan bahkan pulahan untuk duplikat konten. Kebanyakan dari mereka bersifat teknis: jarang orang – orang memutuskan untuk meletakkan konten yang sama di dua tempat berbeda tanpa memperjelas mana yang asli dan mana yang duplikat – rasanya tidak wajar bagi kebanyakan dari kita.

Ada banyak alasan teknis dan itu kebanyakan terjadi karena pengembang tidak berpikir seperti browser atau bahkan pengguna, apalagi spider [laba – laba] mesin pencari – mereka berpikir seperti seorang ahli programmer.

Ambil artikel yang Saya sebutkan sebelumnya, yang muncul di

http://www.contoh.com/kata-kunci-A/dan http://www.contoh.com/artikel-katagori/kata-kunci-A/

Jika Anda bertanya kepada pengembang, mereka akan mengatakan itu hanya ada sekali.

Kesalahpahaman konsep URL

Tidak, pengembang itu tidak menjadi Stres, mereka hanya berbicara bahasa yang berbeda saja.

CMS mungkin akan memberi daya pada situs web, dan dalam basis data itu hanya ada satu artikel, tetapi perangkat lunak situs web hanya memungkinkan agar artikel yang sama dalam database diambil melalui beberapa URL. Itu karena, di mata pengembang, pengidentifikasi unik untuk artikel itu adalah ID yang dimiliki artikel dalam database, bukan URL.

Tetapi untuk mesin pencari, URL adalah pengidentifikasi unik untuk sebuah konten. Jika Anda menjelaskannya kepada pengembang, mereka akan mulai mendapatkan masalah. Dan setelah membaca artikel ini, Anda bahkan akan dapat memberikan mereka solusinya.

ID sesi

Anda sering ingin melacak pengunjung Anda dan mengizinkan mereka, misalnya, untuk menyimpan barang yang ingin mereka beli di keranjang belanja. Untuk melakukan itu, Anda harus memberi mereka [sesi]. Sesi adalah sejarah singkat tentang apa yang dilakukan pengunjung di situs Anda dan dapat berisi hal-hal seperti barang-barang di keranjang belanja mereka. Untuk mempertahankan sesi itu ketika pengunjung mengklik dari satu halaman ke halaman lain, pengidentifikasi unik untuk sesi itu – disebut Session ID – perlu disimpan di suatu tempat. Solusi paling umum adalah melakukannya dengan cookie. Namun, mesin pencari biasanya tidak menyimpan cookie.

Pada saat itu, beberapa sistem kembali menggunakan ID Sesi di URL. Ini berarti bahwa setiap tautan internal di situs web mendapatkan ID Sesi yang ditambahkan ke URL-nya, dan karena ID Sesi itu unik untuk sesi itu, ia membuat URL baru, dan karenanya menggandakan konten.

Parameter URL yang digunakan untuk melacak dan menyortir

Penyebab lain dari konten duplikat adalah menggunakan parameter URL yang tidak mengubah konten halaman, misalnya dalam melacak tautan. Anda lihat, ke mesin pencari,

http://www.contoh.com/kata-kunci-A/dan http://www.contoh.com/kata-kata-kunci?source=rss

Bukan URL yang sama. Yang terakhir mungkin memungkinkan Anda untuk melacak dari mana sumber orang berasal, tetapi mungkin juga membuat Anda lebih sulit untuk mendapatkan peringkat yang baik – sangat banyak efek samping yang tidak diinginkan!

Ini tidak hanya berlaku untuk parameter pelacakan, tentu saja. Ini berlaku untuk setiap parameter yang dapat Anda tambahkan ke URL yang tidak mengubah konten vital, apakah parameter itu untuk [mengubah pengurutan pada set produk] atau untuk [menampilkan bilah sisi lain]: semuanya menyebabkan duplikat kandungan.

Scrapers dan sindikasi konten

Sebagian besar alasan untuk duplikat konten adalah kesalahan Anda atau situs web Anda. Namun, terkadang, situs web lain menggunakan konten Anda, dengan atau tanpa persetujuan Anda. Mereka tidak selalu menautkan ke artikel asli Anda, dan karena itu mesin pencari tidak [mendapatkannya] dan harus berurusan dengan versi lain dari artikel yang sama. Semakin populer situs Anda, semakin banyak scrapers yang Anda dapatkan, menjadikan masalah ini semakin besar.

Urutan parameter

Penyebab umum lainnya adalah bahwa CMS tidak menggunakan URL bersih yang bagus, melainkan URL seperti /?id=1&cat=2, di mana ID merujuk ke artikel dan cat merujuk ke kategori. URL /?cat=2&id=1 akan memberikan hasil yang sama di sebagian besar sistem situs web, tetapi sama sekali berbeda untuk mesin pencari.

Komentar pagination

Di platform WordPress Saya ini, tetapi juga di beberapa sistem lain, ada cara untuk memberi peringkat pada komentar Anda. Ini mengarah pada konten yang diduplikasi di seluruh URL artikel, dan URL artikel + / komentar-halaman-1 /, / komentar-halaman-2 / Komentar-halaman-3/ dll.

Halaman ramah-printer

Jika sistem manajemen konten Anda membuat halaman ramah-printer dan Anda menautkannya dengan halaman – halaman artikel Anda, Google biasanya akan menemukannya, kecuali jika Anda secara spesifik memblokirnya. Sekarang, tanyakan pada diri sendiri: Versi mana yang ingin Anda tampilkan di Google? Yang dengan iklan dan konten Anda, atau yang hanya menampilkan artikel Anda?

WWW vs non-WWW

Ini adalah salah satu yang tertua dalam buku ini, tetapi kadang-kadang mesin pencari masih salah: WWW vs non-WWW duplikat konten, ketika kedua versi situs Anda dapat diakses. Lain, situasi yang kurang umum tetapi yang saya lihat juga adalah HTTP vs HTTPS duplikat konten, di mana konten yang sama disajikan di atas keduanya.

3. Solusi konseptual: URL [kanonik]

Seperti yang telah kita lihat, fakta bahwa beberapa URL mengarah ke konten yang sama merupakan masalah, tetapi hal itu dapat diselesaikan. Satu orang yang bekerja di publikasi biasanya akan dapat memberi tahu Anda dengan mudah apa URL itu [benar] untuk artikel tertentu, tetapi kadang-kadang ketika Anda bertanya pada dua orang di perusahaan yang sama, Anda akan mendapatkan dua jawaban berbeda.

Itu masalah yang perlu diatasi karena, pada akhirnya, hanya ada satu (URL). URL yang [benar] untuk sepotong konten disebut sebagai  URL kanonik oleh mesin pencari.

 

Canonical konten duplikat

 

Catatan sisi kronis

Kanonikal adalah istilah yang berasal dari tradisi Katolik Roma, di mana daftar kitab suci dibuat dan diterima sebagai asli. Mereka dikenal sebagai Injil kanonik Perjanjian Baru. Ironisnya adalah gereja Katolik Roma membutuhkan sekitar 300 tahun dan banyak perkelahian untuk menghasilkan daftar kanonik itu, dan mereka akhirnya memilih empat versi dari  cerita yang sama.

4. Mengidentifikasi masalah konten duplikat

Anda mungkin tidak tahu apakah Anda memiliki masalah konten duplikat di situs Anda atau dengan konten Anda. Menggunakan Google adalah salah satu cara termudah untuk menemukan konten duplikat.

Ada beberapa  operator pencarian  yang sangat membantu dalam kasus seperti ini. Jika Anda ingin menemukan semua URL di situs Anda yang berisi  kata kunci A  artikel Anda, Anda akan mengetik frasa pencarian berikut ke Google:

situs: contoh.com intitle: "Kata Kunci A"

Google kemudian akan menampilkan semua halaman di example.com yang berisi kata kunci itu. Semakin spesifik Anda membuat intitlebagian dari permintaan itu, semakin mudah untuk menghilangkan konten duplikat. Anda dapat menggunakan metode yang sama untuk mengidentifikasi konten duplikat di web. Katakanlah judul lengkap dari artikel Anda adalah  [Kata Kunci A – mengapa itu mengagumkan], Anda akan mencari:

intitle: "Kata Kunci A - mengapa itu mengagumkan"

Dan Google akan memberi Anda semua situs yang sesuai dengan judul itu. Kadang-kadang layak bahkan mencari satu atau dua kalimat lengkap dari artikel Anda, karena beberapa masalah mungkin mengubah judul. Dalam beberapa kasus, ketika Anda melakukan pencarian seperti itu, Google mungkin menampilkan pemberitahuan seperti ini di halaman terakhir hasil:

Ini adalah tanda bahwa Google sudah [menghapus hasil pencariannya]. Itu masih tidak baik, jadi ada baiknya mengklik tautan dan melihat semua hasil lainnya untuk melihat apakah Anda dapat memperbaikinya.

5. Solusi praktis untuk konten duplikat

Setelah Anda memutuskan URL mana yang merupakan URL kanonik untuk konten Anda, Anda harus memulai proses kanonikisasi (ya saya tahu, coba katakan itu tiga kali dengan sangat cepat). Ini berarti kita harus memberi tahu mesin pencari tentang versi kanonik suatu halaman dan membiarkan mereka menemukannya Secepatnya. Ada beberapa metode penyelesaian masalah, sesuai urutan pilihan:

  1. Tidak membuat konten duplikat
  2. Mengarahkan konten duplikat ke URL kanonik
  3. Menambahkan elemen tautan kanonik ke halaman duplikat
  4. Menambahkan tautan HTML dari halaman duplikat ke halaman kanonik

Menghindari konten duplikat

Beberapa penyebab di atas untuk konten duplikat memiliki perbaikan yang sangat sederhana:

  • Apakah ada Sesi ID di URL Anda?
    Ini seringkali dapat dinonaktifkan di pengaturan sistem Anda.
  • Apakah Anda punya halaman duplikat ramah printer?
    Ini sama sekali tidak perlu: Anda hanya perlu menggunakan  lembar gaya cetak .
  • Apakah Anda menggunakan pagination komentar di WordPress?
    Anda harus menonaktifkan fitur ini (di bawah  pengaturan »diskusi ) di 99% situs.
  • Apakah parameter Anda dalam urutan yang berbeda?
    Beri tahu programmer Anda untuk membuat skrip untuk selalu menempatkan parameter dalam urutan yang sama (ini sering disebut sebagai perusahaan URL).
  • Apakah ada masalah pelacakan tautan?
    Dalam sebagian besar kasus, Anda dapat menggunakan pelacakan kampanye berbasis tag hash alih-alih pelacakan kampanye berbasis parameter.
  • Sudahkah Anda mengalami masalah WWW vs non-WWW?
    Pilih satu dan pertahankan dengan  mengarahkan ulang yang satu ke yang lain . Anda juga dapat menetapkan preferensi di Alat Webmaster Google, tetapi Anda harus mengklaim kedua versi nama domain.

Jika masalah Anda tidak mudah diperbaiki, mungkin masih ada baiknya Anda berusaha. Tujuannya adalah untuk mencegah konten duplikat muncul sama sekali, karena sejauh ini merupakan solusi terbaik untuk masalah ini.

301 Mengarahkan konten duplikat

Dalam beberapa kasus, mustahil untuk sepenuhnya mencegah sistem yang Anda gunakan untuk membuat URL yang salah untuk konten, tetapi kadang-kadang dimungkinkan untuk mengarahkan ulang mereka. Jika ini tidak logis untuk Anda (yang dapat saya mengerti), ingatlah saat berbicara dengan pengembang Anda. Jika Anda  melakukan  menyingkirkan beberapa masalah konten duplikat, pastikan bahwa Anda mengarahkan semua URL duplikat konten lama ke URL kanonik yang benar dan tepat

Terkadang Anda tidak ingin atau tidak bisa menghapus versi duplikat artikel, bahkan ketika Anda tahu bahwa itu adalah URL yang salah. Untuk mengatasi masalah khusus ini, mesin pencari telah memperkenalkan elemen tautan kanonik. Itu ditempatkan di bagian <head> situs Anda, dan terlihat seperti ini:

<link rel="canonical" href="http://contoh.com/wordpress/seo-plugin/" />

Di hrefbagian tautan kanonik, Anda menempatkan URL kanonik yang benar untuk artikel Anda. Ketika mesin pencari yang mendukung kanonik menemukan elemen tautan ini, ia melakukan redirect 301 lembut, mentransfer sebagian besar nilai tautan yang dikumpulkan oleh halaman itu ke halaman kanonik Anda.

Proses ini sedikit lebih lambat daripada redirect 301, jadi jika Anda bisa melakukan redirect 301 yang lebih disukai.

Menautkan kembali ke konten asli

Jika Anda tidak dapat melakukan hal di atas, mungkin karena Anda tidak mengontrol bagian <head> situs tempat konten Anda muncul, menambahkan tautan kembali ke artikel asli di atas atau di bawah artikel itu selalu merupakan hal yang baik. ide. Anda mungkin ingin melakukan ini di umpan RSS Anda dengan menambahkan tautan kembali ke artikel di dalamnya. Beberapa Scrapers akan menyaring tautan itu, tetapi yang lain mungkin meninggalkannya. Jika Google menemukan beberapa tautan yang menunjuk ke artikel asli Anda, itu akan segera mengetahui bahwa itu adalah versi kanonik yang sebenarnya.

6. Kesimpulan: Bahwasannya konten duplikat harus diperbaiki

Konten duplikat terjadi di mana-mana bagi orang yang mempunyai Situs web. Pasti hampir Semua situs web memiliki duplikat konten meskipun itu kecil [sedikit]. Ini adalah sesuatu yang harus Anda perhatikan terus-menerus, tetapi bisa diperbaiki, dan hasilnya bisa wouuwww. Konten berkualitas Anda dapat tumbuh secara sertifikan di peringkat Situs web, hanya dengan menyingkirkan duplikat konten dari situs Anda!

Dan semoga tutorial ini dapat mengembangkan Situs web Anda menjadi lebih baik di mesin pencari.

Achyar

Panduan Blog

Leave a Reply

Your email address will not be published.