Pages

Wednesday, November 19, 2014

Cara Cek Artikel yang Dicopas (Duplikat) Dengan Kueri Google

Sebagai seorang blogger sekaligus pencipta konten (artikel blog), anda memiliki berbagai resiko atas konten tersebut, salah satunya adalah duplikasi atau penggandaan artikel anda ke halaman web/blog lain (dengan kata lain: copas [copy-paste]). Banyak sobat blogger yang bertanya tentang cara saya menemukan blog yang memuat ulang artikel saya. Apakah ada alat khusus? Apakah ada alat otomatis? Ya, ada sebenarnya. Tapi sebagian besar artikel copas yang saya temukan justru merupakan hasil dari pencarian di Google, baik secara tidak sengaja maupun dengan menggunakan kueri-kueri dan fitur perintah pencarian tertentu. Itupun sebenarnya tidak dikhususkan untuk mencari artikel copas. Tapi dengan menggunakan kueri dan fitur pencarian tersebut, upaya melacak artikel copas menjadi sangat mudah.

Image by: webconfs.com
Pertanyaan pertama: untuk apa kita mencari konten duplikat? Dua konten sejenis di dua halaman berbeda, baik pada blog/web yang sama maupun di dua blog/web berbeda dapat menyebabkan penalti Google, karena duplikasi konten dianggap merusak hasil pencarian (disamping masalah hak cipta). Sayangnya, meskipun Google telah begitu jeli dalam mendeteksi konten duplikat dan mana yang harus dihapus atau diturunkan posisinya, tidak ada jaminan bahwa konten yang asli akan berada di atas tanpa optimasi yang tepat dari pemiliknya. Kejadian yang sering muncul adalah halaman konten/artikel anda harus bersaing dengan duplikasi artikel anda sendiri yang dimuat di web/blog lain. Tidak jarang konten copas bisa berada di atas konten asli dalam suatu rentang waktu, sebelum Google mengendus dan menghapusnya. Ini tentu menjengkelkan. Yang lebih menjengkelkan lagi adalah apabila ternyata halaman konten anda sendiri, yang notabene merupakan karya asli, justru terkena imbas penurunan atau penghapusan. Jadi, selain efeknya buruk dalam hal hak cipta dan etika, masalah ini juga bisa mempengaruhi seo blog anda. Runyam bukan?

Pertanyaan kedua yang muncul adalah: seberapa efektifkah cara ini? Cukup efektif, meskipun yaaa, cara ini terbilang manual, dibanding berbagai tool otomatis, tapi akurasinya 100%! Semua yang tersimpan di database pencarian Google dapat kita lacak tanpa perlu mendaftar, bahkan pada beberapa layanan lain harus membayar, bukan?
Berikut 4 cara yang biasa saya gunakan dan cukup efektif:

1. Menggunakan sebaris atau 2 baris kalimat di dalam konten sebagai kueri pencarian
Ambil bagian tertentu pada artikel anda, misalnya sebaris atau dua baris kalimat yang menurut anda cukup generik. Coba ambil dari paragraf pertama, namun catatannya, biasanya para copaser cukup lihai dan jeli dalam mengedit paragraf pertama dan terakhir untuk memberik kesan unik. Oleh karena itu saran saya ambil bagian tertentu pada bagian tengah (misalnya paragraf 3 atau 4), karena biasanya mereka malas untuk melakukan editing di bagian tengah, apalagi jika bagian itu merupakan bagian penting dan susah diedit. Anda mungkin harus melakukan beberapa pencarian dengan kueri berbeda yang diambil dari paragraf berbeda. Dari kasus yang saya temukan, kebanyakan malas melakukan editing, sehingga cara ini cukup efektif apabila anda ingin segera mengetahui apakah ada duplikasi konten atau tidak.
Contoh kueri pencarian :
Dua konten sejenis di dua halaman berbeda, baik pada blog/web yang sama maupun di dua blog/web berbeda dapat menyebabkan penalti Google
Perlu diperhatikan bahwa Google membatasi kueri pencarian hingga 32 kata dengan mengabaikan stop words seperti di, dan, yang, serta sejenisnya; jadi perhitungkan benar kueri yang digunakan. Ini merupakan cara pertama yang biasa saya gunakan apabila ingin cepat-cepat melakukan cek. Kelemahannya, terkadang halaman-halaman yang memiliki SEO kuat bisa masuk ke halaman pertama meski memiliki rangkaian kata yang berbeda jauh.
2. Mengerucutkan pencarian (exact match keywords) dengan membubuhkan tanda kutip
Kueri:
"beberapa rangkaian kata di sini"
Fungsi dari tanda kutip adalah untuk memberi perintah pada mesin pencari Google untuk mencari rangkaian kata yang sama persis (keseluruhan string) dan mengabaikan yang lainnya; sehingga hasil pada halaman pencarian tertinggi akan memuat halaman-halaman web yang memiliki/memuat rangkaian kata yang sama persis. Dengan cara ini, anda akan menemukan halaman-halaman yang memuat konten anda sama persis dan dengan mudah pula melacaknya secara langsung tanpa menduga-duga apakah itu copas atau bukan. Anda dapat menggunakan kueri yang sama seperti cara pertama di atas, misalnya apabila anda ingin mengerucutkan hasil pencarian, dengan ditambah dengan tanda kutip.
Contoh kueri pencarian:
"Dua konten sejenis di dua halaman berbeda, baik pada blog/web yang sama maupun di dua blog/web berbeda dapat menyebabkan penalti Google"

3. Menggunakan operator "intitle"
Kueri:

intitle:judul artikel/halaman
Tidak jarang para tukang copas melakukan duplikasi secara mentah-mentah, termasuk judul artikel (title tag). Anda bisa menggunakan sebuah judul artikel blog anda sebagai kueri untuk mengecek apakah ada duplikasi konten demikian.
Contoh kueri pencarian:
intitle:Cara Cek Artikel yang Dicopas (Duplikat) Menggunakan Google
Anda juga bisa memanfaatkan tanda kutip untuk menekankan exact mact keyword pada judul.
Tentu saja, hasil yang didapat di hasil pencarian tidak serta merta merupakan duplikat. Bisa jadi judul yang sama memiliki konten berbeda, dan ini sangat mungkin ditemukan. Tapi biasanya sebuah judul artikel tetap saja unik, disusun berdasarkan gaya penulisan anda. Jadi kesempatan untuk menemukan duplikasi konten berdasarkan judul yang digunakan tetap besar. Saya pribadi suka pakai cara ini untuk menemukan konten-konten yang dicopas secara mentah-mentah.
4. Menggunakan operator "inurl"
Kueri:

inurl:url-file-halaman
Sama halnya dengan "intitle", "inurl" dapat digunakan untuk mencari duplikasi konten, khususnya yang dilakukan oleh robot (misalnya autoblog). Pemilik autoblog sangat mungkin mengubah judul artikel, tapi biasanya mereka tidak mau repot-repot mengubah url (bahkan sebenarnya tidak mau repot-repot melakukan keduanya) sehingga kesempatan untuk menemukan konten duplikat dengan cara ini cukup efektif. Anda akan melihat di hasil pencarian bagian url yang memiliki keyword sama persis akan dicetak tebal.

Contoh kueri pencarian:
inurl:tips-menulis-artikel-seo-friendly
Itu adalah 4 cara yang biasa saya gunakan untuk melacak duplikasi konten, baik karena copas, robot autoblog, maupun untuk melacak duplikasi konten di blog sendiri. Sebenarnya ada satu fitur Google Webmaster Tools yang juga berfungsi khusus terkait masalah duplikasi ini. Bagi anda yang sudah melakukan verifikasi kepemilikan blog ke Google Webmaster Tools (untuk blog blogger sekarang sudah otomatis verified jika anda punya akun Google valid), telah melakukan verifikasi authorship via Google plus, dan telah memiliki Author Rank (memiliki label penulis valid), Google akan memberikan notifikasi via Webmaster Tools mengenai deteksi duplikasi konten oleh web/blog lain. Saya pernah beberapa kali mendapatkan notifikasi demikian. Tapi biasanya butuh waktu lama dari jarak artikel dicopas dan diterbitkan, jadi menurut saya kurang efektif dibanding cara-cara di atas. Ke depan akan saya bahas mengenai ini.
Di balik kemudahan cara-cara di atas, ada satu hal yang perlu diperhatikan. Terkadang posting atau artikel yang sudah cukup lama diterbitkan memiliki prioritas indeks yang sangat rendah, bahkan tidak bisa ditemukan di indeks Google. Jika kasusnya demikian, saran saya gunakan copyscape.com, plagiarismdetect.com, plagspotter.com, dll. Jika ingin melakukan tindakan komplain dan klaim, dan kebetulan blog/web yang copas artikel anda menggunakan Blogger, anda bisa melangkah lebih lanjut melalui DMCA Blogger.
© copyright Ahmad Khoirul Azmi, published only for buka-rahasia.blogspot.com.

0 comments:

Post a Comment