Proses Search Engine : Crawling, Indexing, dan Ranking
Memahami cara kerja proses search engine mulai dari Crawling, Indexing, dan Ranking berguna bagi praktisi SEO, karena membantu mereka menentukan tindakan apa yang harus diambil untuk mencapai tujuan mereka. Bagian ini terutama membahas cara Google dan Bing beroperasi, dan tidak selalu berlaku untuk mesin pencari lain yang populer di negara lain, seperti Yandex (Rusia), Baidu (Cina), Seznam (Republik Ceko), dan Naver (Korea) .
Search engine harus menjalankan banyak tugas dengan sangat baik untuk memberikan hasil pencarian yang relevan. Sederhananya, Anda dapat menganggap ini sebagai:
- Men-Crawling dan meng-indeks triliunan dokumen (halaman dan file) di Web (perhatikan bahwa mereka mengabaikan halaman yang mereka anggap “tidak penting”, mungkin karena halaman dianggap tidak menambahkan nilai baru atau tidak dirujuk sama sekali di Web).
- Menanggapi permintaan pengguna dengan memberikan daftar halaman yang relevan.
Di bagian ini, kita akan menelusuri dasar-dasar fungsi ini dari perspektif nonteknis. Bagian ini akan dimulai dengan membahas bagaimana search engine mencari dan menemukan konten.
Proses Search Engine Crawling dan Indexing
Untuk menawarkan hasil terbaik, proses search engine harus berupaya menemukan semua laman publik di World Wide Web dan kemudian menampilkan laman yang paling sesuai dengan kueri penelusuran pengguna. Langkah pertama dalam proses ini adalah merayapi Web. Search engine mulai dengan kumpulan situs unggulan yang dikenal berkualitas sangat tinggi, lalu mengunjungi tautan di setiap halaman situs tersebut untuk menemukan halaman web lain.
Struktur tautan Web berfungsi untuk menyatukan semua halaman yang dipublikasikan sebagai hasil dari seseorang yang menautkannya. Melalui tautan, robot otomatis mesin pencari, yang disebut crawler atau spider, dapat menjangkau triliunan dokumen yang saling berhubungan.
Search engine kemudian akan memuat halaman-halaman lain itu dan menganalisis konten itu juga. Proses ini berulang-ulang hingga proses crawling selesai. Proses ini sangat kompleks, karena Web adalah tempat yang besar dan kompleks.
Catatan: search engine tidak mencoba merayapi seluruh Web setiap hari. Bahkan, mereka mungkin menyadari halaman yang mereka pilih untuk tidak dirayapi karena halaman tersebut kemungkinan tidak cukup penting untuk ditampilkan dalam hasil pencarian. Kita akan membahas peran penting dalam “Retrieval and Ranking” di bagian selanjutnya.
Langkah pertama dalam proses search engine ini adalah membangun indeks istilah. Ini adalah database besar yang mengkatalogkan semua istilah penting pada setiap halaman yang dirayapi oleh search engine.
Banyak data lain juga dicatat, seperti peta semua halaman yang ditautkan ke setiap halaman, teks yang dapat diklik dari tautan tersebut (dikenal sebagai Anchor teks), apakah tautan tersebut dianggap iklan atau tidak, dan banyak lagi.
Untuk menyelesaikan tugas monumental menyimpan data pada ratusan triliun halaman yang dapat diakses dalam sepersekian detik, search engine telah membangun pusat data besar untuk menangani semua data ini.
Salah satu konsep kunci dalam membangun mesin telusur adalah memutuskan dari mana harus memulai perayapan Web. Meskipun secara teoritis Anda dapat memulai dari banyak tempat berbeda di Web, idealnya Anda akan memulai penjelajahan Anda dengan sekumpulan situs web unggulan yang tepercaya.
Dimulai dengan sekumpulan situs web yang dikenal dan tepercaya memungkinkan search engine mengukur seberapa besar kepercayaan mereka terhadap situs web lain yang mereka temukan melalui proses perayapan. Kami akan membahas peran kepercayaan dalam algoritme pencarian secara lebih rinci di “Bagaimana Tautan Secara Historis Mempengaruhi Peringkat Search Engine”.
Retrieval dan Ranking
Langkah berikutnya dalam pencarian ini terjadi ketika search engine mengembalikan daftar halaman yang relevan di Web dalam urutan yang diyakini paling mungkin untuk memuaskan pengguna. Proses ini membutuhkan search engine untuk menjelajahi kumpulan ratusan miliar dokumen mereka dan melakukan dua hal: pertama, hanya mengembalikan hasil yang terkait dengan permintaan pencari; dan kedua, beri peringkat hasil dalam urutan kepentingan yang dirasakan (dengan mempertimbangkan kepercayaan dan otoritas yang terkait dengan situs). Ini adalah relevansi dan pentingnya bahwa proses SEO dimaksudkan untuk mempengaruhi.
Relevansi adalah sejauh mana konten dokumen yang dikembalikan dalam pencarian cocok dengan maksud dan istilah kueri pengguna. Relevansi dokumen meningkat jika halaman berisi istilah yang relevan dengan frasa yang ditanyakan oleh pengguna, atau jika tautan ke halaman berasal dari halaman yang relevan dan menggunakan anchor text yang relevan.
Anda dapat menganggap relevansi sebagai langkah pertama untuk menjadi “dalam permainan”. Jika Anda tidak relevan dengan kueri, search engine tidak menganggap Anda disertakan dalam hasil penelusuran untuk kueri tersebut. Kami akan membahas bagaimana relevansi ditentukan secara lebih rinci dalam “Menentukan Niat Pencari dan Menyampaikan Konten yang Relevan dan Segar”.
Kepentingan mengacu pada kepentingan relatif, diukur melalui kutipan (tindakan satu karya yang merujuk pada karya lain, seperti yang sering terjadi dalam dokumen akademik dan bisnis), dari dokumen tertentu yang sesuai dengan permintaan pengguna. Pentingnya dokumen yang diberikan meningkat dengan setiap dokumen lain yang merujuknya. Dalam lingkungan online saat ini, kutipan dapat datang dalam bentuk tautan ke dokumen atau referensi ke situs media sosial. Menentukan bagaimana bobot sinyal ini dikenal sebagai analisis kutipan.
Anda dapat memikirkan pentingnya sebagai cara untuk menentukan halaman mana, dari grup halaman yang sama-sama relevan, muncul pertama di hasil pencarian, yang kedua, dan seterusnya. Otoritas relatif situs, dan kepercayaan yang dimiliki mesin telusur di dalamnya, merupakan bagian penting dari penentuan ini. Tentu saja, persamaannya sedikit lebih rumit dari ini, dan tidak semua halaman sama-sama relevan. Pada akhirnya, kombinasi relevansi dan kepentinganlah yang menentukan urutan peringkat.
Sumber rekomendasi : https://searchengineland.com/
Baca juga rekomendasi tulisan terkait optimasi dan proses search engine dibawah ini:
No comment