Πώς οργανώνει τις πληροφορίες και κατατάσσει τις ιστοσελίδες η Google;

H Google είναι μια από τις μεγαλύτερες εταιρείες διαδικτυακών υπηρεσιών. Ο στόχος της είναι να οργανώσει όλες τις πληροφορίες του κόσμου και να τις κάνει παγκόσμια διαθέσιμες. Πώς λειτουργεί; Πως κάνει crawling, indexing, serving και ranking;

Είμαι ο Ουστάς Ανδρέας και σας καλωσορίζω σε μια σειρά άρθρων στον κόσμο του Digital Marketing και του SEO. Από που αντλεί πληροφορίες η Google; Η Google αντλεί πληροφορίες όσον αφορά τους ιστότοπους από διαφορετικές πηγές όπως: Web pages, περιεχόμενο που υπέβαλε ο χρήστης όπως Google My Business και Maps, Book scanning, Public databases στο διαδίκτυο και πολλές άλλες πηγές.

Ποια είναι τα τρία βασικά βήματα που ακολουθεί η Google:

Crawling

Το πρώτο βήμα είναι να βρει ό, τι σελίδες υπάρχουν στο web. Δεν υπάρχει ένα κεντρικό «αρχείο» όπου να υπάρχουν όλα τα web pages, έτσι η Google πρέπει συνεχώς να ανιχνεύει τις καινούργιες σελίδες και να τις προσθέτει στη λίστα με τις ήδη υπάρχουσες. Αυτή η διαδικασία λέγεται Crawling.

Ορισμένες σελίδες είναι γνωστές επειδή η Google τις έχει ήδη κάνει crawl (ανιχνεύσει). Άλλες σελίδες ανακαλύπτονται όταν η Google ακολουθεί ένα link από μια γνωστή σελίδα σε μια νέα σελίδα. Ακόμα, άλλες σελίδες ανακαλύπτονται όταν υποβληθεί μια λίστα με σελίδες (ένα sitemap) για να ανιχνεύσει η Google.

Αν χρησιμοποιηθεί ένα managed web host, όπως το Wix ή το Blogger, μπορεί να πει στην Google να ανιχνεύσει τυχόν ενημερωμένες ή νέες σελίδες που γίνονται. Το πρόγραμμα που κάνει αυτή τη διαδικασία είναι το Googlebot (spider). Το Googlebot χρησιμοποιεί μια αλγοριθμική διαδικασία: τα προγράμματα υπολογιστών καθορίζουν ποιοι ιστότοποι θα ανιχνεύσουν, πόσο συχνά και πόσες σελίδες θα φέρονται από κάθε ιστότοπο.

Νέοι ιστότοποι, αλλαγές σε υπάρχοντες ιστότοπους και dead links σημειώνονται και χρησιμοποιούνται για την ενημέρωση του ευρετηρίου της Google.

Indexing

Το Googlebot επεξεργάζεται κάθε μία από τις σελίδες που ανιχνεύει, προκειμένου να συγκεντρώσει ένα τεράστιο ευρετήριο όλων των λέξεων που βλέπει και της τοποθεσίας τους σε κάθε σελίδα. Επιπλέον, επεξεργάζεται τις πληροφορίες που περιλαμβάνονται σε ετικέτες και ιδιότητες βασικού περιεχομένου, όπως ετικέτες <title> και alt attributes.

Το Googlebot μπορεί να επεξεργαστεί πολλούς, αλλά όχι όλους, τύπους περιεχομένου. Για παράδειγμα, δεν μπορεί να επεξεργαστεί το περιεχόμενο ορισμένων rich media file. Κάπου μεταξύ του crawling και indexing, η Google καθορίζει εάν μια σελίδα είναι duplicate ή canonical μιας άλλης σελίδας. Εάν η σελίδα θεωρείται αντίγραφο, θα ανιχνευθεί λιγότερο συχνά.

Σημείωση: η Google δεν κάνει index σελίδες με noindex directive (header ή tag). Ωστόσο, πρέπει να μπορεί να δει την οδηγία, εάν η σελίδα δεν είναι προσβάσιμη από ένα robots.txt file, μια login page ή άλλη συσκευή, Είναι πιθανό η σελίδα να έχει γίνει index ακόμα και εάν η Google δεν την επισκέφτηκε!

Serving (and ranking)

Όταν ένας χρήστης πληκτρολογεί ένα query (ερώτημα), η Google προσπαθεί να βρει την πιο σχετική απάντηση από το «index» της βάσει πολλών παραγόντων. Η Google προσπαθεί να προσδιορίσει τις απαντήσεις υψηλότερης ποιότητας και να λάβει υπόψη άλλες εκτιμήσεις που θα παρέχουν το καλύτερο user experience και την πιο κατάλληλη απάντηση, εξετάζοντας θέματα όπως η τοποθεσία, η γλώσσα και η συσκευή του χρήστη.

Το Ranking γίνεται προγραμματιστικά. Η Google εξετάζει το user experience στην επιλογή και την κατάταξη των αποτελεσμάτων, οπότε πρέπει η σελίδα να φορτώνεται γρήγορα και να είναι φιλική προς το κινητό.

Κλείνοντας, θα ήθελα να διαβάσετε τα τρία βασικά βήματα που ακολουθεί η αναζήτηση Google για να οργανώσει τις πληροφορίες και να κάνει κατάταξη μία ιστοσελίδα, ώστε σε επόμενα άρθρα να κατανοήσουμε καλύτερα τις διάφορες πτυχές του Digital Marketing και του SEO!

Πηγή: Epixeiro.gr