Παρουσίαση των τριών σταδίων της Αναζήτησης ενός website ή Blog από την Google

 

Η Αναζήτηση της Google λειτουργεί σε τρία στάδια και δεν τα καταφέρνουν όλες οι σελίδες σε κάθε στάδιο:

  1. Ανίχνευση: ( Crawling ) Η Google κατεβάζει κείμενο, εικόνες και βίντεο από σελίδες που βρήκε στο διαδίκτυο με αυτοματοποιημένα προγράμματα που ονομάζονται crawlers.
  2. Ευρετηρίου: (Indexing ) Η Google αναλύει το κείμενο, τις εικόνες και αρχεία βίντεο στη σελίδα και αποθηκεύει τις πληροφορίες στο ευρετήριο Google, το οποίο είναι μια μεγάλη βάση δεδομένων.
  3. Προβολή αποτελεσμάτων αναζήτησης: ( Serving search results ) Όταν ένας χρήστης πραγματοποιεί αναζήτηση η Google επιστρέφει πληροφορίες που σχετίζονται με το ερώτημα του χρήστη.

Το πρώτο στάδιο είναι να μάθει ποιες σελίδες υπάρχουν στο Webpage ή Blog μας.

Δεν υπάρχει κεντρικό μητρώο από όλες τις ιστοσελίδες, οπότε η Google πρέπει να αναζητά συνεχώς νέες και ενημερωμένες σελίδες και να τις προσθέτει στις λίστα γνωστών σελίδων.

 Αυτή η διαδικασία ονομάζεται "εντοπισμός URL" ( URL discovery Ορισμένες σελίδες είναι γνωστές επειδή η Google τους έχει ήδη επισκεφθεί. 

Άλλες σελίδες ανακαλύπτονται όταν η Google ακολουθεί έναν σύνδεσμο από μία ήδη γνωστή σελίδα σε μια νέα σελίδα: 

Ετσι για παράδειγμα, μια σελίδα ενότητας, όπως μια σελίδα κατηγορίας, συνδέσεις σε μια νέα ανάρτηση ιστολογίου λ.χ. σε ένα Blog ή σε ένα Link.

Ακόμα, άλλες σελίδες ανακαλύπτονται όταν υποβάλλετε μια λίστα σελίδων (έναν χάρτη ιστοτόπου) για ανίχνευση από την Google.

Μόλις η Google ανακαλύψει το URL μιας σελίδας, μπορεί να επισκεφτεί (ή να "ανιχνεύσει") τη σελίδα για να μάθει τι υπάρχει αυτό. Χρησιμοποιεί ένα τεράστιο σύνολο υπολογιστών για να ανιχνεύσουμε δισεκατομμύρια σελίδες στον ιστό. Το πρόγραμμα που η λήψη ονομάζεται Googlebot ( Ή καλύτερα γνωστό ως : robot, bot, ή spider ). 

Το Googlebot χρησιμοποιεί μια αλγοριθμική διαδικασία για τον προσδιορισμό ποιους ιστότοπους θα ανιχνεύσετε, πόσο συχνά και πόσες σελίδες θα λάβει από κάθε ιστότοπο.

 Τα προγράμματα ανίχνευσης της Google είναι επίσης προγραμματισμένα έτσι ώστε να προσπαθούν να μην ανιχνεύουν τον ιστότοπο πολύ γρήγορα για να αποφύγουν την υπερφόρτωση. 

Αυτός ο μηχανισμός βασίζεται στις αποκρίσεις του ιστότοπου (για παράδειγμα, τα σφάλματα HTTP 500 σημαίνουν "επιβράδυνση") και ρυθμίσεις στο Search Console.

Ωστόσο, το Googlebot δεν ανιχνεύει όλες τις σελίδες που ανακάλυψε.

Ορισμένες σελίδες ενδέχεται να μην επιτρέπονται για ανίχνευση από τους κατόχους του ιστοτόπου ( website), άλλες σελίδες ενδέχεται να μην είναι προσβάσιμες χωρίς σύνδεση στον ιστότοπο και άλλες σελίδες ενδέχεται να είναι διπλότυπες των σελίδων που ανιχνεύθηκαν προηγουμένως.

Ετσι για παράδειγμα, πολλοί ιστότοποι είναι προσβάσιμοι μέσω του www () και έκδοση εκτός www του ονόματος τομέα, παρόλο που το περιεχόμενο είναι πανομοιότυπο και στις δύο εκδόσεις.www.example.comexample.com

Κατά τη διάρκεια της ανίχνευσης, η Google αποδίδει τη σελίδα και εκτελεί οποιαδήποτε JavaScript εντοπίσει χρησιμοποιώντας μια πρόσφατη έκδοση του Chrome, παρόμοια με τον τρόπο με τον οποίο το πρόγραμμα περιήγησής σας αποδίδει τις σελίδες που επισκέπτεστε. 

 Η απόδοση είναι σημαντική επειδή οι ιστότοποι συχνά βασίζονται σε JavaScript για να φέρουν περιεχόμενο στη σελίδα, και χωρίς απόδοση η Google ενδέχεται να μην βλέπει αυτό το περιεχόμενο.

Η ανίχνευση εξαρτάται από το αν τα προγράμματα ανίχνευσης της Google μπορούν να έχουν πρόσβαση στον ιστότοπο. 

Ορισμένα συνηθισμένα προβλήματα με websites που θα ήθελαν να έχουν την δυνατότητα ανίχνευσης και πρόσβασης στο Googlebot περιλαμβάνουν:

Η κανονική σελίδα είναι αυτή, που μπορεί να εμφανίζεται στα αποτελέσματα αναζήτησης. 

Για να επιλέξει το κανονικό, η Google πρώτα ομαδοποιεί τις σελίδες που βρήσκει στο διαδίκτυο που έχουν παρόμοιο περιεχόμενο και στη συνέχεια επιλέγει αυτό που είναι πιο αντιπροσωπευτικό της ομάδας.

 Οι άλλες σελίδες της ομάδας είναι Εναλλακτικές εκδόσεις που ενδέχεται να προβάλλονται σε διαφορετικά περιβάλλοντα, όπως εάν ο χρήστης πραγματοποιεί αναζήτηση από μια κινητή συσκευή ή αναζητούν μια πολύ συγκεκριμένη σελίδα από αυτό το σύμπλεγμα.

Η Google συλλέγει επίσης σήματα σχετικά με την κανονική σελίδα και τα περιεχόμενά της, τα οποία μπορούν να χρησιμοποιηθούν σε το επόμενο στάδιο, όπου εξυπηρετεί τη σελίδα στα αποτελέσματα αναζήτησης. 

Ορισμένα σήματα περιλαμβάνουν τη γλώσσα της σελίδας, τη χώρα στην οποία το περιεχόμενο είναι τοπικό, τη χρηστικότητα της σελίδας και ούτω καθεξής.

Οι πληροφορίες που συλλέγονται σχετικά με την κανονική σελίδα και το σύμπλεγμα της ενδέχεται να αποθηκεύονται στο Google index, μια μεγάλη βάση δεδομένων που φιλοξενείται σε χιλιάδες υπολογιστές.

Former Google data center in Eemshaven, Netherlands

Δείτε για Google datacenters

 Η δημιουργία ευρετηρίου δεν είναι εγγυημένη δηλαδή ΔΕΝ είναι σίγουρο ότι  κάθε σελίδα που επεξεργάζεται η Google θα ευρετηριαστεί ( θα μπει στον κατάλογο Index ).

Η δημιουργία ευρετηρίου εξαρτάται επίσης από το περιεχόμενο της σελίδας και τα μεταδεδομένα της. 

Ορισμένα συνηθισμένα ζητήματα δημιουργίας ευρετηρίου μπορεί να περιλαμβάνει:


Αθήνα 15 Νοεμβρίου 2022. Πηγή Google.  Editing by Billy Kasis

Writer: Billy Kasis (Marketing and Digital Guru, find me on Google).

Facebook Digital marketing and Branding 2023:

LinkedIn banner for Billy Kasis Digital Marketing and Brand

Billy Kasis Ελληνικό κανάλι Video


Contact form Billy Kasis banner.

Comments