Πώς αξιολογούν τα εργαλεία αναζήτησης τις web σελίδες
28/11/2002 (Μια ματιά στο Link popularity ranking)
Γιώργος Επιτήδειος,
gepiti@gepiti.com
Αν εκτελέσετε μια αναζήτηση στο Google με τη λέξη Civilization αυτή η πολύ χρήσιμη και δημοφιλής μηχανή αναζήτησης θα σας εμφανίσει την πρώτη δεκάδα από 1.330.000 αποτελέσματα, ενώ αν κάνετε το λάθος και δοκιμάσετε τη λέξη Sex θα σας προταθεί η πρώτη δεκάδα από 247.000.000 αποτελέσματα!
Τις παλαιότερες εποχές, οι μηχανές αναζήτησης εξέταζαν το περιεχόμενο κάθε σελίδας και με διάφορα κριτήρια (π.χ. θέση και είδος των λέξεων που αυτή περιείχε) τις "βαθμολογούσαν" και μας παρουσίαζαν εκείνες που είχαν τις περισσότερες πιθανότητες να περιέχουν ποιοτικό και χρήσιμο περιεχόμενο.
Δυστυχώς το σύστημα αυτό δεν έφτασε ποτέ σε ικανοποιητικό επίπεδο λειτουργικότητας καθώς:
1. Είναι πολύ δύσκολο για έναν υπολογιστή να κρίνει την αξία ενός κείμενου.
2. Τα κριτήρια που χρησιμοποιούσε κάθε μηχανή γίνονταν γρήγορα αντιληπτά από τους search engine spammers οι οποίοι πάντα κατάφερναν να φέρνουν στην κορυφή των αποτελεσμάτων τις σελίδες που ήθελαν εκείνοι και όχι αυτές που είχαν περισσότερες πιθανότητες να ενδιαφέρουν τους χρήστες κάθε μηχανής αναζήτησης.
Έτσι, εμφανίστηκε μια νέα γενιά μηχανών (π.χ. Google, Teoma κ.λπ.) που αξιολογεί πλέον τις σελίδες βασισμένη όχι στο περιεχόμενο αλλά στη δημοτικότητα κάθε σελίδας. Και όταν λέμε δημοτικότητα δεν εννοούμε πόσοι χρήστες βλέπουν τη σελίδα (αυτό το γνωρίζει μόνο ο διαχειριστής κάθε site). Οι νέες μηχανές ενδιαφέρονται για το Link Popularity δηλαδή για το πόσες άλλες σελίδες στο Internet περιέχουν παραπομπές προς τη σελίδα που πιθανώς να ενδιαφέρει τον χρήστη.
Για παράδειγμα, ας υποθέσουμε ότι ψάχνουμε με τις λέξεις perl hash duplicates και ότι οι λέξεις αυτές υπάρχουν τόσο στη σελίδα Α όσο και στη σελίδα Β. Αν λοιπόν υπάρχουν 10 παραπομπές από άλλα σημεία του δικτύου (από άλλες σελίδες) προς την Α, αλλά μόνο 5 προς την Β τότε η Α θα λάβει υψηλότερη βαθμολογία και θα εμφανιστεί στο χρήστη πάνω από την Β, παρόλο που και οι δύο περιέχουν όλες τις λέξεις που ζήτησε εκείνος.
Το σύστημα αυτό έχει πολλά πλεονεκτήματα:
Είναι δημοκρατικό - Ουσιαστικά οι webmasters όλων των sites του δικτύου "ψηφίζουν" με τις παραπομπές τους τα sites που θεωρούν καλύτερα (σπάνια θα δημιουργήσει κανείς παραπομπές προς sites που δεν είναι αξιόλογα ή δεν είναι σχετικά με το περιεχόμενο των δικών του σελίδων).
Είναι αξιοκρατικό - Όλες οι "ψήφοι" δεν είναι ίδιες. Ένα link από site στο οποίο παραπέμπουν πολλοί (δηλαδή από site με πολύ και ποιοτικό υλικό) έχει μεγαλύτερη αξία από ένα link που βρίσκεται σε site χαμηλής δημοτικότητας. Επιπρόσθετα, η αξία των links καθορίζεται και με βάση το κείμενο που υπάρχει γύρω από αυτά.
Είναι δίκαιο - Links από άλλες σελίδες του ίδιου site "δεν μετράνε", ενώ κάθε σελίδα τρίτου site έχει μόνο μια "ψήφο", δηλαδή από όλες τις παραπομπές που περιέχει μόνο μια θα μετρήσει υπέρ του site στο οποίο οδηγεί. Μάταια λοιπόν οι link spammers (υπάρχουν και τέτοιοι) φτιάχνουν εικονικά sites γεμάτα σελίδες με παραπομπές προς το site που θέλουν να διαφημίσουν, ελπίζοντας ότι έτσι θα βελτιώσουν τη θέση του στη γενική κατάταξη.
Φυσικά, ακόμη και αυτό το σύστημα μπορεί να εξαπατηθεί. Για να συμβεί όμως αυτό, θα πρέπει ο ενδιαφερόμενος να έρθει σε συμφωνίες συνεργασίας με πολλά και ποιοτικά sites, κάτι εξαιρετικά δύσκολο και χρονοβόρο. Ίσως λοιπόν το search engine spamming να έφτασε πια στο τέλος του.
Από την άλλη μεριά βέβαια η σύγχρονη τεχνολογία μας έχει συνηθίσει πλέον σε εντυπωσιακές εκπλήξεις, απρόσμενες ανακαλύψεις και δραματικές ανατροπές. Ποτέ μην λες ποτέ λοιπόν.
Γιώργος Επιτήδειος
Δημοσιοποιήσετε τα σχόλια και τις παρατηρήσεις σας γι' αυτό τα άρθρο
Επιστροφή στο Αρχείο ’ρθρων Παλαιών Τευχών Επιστροφή στις Επιχειρηματικές Σελίδες © 2005 Γιώργος Επιτήδειος Υποδείξεις, Ερωτήσεις, Σχόλια στην διεύθυνση gepiti@gepiti.com |