Μηχανές αναζήτησης στο Διαδίκτυο: ανασκόπηση δημοφιλών και ελάχιστα γνωστών μηχανών αναζήτησης

Σύνολο

Εισαγωγή

Λίγοι άνθρωποι μπορούν πλέον να φανταστούν το Διαδίκτυο χωρίς αναζήτηση, αποτελέσματα αναζήτησης και συστήματα αναζήτησης πληροφοριών (IRS) που τα οργανώνουν όλα. Αλλά μέχρι πρόσφατα, όλες οι πληροφορίες του Διαδικτύου χωρούσαν σε αρκετούς καταλόγους, τα ονόματα των οποίων είναι ακόμα γνωστά (DMOZ, Yahoo).

Σήμερα, ο όγκος των πληροφοριών στο Διαδίκτυο είναι τόσο τεράστιος που είναι αδύνατο να χωρέσει σε κανέναν κατάλογο. Για την επεξεργασία, την αποθήκευση πληροφοριών και την οργάνωση αναζητήσεων, έχουν δημιουργηθεί και συνεχίζουν να δημιουργούνται ισχυρά προϊόντα λογισμικού, τα οποία ονομάζουμε μηχανές αναζήτησης (SE). Κάθε μηχανή αναζήτησης (μηχανή αναζήτησης) έχει τις δικές της βάσεις δεδομένων, τους δικούς της αλγόριθμους επεξεργασίας, αναζήτησης, κατάταξης και εμφάνισης πληροφοριών.

Οι μηχανές αναζήτησης στο Διαδίκτυο είναι

Μπορεί να δοθεί ο ακόλουθος ακαδημαϊκός ορισμός των μηχανών αναζήτησης. Ένα σύστημα αναζήτησης είναι ένα σύνολο προγραμμάτων και τεχνικών μέσων για την οργάνωση μιας αναζήτησης χρήστη στο Διαδίκτυο, στο οποίο, όταν απαντά σε ένα ερώτημα κειμένου, ο χρήστης λαμβάνει μια λίστα σχετικών (αντίστοιχων με το αίτημα) αποτελεσμάτων.

Η έκδοση γίνεται με τη μορφή λίστας συνδέσμων προς την πηγή πληροφοριών με σύντομη περιγραφή (προεπισκόπηση), μερικές φορές με φωτογραφία.

Για το πρώτο παράδειγμα, ας θυμηθούμε τον παγκόσμιο ηγέτη αναζήτησης "Google" και τον ηγέτη της μηχανής αναζήτησης Runet "Yandex". Εκτός από αυτές τις μηχανές αναζήτησης, μπορείτε να αναφέρετε μια ντουζίνα ακόμα υπάρχουσες μηχανές αναζήτησης, για τις οποίες θα μιλήσουμε παρακάτω.

Γνώμη: Οι μηχανές αναζήτησης Google, Yandex και άλλες δεν είναι παραγωγοί (παραγωγοί) περιεχομένου, αλλά συγκεντρωτές (συσσωρευτές) περιεχομένου και, ως επί το πλείστον, περιεχομένου άλλων ανθρώπων. Αξίζει να θυμάστε ότι η χρήση του περιεχομένου κάποιου άλλου για τη δημιουργία της δικής σας επισκεψιμότητας και τη δημιουργία εσόδων από αυτό μπορεί να χαρακτηριστεί ως «πειρατεία», κάτι που, φυσικά, δεν συμβαίνει στην πραγματικότητα.

Εκτίμηση

  • και η Google μοιράζονται τις δύο πρώτες θέσεις των ηγετών: περίπου 49% και 45%.
  • Τρίτη θέση: Αναζήτηση Mail.ru περίπου 3%.
  • Άλλες μηχανές αναζήτησης επιπλέουν κάτω από 1%.

Κοιτάζω τα στατιστικά στοιχεία στο Google Analytics:

  • yandex/οργανικό 40,26%
  • google/οργανικό 38,93%
  • mail.ru/organic 0,60%
  • rambler/οργανικό 0,52%
  • bing/οργανικό 0,12%

Τα στατιστικά είναι αδυσώπητα: οι αναζητήσεις Yandex χρησιμοποιούνται περισσότερο από όλα και αν σκεφτείτε ότι το 3% είναι ένα καλό αποτέλεσμα σε σύγκριση με το 45%, τότε η αναζήτηση Mail.ru μπορεί να ονομαστεί η τρίτη πιο δημοφιλής.

Από αυτή την άποψη, οι συζητήσεις σχετικά με τη δημοτικότητα των μηχανών αναζήτησης εκτός από το Yandex και το Google μπορούν να αποδοθούν στη δεισιδαιμονία και η ειδική προώθηση ιστότοπων σε άλλες μηχανές αναζήτησης (όχι Yandex και Google) δεν αξίζει προσοχής.

Πώς λειτουργούν οι μηχανές αναζήτησης

Το ερώτημα για το πώς λειτουργούν οι μηχανές αναζήτησης είναι εξίσου συνηθισμένο με το ερώτημα "τι χρώμα είναι ο ουρανός". Εάν ο ουρανός είναι μπλε, τότε οι μηχανές αναζήτησης συλλέγουν πληροφορίες στο Διαδίκτυο, τις επεξεργάζονται, τις κατατάσσουν και τις στέλνουν στον χρήστη με βάση το ερώτημα αναζήτησης.

Η θεωρία της αναζήτησης στο Διαδίκτυο είναι πολύ πιο εκτενής και δεν μπορεί να παρουσιαστεί στο άρθρο. Ωστόσο, τα κύρια σημεία θα μας φανούν χρήσιμα:

Οι μηχανές αναζήτησης στο Διαδίκτυο δεν αποθηκεύουν έγγραφα, δηλαδή δεν κατεβάζουν και ανεβάζουν έγγραφα εντελώς στα αποθετήρια τους.

Οι IRS χρησιμοποιούν το Διαδίκτυο ως αποκεντρωμένο χώρο αποθήκευσης εγγράφων. Οι μηχανές αναζήτησης ανιχνεύουν περιοδικά το Διαδίκτυο, επιλέγουν τις πληροφορίες που χρειάζονται βάσει των αλγορίθμων τους και εν μέρει τις τοποθετούν (τις πληροφορίες) στη βάση δεδομένων τους (Βάση δεδομένων). Αυτό οδηγεί σε πολλά προβλήματα:

  • Τα συστήματα ανάκτησης πληροφοριών δεν χρησιμοποιούν όλες τις πληροφορίες στο Διαδίκτυο, αλλά μόνο μέρος τους.
  • Οι πληροφορίες του Διαδικτύου αλλάζουν συχνά. Περίπου 1.500 χιλιάδες σελίδες προστίθενται την ημέρα, εξ ου και η πιθανή «κενή έξοδος».
  • Υπάρχει μεγάλος αριθμός διπλότυπων (διπλό περιεχόμενο). Δυστυχώς, δεν έχω ακριβή στοιχεία για τις λήψεις και το αναφερόμενο ποσοστό του 25% των λήψεων φαίνεται πολύ υψηλό.
  • Υπάρχει πολλή διαφήμιση, η οποία επίσης παρακάμπτεται από τις μηχανές αναζήτησης.
  • Η "περιπλάνηση" των ρομπότ αναζήτησης στο δίκτυο αυξάνει σημαντικά το φορτίο στους πόρους (δεν ισχύει για τις μηχανές αναζήτησης).
  • Οι περισσότεροι ιστότοποι είναι εμπορικοί (περίπου 83%) και έχουν μικρή πληροφοριακή αξία.

Για αυτούς και ορισμένους άλλους λόγους, η συντριπτική πλειονότητα των συστημάτων ανάκτησης πληροφοριών στο Διαδίκτυο χρησιμοποιεί ένα σχήμα αναζήτησης λέξεων-κλειδιών (μηχανές αναζήτησης), αντί για ένα κλασικό σχήμα αναζήτησης που βασίζεται στην ταξινόμηση πληροφοριών.

Χαρακτηριστικά αναζήτησης λέξεων-κλειδιών

Παρά τους μεταβαλλόμενους αλγόριθμους των μηχανών αναζήτησης, των οποίων η διαφήμιση προσπαθεί να μας πείσει ότι τα μηχανήματα γίνονται πιο έξυπνα και κατανοητά, η βάση της δουλειάς των μηχανών αναζήτησης είναι η αναζήτηση λέξεων-κλειδιών.

Μου αρέσει αυτό το σχέδιο αναζήτησης λέξεων-κλειδιών.

Όπως μπορείτε να δείτε, το έργο των μηχανών αναζήτησης στο Διαδίκτυο βασίζεται στην αναζήτηση νέων εγγράφων (ρομπότ αναζήτησης Spider + Crawler), στην ευρετηρίαση εντοπισμένων εγγράφων (Indexer) και στην εκτέλεση ερωτήματος χρήστη (Search Engine Results Engine). Τα ονόματα των ρομπότ αναζήτησης που χρησιμοποιούνται για αυτούς τους σκοπούς παρατίθενται σε αγκύλες.

Όπως είπα, οι περισσότερες μηχανές αναζήτησης δεν αντιγράφουν το πλήρες κείμενο των εγγράφων στη βάση δεδομένων τους. Για την αναζήτηση, κατά την ευρετηρίαση ενός εγγράφου, δημιουργείται μια εικόνα αναζήτησης. Για να οργανώσει μια αναζήτηση με , το ρομπότ ευρετηρίου δημιουργεί μια εικόνα του εγγράφου χρησιμοποιώντας τη λεγόμενη μέθοδο παράγωγης. Δηλαδή, η εικόνα του εγγράφου περιέχει έναν τίτλο και ένα σύνολο λέξεων-κλειδιών.

Ωστόσο, μπορεί να ειπωθεί με μεγάλη ακρίβεια ότι όλα τα IPS δίνουν προσοχή στα εξής:

  • Παρουσία λέξης κλειδιού στο έγγραφο;</li><li>Η παρουσία ενός κλειδιού στη διεύθυνση URL ή στον τομέα.</li><li>Η παρουσία κλειδιού στον υπότιτλο.</li><li>Συνολικός αριθμός κλειδιών στη σελίδα (πυκνότητα%).</li><li>Παρουσία κλειδιών στην περιγραφή.</li><li>Ποιοι σύνδεσμοι ιστού οδηγούν σε αυτήν τη σελίδα;</li><li>Ποιοι εσωτερικοί σύνδεσμοι υπάρχουν σε αυτήν τη σελίδα;</li> </ul><h2><span>Κατάταξη σελίδας</span></h2><p>Στο τέλος της θεωρίας, αξίζει να αναφερθεί. Πιο συχνά, η κατάταξη σελίδων σε SERP αναφέρεται στο πλαίσιο της συνάφειας. Δηλαδή, οι μηχανές αναζήτησης πρέπει να δημιουργήσουν αποτελέσματα αναζήτησης για να ταιριάζουν με το ερώτημα αναζήτησης όσο το δυνατόν περισσότερο. Όπως γράφει το Yandex, τίποτα δεν πρέπει να χαθεί (πληρότητα της εξόδου) και δεν πρέπει να βρεθεί τίποτα περιττό (ακρίβεια της εξόδου). Βλέπετε πώς γίνεται αυτό στην πράξη κάθε μέρα.</p><h2>συμπέρασμα</h2><ul><li>Οι μηχανές αναζήτησης στο Διαδίκτυο είναι πολύπλοκα προϊόντα λογισμικού, το έργο των οποίων υποστηρίζεται από χιλιάδες ειδικούς και τεράστιους υλικούς πόρους.</li><li>Οι αλγόριθμοι των μηχανών αναζήτησης διατηρούνται μυστικοί, αν και η υποκείμενη εστίαση των ενημερώσεων αλγορίθμων είναι δημόσια διαθέσιμη και φέρει τα κατάλληλα ονόματα.</li><li>Παρά τις διαφορετικές προσεγγίσεις για τη δημιουργία αποτελεσμάτων αναζήτησης, όλες οι μηχανές αναζήτησης βασίζονται στις γενικές αρχές της ευρετηρίασης σελίδων, οι οποίες μέχρι σήμερα παραμένουν βασικές για την προώθηση.</li> </ul><h2><span>Μηχανή αναζήτησης Yandex</span></h2><p>Μια δημοφιλής μηχανή αναζήτησης Runet που συχνά γίνεται η πιο δημοφιλής. Σύμφωνα με στατιστικά στοιχεία του 2009, η Yandex ανιχνεύει συνεχώς 15 εκατομμύρια σελίδες του Runet, επεξεργάζεται 140 χιλιάδες GB δεδομένων κειμένου, 1,6 δισεκατομμύρια μοναδικές εικόνες από 2,1 δισεκατομμύρια φωτογραφίες συνολικά.</p><p>Η μηχανή αναζήτησης Yandex δημιουργήθηκε το 1993. Η λέξη Yandex δεν σημαίνει τίποτα, αν και είναι γενικά αποδεκτό ότι πρόκειται για μετασχηματισμό της λέξης "Index" ή της φράσης "ακόμα ένας δείκτης". Σήμερα, το Yandex.Search επεξεργάζεται ένα τέταρτο του δισεκατομμυρίου αιτημάτων την ημέρα και αν ήταν τόσο ενοχλητικό, θα ήταν η αγαπημένη μου μηχανή αναζήτησης.</p><h2>Αναζήτηση στο Yandex</h2><p>https://yandex.ru/: Η αναζήτηση χρηστών Yandex οργανώνεται στο Διαδίκτυο, λαμβάνοντας υπόψη την περιοχή του χρήστη. Δυνατότητα αναζήτησης με εικόνες, βίντεο, χάρτες, ειδήσεις, ιστολόγια, προϊόντα και λεξικά.</p><p><img src='/uploads/81cdf90374f142a0b848bb428f86180b.png' height="592" width="1276" loading=lazy loading=lazy></p><p>Για λεπτομερείς αναζητήσεις, υπάρχει μια γλώσσα αναζήτησης εδώ (https://yandex.ru/support/search/query-language/).</p><p><img src='/uploads/f9c075b14d6eb3d10ec1251607e73d53.png' height="592" width="876" loading=lazy loading=lazy></p><p>Μηχανές αναζήτησης στο Διαδίκτυο Yandex</p><h2>μηχανή αναζήτησης Google</h2><p>Στη μηχανή αναζήτησης Google η αναζήτηση οργανώνεται χωρίς θέματα (κύρια αναζήτηση) και αναζητήσεις ανά ενότητες: εικόνες, ειδήσεις, χάρτες, βίντεο, αγορές, βιβλία, αεροπορικά εισιτήρια, οικονομικά.</p><p><img src='/uploads/f0c4694c6d8b5679a24edaffa0c222e1.png' height="262" width="822" loading=lazy loading=lazy></p><p>Υπάρχουν ρυθμίσεις:</p><p><b>Ασφαλής αναζήτηση.</b>Σας επιτρέπει να αποκλείετε ακατάλληλο περιεχόμενο και σεξουαλικές εικόνες από τα αποτελέσματα αναζήτησης Google. Αυτή η δυνατότητα δεν εγγυάται 100% προστασία, αλλά κρύβει το μεγαλύτερο μέρος αυτού του περιεχομένου.</p><p><img src='/uploads/566a19c01c71076faba0785473d5588b.png' height="1174" width="1280" loading=lazy loading=lazy></p><p><img src='/uploads/a7233a577c3d32a89fc4043f9128fd5a.png' height="235" width="811" loading=lazy loading=lazy></p><p><b>Ρύθμιση του αριθμού των αποτελεσμάτων</b>ανά σελίδα (προεπιλογή 10).</p><p><b>Προσωπικά αποτελέσματα</b>. Βρείτε συνδέσμους, εικόνες και βίντεο στο Google που έχουν μοιραστεί μαζί σας οι φίλοι σας στα κοινωνικά δίκτυα.</p><p><b>Επιλογή περιοχής</b>. Η προεπιλογή είναι η τρέχουσα περιοχή.</p><p><b>Γλώσσες.</b>Μπορείτε να καθορίσετε τη γλώσσα αναζήτησης.</p><p><b>Προχωρημένη Αναζήτηση.</b>Σας επιτρέπει να κάνετε αναζήτηση χρησιμοποιώντας σύνθετες παραμέτρους.</p><p><b>Εργαλεία.</b>Εδώ μπορείτε να επιλέξετε τη γλώσσα αναζήτησης, να καθορίσετε την ώρα εμφάνισης των πληροφοριών και να επιλέξετε μια ακριβή αντιστοίχιση ή ολόκληρο το αποτέλεσμα αναζήτησης.</p><p><img src='/uploads/64e0fcbab4eab9e65ac9aadaa417f244.png' height="339" width="827" loading=lazy loading=lazy></p><p>Μηχανές αναζήτησης στο Διαδίκτυο Google</p><h2>Μηχανή αναζήτησης αλληλογραφίας</h2><p>https://go.mail.ru/. Εδώ η αναζήτηση οργανώνεται στο Διαδίκτυο (γενική αναζήτηση), ανά βίντεο και εικόνες. Υπάρχει ξεχωριστή αναζήτηση για εφαρμογές για φορητές συσκευές.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Γενική αναζήτηση, αναζήτηση με εικόνες, βίντεο, ειδήσεις, χάρτες.</p><p><img src='/uploads/d28dca3dd59c3ce1b31b2c025c148458.png' height="220" width="806" loading=lazy loading=lazy></p><p><b>Αναζήτηση Yahoo στα ρωσικά</b>. https://ru.search.yahoo.com/. Καθαρή αναζήτηση χωρίς διαφήμιση. Αναζήτηση στο Διαδίκτυο, χρησιμοποιώντας φωτογραφίες και ειδήσεις. Επιλέξτε την ώρα προσθήκης πληροφοριών.</p><h2>Άλλες μηχανές αναζήτησης</h2><ul><li>DuckDuckGo (https://duckduckgo.com/) Έξυπνη αναζήτηση.</li><li>Pipl (https://pipl.com/) Αναζήτηση ατόμων στις Η.Π.Α.</li><li>ευρήματα ( <span>http://www.findsounds.com/ 11 Εργαλεία για την ανάλυση της συνάφειας των σελίδων ιστότοπου με ένα ερώτημα αναζήτησης</span></li> </ul><br> <br> </div> </article> </section> <section id="sidebar" class="secondary clearfix" role="complementary"> <aside id="nav_menu-3" class="widget widget_nav_menu clearfix"> <h3 class="widgettitle"><span>Κατηγορίες</span></h3> <div class="menu-menyu1-container"> <ul id="menu-menyu1" class="menu"> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/beauty/">ομορφιά</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/psychology/">Ψυχολογία</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/internet/">Διαδίκτυο</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/cooking/">Μαγείρεμα</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/fashion-and-style/">Στυλ μόδας</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/finance/">Χρηματοδότηση</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/real-estate/">Ακίνητα</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/el/category/sport/">Αθλημα</a></li> </ul> </div> </aside> <aside id="recent-posts-2" class="widget widget_recent_entries clearfix"> <h3 class="widgettitle"><span>Πρόσφατες καταχωρήσεις</span></h3> <ul> <li> <a href="https://sks-m.ru/el/sport/takhikardija_kak_lechit_uchashhennyjj_puls.html">Ταχυκαρδία: πώς να αντιμετωπίσετε τον γρήγορο σφυγμό</a> </li> <li> <a href="https://sks-m.ru/el/sport/10_veshhejj_kotorye_vy_ne_dolzhny_delat_posle_trenirovki.html">10 πράγματα που ΔΕΝ ΠΡΕΠΕΙ να κάνετε μετά την προπόνηση</a> </li> <li> <a href="https://sks-m.ru/el/fashion-and-style/kulirka_chto_za_tkan_iz_chego_ee_delajut.html">Kulirka: από τι είδους ύφασμα είναι φτιαγμένο;</a> </li> <li> <a href="https://sks-m.ru/el/cooking/pochemu_mutneet_ogurechnyjj_rassol_v_bankakh_i_vzduvajutsja_kryshki_chto_delat.html">Γιατί το τουρσί αγγουριού στα βάζα θολώνει και τα καπάκια φουσκώνουν, τι να κάνετε και πώς να τα αναζωογονήσετε</a> </li> <li> <a href="https://sks-m.ru/el/beauty/kak_pravilno_i_naskolko_chasto_nuzhno_myt_golovu.html">Πώς να λούζετε σωστά τα μαλλιά σας και πόσο συχνά;</a> </li> <li> <a href="https://sks-m.ru/el/psychology/rastorzhenie_braka_v_organakh_zagsa.html">Διαζύγιο στο ληξιαρχείο</a> </li> <li> <a href="https://sks-m.ru/el/fashion-and-style/muzhskojj_stil_denim_v_muzhskom_garderobe.html">Ανδρικό στυλ: Τζιν στην ανδρική γκαρνταρόμπα</a> </li> <li> <a href="https://sks-m.ru/el/internet/chem_otlichaetsja_ajjfon_ot_ajjpoda_ili_kak_ne_zaputatsja_v_vybore_jablochnogo.html">Ποια είναι η διαφορά μεταξύ ενός iPhone και ενός iPod ή πώς να μην μπερδεύεστε όταν επιλέγετε μια συσκευή Apple;</a> </li> <li> <a href="https://sks-m.ru/el/fashion-and-style/kulirka__chto_jeto_za_tkan.html">Kulirka - τι είδους ύφασμα είναι;</a> </li> <li> <a href="https://sks-m.ru/el/finance/kurban_omarov_biografija_rod_zanjatijj_chem_znamenit_muzh_borodinojj.html">Για τι φημίζεται ο σύζυγος της Μποροντίνα;</a> </li> </ul> </aside> <aside id="nav_menu-4" class="widget widget_nav_menu clearfix" style="text-align:center;padding:0px;"> </aside> </section> </div> <div id="footer-wrap"> <footer id="footer" class="container clearfix" role="contentinfo"> </footer> </div> </div> <center style="font-size:0.8em;"><br><a href="https://sks-m.ru/el/" title="Παιδικός κόσμος. Ομορφιά. Μαγείρεμα. Διαδίκτυο. Στυλ μόδας. Ακίνητα. Των ζώων">Παιδικός κόσμος. Ομορφιά. Μαγείρεμα. Διαδίκτυο. Στυλ μόδας. Ακίνητα. Των ζώων</a> <br>2023 sks-m.ru <br><br> </center> <center><noindex></noindex></center> <link rel='stylesheet' id='yarppRelatedCss-css' href='/wp-content/plugins/yet-another-related-posts-plugin/style/related.css?ver=4.9.1' type='text/css' media='all' /> <script type='text/javascript'> var q2w3_sidebar_options = new Array(); q2w3_sidebar_options[0] = { "sidebar" : "sidebar", "margin_top" : 10, "margin_bottom" : 115, "stop_id" : "", "screen_max_width" : 800, "screen_max_height" : 0, "width_inherit" : false, "refresh_interval" : 1500, "window_load_hook" : false, "disable_mo_api" : false, "widgets" : ['nav_menu-4'] } ; </script> <script type='text/javascript' src='https://sks-m.ru/wp-content/plugins/q2w3-fixed-widget/js/q2w3-fixed-widget.min.js?ver=5.0.4'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.9.1'></script> <script async="async" type='text/javascript' src='https://sks-m.ru/wp-content/plugins/akismet/_inc/form.js?ver=4.0.2'></script> <script src="//yastatic.net/es5-shims/0.0.2/es5-shims.min.js"></script><br> <br> </body> </html>