Motoare de căutare pe Internet: o prezentare generală a motoarelor de căutare populare și puțin cunoscute

Total

Introducere

Puțini oameni își pot imagina acum Internetul fără căutare, rezultate de căutare și organizarea tuturor acestor sisteme de recuperare a informațiilor (IPS). Dar până de curând, toate informațiile de pe Internet se încadrează în mai multe directoare, al căror nume este încă bine cunoscut (DMOZ, Yahoo).

Astăzi, volumul de informații de pe Internet este atât de mare încât nu este posibil să le încadrezi în niciun catalog. Pentru procesarea, stocarea informațiilor, organizarea căutării au fost create și continuă să fie create produse software puternice, pe care le numim motoare de căutare (PS). Fiecare motor de căutare (motor de căutare) are propriile baze de date, proprii algoritmi de procesare, căutare, clasare și emitere a informațiilor.

Motoarele de căutare pe internet sunt

Puteți da următoarea definiție academică a motoarelor de căutare. Un motor de căutare este un set de programe și hardware pentru organizarea unei căutări de utilizator pe Internet, în care, pentru o interogare de text, utilizatorul primește o listă de rezultate relevante (corespunzătoare interogării).

Emiterea se face sub forma unei liste de link-uri către sursa de informații cu o scurtă descriere (previzualizare), uneori cu o fotografie.

Pentru primul exemplu, să ne amintim de liderul mondial de căutare „Google” și de liderul motorului de căutare Runet „Yandex”. Pe lângă aceste motoare de căutare, puteți numi încă o duzină de motoare de căutare existente, despre care vom vorbi mai jos.

Opinie: Motoarele de căutare Google, Yandex și altele nu sunt generatoare (producători) de conținut, ci sunt agregatoare (acumulatoare) de conținut și, în cea mai mare parte, conținutul altcuiva. Merită să ne amintim că utilizarea conținutului altcuiva pentru a vă crea propriul trafic și a-l monetiza poate fi caracterizată drept „piraterie”, ceea ce, desigur, nu se întâmplă în realitate.

Evaluare

  • iar Google împart primele două locuri de lideri: aproximativ 49% și 45%.
  • Locul al treilea: căutare Mail.ru aproximativ 3%;
  • Alte motoare de căutare plutesc sub 1%.

Privind statisticile Google Analytics:

  • yandex / organic 40,26%
  • google / organic 38,93%
  • mail.ru / organic 0,60%
  • rambler / organic 0,52%
  • bing / organic 0,12%

Statisticile sunt necruțătoare: căutările Yandex sunt cele mai vizitate, iar dacă considerați că 3% este un rezultat bun față de 45%, atunci a treia cea mai populară căutare poate fi numită căutare Mail.ru.

În acest sens, argumentele despre popularitatea motoarelor de căutare, altele decât Yandex și Google, pot fi atribuite superstiției și promovării speciale a site-urilor în alte motoare de căutare (nu Yandex și Google) care nu merită atenție.

Cum funcționează motoarele de căutare

Întrebarea cum funcționează motoarele de căutare este la fel de generală ca întrebarea „ce culoare este cerul”. Dacă cerul este albastru, atunci motoarele de căutare colectează informații pe Internet, le procesează, le clasifică și le oferă utilizatorului în funcție de interogarea de căutare.

Teoria căutării pe internet este mult mai voluminoasă și nu poate fi prezentată în articol. Cu toate acestea, punctele principale ne vor fi utile:

Motoarele de căutare de pe internet nu stochează documente, adică nu descarcă și încarcă documente complet în depozitele lor;

IS-urile folosesc internetul ca un depozit descentralizat de documente. Motoarele de căutare ocolesc periodic Internetul, aleg informațiile de care au nevoie, în funcție de algoritmii lor și le plasează parțial (informații) în baza lor de date (Baza de date). De aici câteva probleme:

  • IPS nu utilizează toate informațiile de pe Internet pentru emitere, ci doar o parte;
  • Informațiile de pe Internet se schimbă frecvent. Se adaugă aproximativ 1500 de mii de pagini pe zi, de unde posibila „problemă goală”;
  • Există un număr mare de duplicate (conținut duplicat). Din păcate, nu am date exacte despre duble, iar cifra de 25% din duble care apare pare a fi prea mare;
  • Multă publicitate, care este ocolită și de motoarele de căutare;
  • „Rătăcirea” roboților de căutare în rețea crește foarte mult încărcarea resurselor (nu se aplică motoarelor de căutare);
  • Majoritatea site-urilor sunt comerciale (aproximativ 83%) și au o valoare informativă mică.

Din aceste motive și din alte câteva motive, marea majoritate a IPS-urilor de pe Internet utilizează o schemă de căutare prin cuvinte cheie (motoare de căutare) mai degrabă decât schema clasică de căutare a clasificării informațiilor.

Funcții de căutare prin cuvinte cheie

În ciuda algoritmilor în schimbare ai motoarelor de căutare, a căror publicitate încearcă să ne convingă că mașinile devin mai inteligente și mai inteligente, motoarele de căutare se bazează pe căutarea prin cuvinte cheie.

Îmi place această schemă de căutare prin cuvinte cheie.

După cum puteți vedea, munca motoarelor de căutare de pe Internet se bazează pe căutarea de noi documente (robot de căutare Spider + Crawler), indexarea documentelor detectate (Indexer) și executarea unei cereri de utilizator (Search Engine Results Engine). Numele roboților de căutare utilizați în aceste scopuri sunt enumerate în paranteze.

După cum am spus, majoritatea motoarelor de căutare nu copiază documentele text integral în baza lor de date. Pentru căutare, la indexarea unui document, este creată imaginea de căutare a acestuia. Pentru a organiza o căutare după , robotul de indexare creează o imagine a documentului folosind așa-numita metodă de derivare (derivată). Adică, titlul și un set de cuvinte cheie sunt indicate în imaginea documentului.

Cu toate acestea, se poate afirma destul de precis că toate IPS acordă atenție următoarelor:

  • Prezența unui cuvânt cheie în document;</li><li>Prezența cheii în adresa URL sau domeniu;</li><li>Prezența cheii în subtitrare;</li><li>Numărul total de taste pe pagină (densitate %);</li><li>Prezența cheilor în descriere (descriere);</li><li>Ce link-uri web conduc la această pagină;</li><li>Ce link-uri interne sunt pe această pagină.</li> </ul><h2><span>Clasamentul paginii</span></h2><p>La sfârșitul teoriei, merită menționat despre. Mai des, clasarea paginilor este menționată în contextul relevanței. Adică, motoarele de căutare ar trebui să creeze rezultate de căutare bazate pe cea mai precisă potrivire cu interogarea de căutare. După cum scrie Yandex, nu ar trebui să se piardă nimic (completitudinea problemei) și nu trebuie găsit nimic în plus (acuratețea problemei). Cum se dovedește în practică, vedeți în fiecare zi.</p><h2>Concluzie</h2><ul><li>Motoarele de căutare pe internet sunt produse software complexe, a căror activitate este asigurată de mii de specialiști și resurse materiale uriașe.</li><li>Algoritmii motoarelor de căutare sunt păstrați secreti, deși accentul de bază al actualizărilor algoritmilor este public și are nume proprii.</li><li>În ciuda abordării diferite a formării emisiunii, toate motoarele de căutare se bazează pe principiile generale ale indexării paginilor, care rămân până astăzi baza promovării.</li> </ul><h2><span>Motorul de căutare Yandex</span></h2><p>Popularul motor de căutare Runet, care devine adesea cel mai popular. Conform statisticilor din 2009, Yandex ocolește în mod constant 15 milioane de pagini din Runet, procesând 140 mii GB de date text, 1,6 miliarde de imagini unice din 2,1 miliarde de imagini în total.</p><p>Motorul de căutare Yandex a fost creat în 1993. Cuvântul Yandex nu înseamnă nimic, deși se crede în mod obișnuit că aceasta este o transformare a cuvântului „Index” sau a expresiei „un alt indexator”. Astăzi, Yandex.Search procesează un sfert de miliard de solicitări pe zi și, dacă ar fi atât de intruziv, ar fi motorul meu de căutare preferat.</p><h2>Căutați Yandex</h2><p>https://yandex.ru/ : căutarea personalizată Yandex este organizată pe Internet în funcție de regiunea utilizatorului. Abilitatea de a căuta după imagini, videoclipuri, hărți, știri, bloguri, produse și dicționare.</p><p><img src='/uploads/81cdf90374f142a0b848bb428f86180b.png' height="592" width="1276" loading=lazy loading=lazy></p><p>Pentru căutare fină, există o limbă de căutare aici (https://yandex.ru/support/search/query-language/).</p><p><img src='/uploads/f9c075b14d6eb3d10ec1251607e73d53.png' height="592" width="876" loading=lazy loading=lazy></p><p>Motoarele de căutare pe Internet Yandex</p><h2>motor de căutare Google</h2><p>În motorul de căutare Google, căutarea este organizată fără subiecte (căutare de bază) și căutarea pe secțiuni: imagini, știri, hărți, videoclipuri, cumpărături, cărți, bilete de avion, finanțe.</p><p><img src='/uploads/f0c4694c6d8b5679a24edaffa0c222e1.png' height="262" width="822" loading=lazy loading=lazy></p><p>Există setări:</p><p><b>Căutare în condiții de siguranță.</b> Vă permite să blocați conținutul neadecvat și imaginile de natură sexuală în rezultatele căutării Google. Această caracteristică nu garantează protecție 100%, dar ascunde cea mai mare parte a acestui conținut.</p><p><img src='/uploads/566a19c01c71076faba0785473d5588b.png' height="1174" width="1280" loading=lazy loading=lazy></p><p><img src='/uploads/a7233a577c3d32a89fc4043f9128fd5a.png' height="235" width="811" loading=lazy loading=lazy></p><p><b>Setarea numărului de rezultate</b> pe pagină (implicit 10).</p><p><b>Rezultate personale</b>. Căutați pe Google linkuri, imagini și videoclipuri partajate cu dvs. de prietenii din rețelele sociale.</p><p><b>Selectarea regiunii</b>. În mod implicit, regiunea curentă.</p><p><b>Limbi.</b> Puteți specifica limba de căutare.</p><p><b>Cautare Avansata.</b> Vă permite să căutați după opțiuni avansate.</p><p><b>Instrumente.</b> Aici puteți selecta limba de căutare, specifica ora la care au apărut informațiile și puteți selecta o potrivire exactă sau întreaga problemă.</p><p><img src='/uploads/64e0fcbab4eab9e65ac9aadaa417f244.png' height="339" width="827" loading=lazy loading=lazy></p><p>Motoarele de căutare pe internet Google</p><h2>Motor de căutare pentru e-mail</h2><p>https://go.mail.ru/. Aici căutarea este organizată pe Internet (căutare generală), după video și imagini. Există o căutare separată pentru aplicații pentru dispozitive mobile.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Căutare generală, căutare după imagini, video, știri, hărți.</p><p><img src='/uploads/d28dca3dd59c3ce1b31b2c025c148458.png' height="220" width="806" loading=lazy loading=lazy></p><p><b>Căutare Yahoo în rusă</b>. https://www.search.yahoo.com/ . Căutare curată fără reclame. Cauta pe internet, dupa poze si stiri. Selectarea orei pentru adăugarea informațiilor.</p><h2>Alte motoare de căutare</h2><ul><li>DuckDuckGo (https://duckduckgo.com/) Căutare inteligentă.</li><li>Pipl (https://pipl.com/) Găsiți oameni în SUA.</li><li>Găsește sunete ( <span>http://www.findsounds.com/ 11 Instrumente pentru analizarea relevanței paginilor site-ului web pentru o interogare de căutare</span></li> </ul><br> <br> </div> </article> </section> <section id="sidebar" class="secondary clearfix" role="complementary"> <aside id="nav_menu-3" class="widget widget_nav_menu clearfix"> <h3 class="widgettitle"><span>Categorii</span></h3> <div class="menu-menyu1-container"> <ul id="menu-menyu1" class="menu"> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/beauty/">frumuseţe</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/psychology/">Psihologie</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/internet/">Internet</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/cooking/">gătit</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/fashion-and-style/">Modă și stil</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/finance/">Finanţa</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/real-estate/">Imobiliare</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/ro/category/sport/">Sport</a></li> </ul> </div> </aside> <aside id="recent-posts-2" class="widget widget_recent_entries clearfix"> <h3 class="widgettitle"><span>Intrări recente</span></h3> <ul> <li> <a href="https://sks-m.ru/ro/sport/takhikardija_kak_lechit_uchashhennyjj_puls.html">Tahicardie: cum să tratați un puls rapid</a> </li> <li> <a href="https://sks-m.ru/ro/sport/10_veshhejj_kotorye_vy_ne_dolzhny_delat_posle_trenirovki.html">10 lucruri pe care NU TREBUIE să le faci după un antrenament</a> </li> <li> <a href="https://sks-m.ru/ro/fashion-and-style/kulirka_chto_za_tkan_iz_chego_ee_delajut.html">Kulirka: ce fel de țesătură, din ce este făcută?</a> </li> <li> <a href="https://sks-m.ru/ro/cooking/pochemu_mutneet_ogurechnyjj_rassol_v_bankakh_i_vzduvajutsja_kryshki_chto_delat.html">De ce murăturile de castraveți devin tulburi în borcane și capacele se umflă, ce să faci și cum să resuscitezi</a> </li> <li> <a href="https://sks-m.ru/ro/beauty/kak_pravilno_i_naskolko_chasto_nuzhno_myt_golovu.html">Cum să-ți speli părul și cât de des?</a> </li> <li> <a href="https://sks-m.ru/ro/psychology/rastorzhenie_braka_v_organakh_zagsa.html">Divorțul la oficiul de stat</a> </li> <li> <a href="https://sks-m.ru/ro/fashion-and-style/muzhskojj_stil_denim_v_muzhskom_garderobe.html">Stilul bărbătesc: Denim în garderoba bărbaților</a> </li> <li> <a href="https://sks-m.ru/ro/internet/chem_otlichaetsja_ajjfon_ot_ajjpoda_ili_kak_ne_zaputatsja_v_vybore_jablochnogo.html">Care este diferența dintre un iPhone și un iPod sau cum să nu te încurci în alegerea unui dispozitiv „măr”?</a> </li> <li> <a href="https://sks-m.ru/ro/fashion-and-style/kulirka__chto_jeto_za_tkan.html">Kulirka - ce este această țesătură?</a> </li> <li> <a href="https://sks-m.ru/ro/finance/kurban_omarov_biografija_rod_zanjatijj_chem_znamenit_muzh_borodinojj.html">De ce este celebru soțul Borodinei?</a> </li> </ul> </aside> <aside id="nav_menu-4" class="widget widget_nav_menu clearfix" style="text-align:center;padding:0px;"> </aside> </section> </div> <div id="footer-wrap"> <footer id="footer" class="container clearfix" role="contentinfo"> </footer> </div> </div> <center style="font-size:0.8em;"><br><a href="https://sks-m.ru/ro/" title="Lumea copiilor. Frumuseţe. Gătit. Internet. Modă și stil. Imobiliare. Animale">Lumea copiilor. Frumuseţe. Gătit. Internet. Modă și stil. Imobiliare. Animale</a> <br>2023 sks-m.ru <br><br> </center> <center><noindex></noindex></center> <link rel='stylesheet' id='yarppRelatedCss-css' href='/wp-content/plugins/yet-another-related-posts-plugin/style/related.css?ver=4.9.1' type='text/css' media='all' /> <script type='text/javascript'> var q2w3_sidebar_options = new Array(); q2w3_sidebar_options[0] = { "sidebar" : "sidebar", "margin_top" : 10, "margin_bottom" : 115, "stop_id" : "", "screen_max_width" : 800, "screen_max_height" : 0, "width_inherit" : false, "refresh_interval" : 1500, "window_load_hook" : false, "disable_mo_api" : false, "widgets" : ['nav_menu-4'] } ; </script> <script type='text/javascript' src='https://sks-m.ru/wp-content/plugins/q2w3-fixed-widget/js/q2w3-fixed-widget.min.js?ver=5.0.4'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.9.1'></script> <script async="async" type='text/javascript' src='https://sks-m.ru/wp-content/plugins/akismet/_inc/form.js?ver=4.0.2'></script> <script src="//yastatic.net/es5-shims/0.0.2/es5-shims.min.js"></script></body> </html>