Интернет търсачки: преглед на популярни и малко известни търсачки

Обща сума

Въведение

Малко хора сега могат да си представят Интернет без търсене, резултати от търсене и организиране на всички тези системи за извличане на информация (IPS). Но доскоро цялата информация в Интернет се побираше в няколко директории, чието име все още е добре известно (DMOZ, Yahoo).

Днес обемът на информацията в Интернет е толкова огромен, че не е възможно да се побере в каталози. За обработка, съхраняване на информация, организиране на търсенето са създадени и продължават да се създават мощни софтуерни продукти, които наричаме търсачки (ПС). Всяка търсачка (търсачка) има свои собствени бази данни, свои собствени алгоритми за обработка, търсене, класиране и издаване на информация.

Интернет търсачките са

Можете да дадете следното академично определение на търсачките. Търсачката е набор от програми и хардуер за организиране на потребителско търсене в Интернет, при което за текстова заявка потребителят получава списък с подходящи (съответстващи на заявката) резултати.

Издаването се извършва под формата на списък с връзки към източника на информация с кратко описание (преглед), понякога със снимка.

Като първи пример, нека си спомним световния лидер в търсенето "Google" и лидера на търсачката Runet "Yandex". В допълнение към тези търсачки можете да посочите още дузина съществуващи търсачки, за които ще говорим по-долу.

Мнение: Търсачките Google, Yandex и други не са генератори (производители) на съдържание, а са агрегатори (акумулатори) на съдържание и в по-голямата си част нечие съдържание. Струва си да се помни, че използването на чуждо съдържание за създаване на собствен трафик и монетизиране може да се характеризира като „пиратство“, което, разбира се, не се случва в действителност.

Рейтинг

  • и Google споделят първите две места на лидери: около 49% и 45%.
  • Трето място: търсене в Mail.ru около 3%;
  • Други търсачки се движат под 1%.

Разглеждане на статистиката на Google Analytics:

  • yandex / органичен 40,26%
  • google / органичен 38,93%
  • mail.ru / органичен 0,60%
  • rambler / органичен 0,52%
  • bing / органичен 0,12%

Статистиката е безпощадна: търсенията в Yandex са най-посещаваните и ако смятате, че 3% са добър резултат в сравнение с 45%, тогава третото най-популярно търсене може да се нарече търсене в Mail.ru.

В тази връзка аргументите за популярността на търсачките, различни от Yandex и Google, могат да бъдат приписани на суеверие и специално популяризиране на сайтове в други търсачки (не Yandex и Google), които не заслужават внимание.

Как работят търсачките

Въпросът как работят търсачките е толкова общ, колкото и въпросът „какъв цвят е небето“. Ако небето е синьо, тогава търсачките събират информация в интернет, обработват я, класират я и я дават на потребителя според заявката за търсене.

Теорията на интернет търсенето е много по-обемна и не може да бъде представена в статията. Но основните точки ще ни бъдат полезни:

Интернет търсачките не съхраняват документи, тоест те не изтеглят и качват документи изцяло в хранилищата си;

ИС използват Интернет като децентрализирано хранилище на документи. Търсачките периодично заобикалят интернет, избират информацията, от която се нуждаят, според своите алгоритми и частично я поставят (информация) в своята база данни (база данни). Оттук и няколко проблема:

  • IPS не използват цялата интернет информация за издаване, а само част;
  • Интернет информацията се променя често. Приблизително 1500 хиляди страници се добавят на ден, оттук и възможният "празен брой";
  • Има голям брой дубликати (дублирано съдържание). За съжаление нямам точни данни за дублиранията, а цифрата от 25% двойки, която се случва, изглежда твърде висока;
  • Много реклама, която също се заобикаля от търсачките;
  • "Скитането" на роботите за търсене в мрежата значително увеличава натоварването на ресурсите (не се отнася за търсачките);
  • Повечето сайтове са комерсиални (около 83%) и имат малка информативна стойност.

Поради тези и някои други причини огромното мнозинство от Интернет IPS използват схема за търсене по ключови думи (търсачки), а не класическата схема за търсене с класификация на информация.

Функции за търсене по ключови думи

Въпреки променящите се алгоритми на търсачките, чиято реклама се опитва да ни убеди, че машините стават все по-умни и интелигентни, търсачките се базират на търсене по ключови думи.

Харесвам тази схема за търсене по ключови думи.

Както можете да видите, работата на интернет търсачките се основава на търсене на нови документи (робот за търсене Spider + Crawler), индексиране на открити документи (Indexer) и изпълнение на потребителска заявка (Search Engine Results Engine). Имената на търсещите роботи, използвани за тези цели, са изброени в скоби.

Както казах, повечето търсачки не копират пълни текстови документи в своята база данни. За търсене, когато индексирате документ, се създава неговото изображение за търсене. За да организира търсене по , индексиращият робот създава изображение на документа, използвайки така наречения метод на извличане (извлечен). Тоест заглавието и набор от ключови думи са посочени в изображението на документа.

Въпреки това може да се каже съвсем точно, че всички IPS обръщат внимание на следното:

  • Наличието на ключова дума в документ;</li><li>Наличието на ключ в URL адреса или домейна;</li><li>Наличието на ключ в субтитрите;</li><li>Общ брой ключове на страница (плътност %);</li><li>Наличието на ключове в описанието (описание);</li><li>Какви уеб връзки водят до тази страница;</li><li>Какви вътрешни връзки има на тази страница.</li> </ul><h2><span>Класиране на страницата</span></h2><p>В края на теорията си струва да споменем за. По-често класирането на страницата се споменава в контекста на релевантността. Това означава, че търсачките трябва да създават резултати от търсенето въз основа на най-точното съвпадение със заявката за търсене. Както пише Yandex, нищо не трябва да се губи (пълнотата на издаването) и не трябва да се намира нищо допълнително (точността на издаването). Как се оказва на практика, виждате всеки ден.</p><h2>Заключение</h2><ul><li>Интернет търсачките са сложни софтуерни продукти, чиято работа се осигурява от хиляди специалисти и огромни материални ресурси.</li><li>Алгоритмите на търсачките се пазят в тайна, въпреки че основният акцент на актуализациите на алгоритмите е публичен и има правилни имена.</li><li>Въпреки различния подход към формирането на издаването, всички търсачки се основават на общите принципи на индексиране на страници, които и до днес остават в основата на промоцията.</li> </ul><h2><span>Yandex търсачка</span></h2><p>Популярна търсачка Runet, която често става най-популярната. Според статистиката от 2009 г. Yandex постоянно заобикаля 15 милиона страници на Runet, обработвайки 140 хиляди GB текстови данни, 1,6 милиарда уникални снимки от общо 2,1 милиарда снимки.</p><p>Търсачката Yandex е създадена през 1993 г. Думата Yandex не означава нищо, въпреки че обикновено се смята, че това е трансформация на думата "Индекс" или фразата "още един индексатор". Днес Yandex.Search обработва четвърт милиард заявки на ден и ако беше толкова натрапчива, щеше да е любимата ми търсачка.</p><h2>Търсене в Yandex</h2><p>https://yandex.ru/ : Персонализираното търсене на Yandex е организирано в Интернет въз основа на региона на потребителя. Възможност за търсене по снимки, видеоклипове, карти, новини, блогове, продукти и речници.</p><p><img src='/uploads/81cdf90374f142a0b848bb428f86180b.png' height="592" width="1276" loading=lazy loading=lazy></p><p>За фино търсене тук има език за търсене (https://yandex.ru/support/search/query-language/).</p><p><img src='/uploads/f9c075b14d6eb3d10ec1251607e73d53.png' height="592" width="876" loading=lazy loading=lazy></p><p>Интернет търсачки Yandex</p><h2>Google търсачка</h2><p>В търсачката Google търсенето е организирано без теми (основно търсене) и търсене по секции: снимки, новини, карти, видео, пазаруване, книги, самолетни билети, финанси.</p><p><img src='/uploads/f0c4694c6d8b5679a24edaffa0c222e1.png' height="262" width="822" loading=lazy loading=lazy></p><p>Има настройки:</p><p><b>Безопасно търсене.</b>Позволява ви да блокирате неподходящо съдържание и изображения със сексуален характер в резултатите от търсенето с Google. Тази функция не гарантира 100% защита, но скрива по-голямата част от това съдържание.</p><p><img src='/uploads/566a19c01c71076faba0785473d5588b.png' height="1174" width="1280" loading=lazy loading=lazy></p><p><img src='/uploads/a7233a577c3d32a89fc4043f9128fd5a.png' height="235" width="811" loading=lazy loading=lazy></p><p><b>Задаване на броя на резултатите</b>на страница (по подразбиране 10).</p><p><b>Лични резултати</b>. Търсете в Google връзки, снимки и видеоклипове, споделени с вас от вашите приятели в социалните медии.</p><p><b>Избор на регион</b>. По подразбиране, текущият регион.</p><p><b>Езици.</b>Можете да посочите езика за търсене.</p><p><b>Подробно търсене.</b>Позволява ви да търсите по разширени опции.</p><p><b>Инструменти.</b>Тук можете да изберете езика за търсене, да посочите времето, когато се е появила информацията, и да изберете точно съвпадение или целия брой.</p><p><img src='/uploads/64e0fcbab4eab9e65ac9aadaa417f244.png' height="339" width="827" loading=lazy loading=lazy></p><p>Интернет търсачки Google</p><h2>Търсачка за поща</h2><p>https://go.mail.ru/. Тук търсенето е организирано по интернет (общо търсене), по видео и снимки. Има отделно търсене на приложения за мобилни устройства.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Общо търсене, търсене по снимки, видео, новини, карти.</p><p><img src='/uploads/d28dca3dd59c3ce1b31b2c025c148458.png' height="220" width="806" loading=lazy loading=lazy></p><p><b>Yahoo търсене на руски</b>. https://www.search.yahoo.com/. Чисто търсене без реклами. Търсете в интернет, по снимки и новини. Избор на време за добавяне на информация.</p><h2>Други търсачки</h2><ul><li>DuckDuckGo (https://duckduckgo.com/ ) Интелигентно търсене.</li><li>Pipl (https://pipl.com/ ) Намерете хора в САЩ.</li><li>Findsounds ( <span>http://www.findsounds.com/ 11 Инструменти за анализиране на уместността на страниците на уебсайта спрямо заявка за търсене</span></li> </ul><br> <br> </div> </article> </section> <section id="sidebar" class="secondary clearfix" role="complementary"> <aside id="nav_menu-3" class="widget widget_nav_menu clearfix"> <h3 class="widgettitle"><span>Категории</span></h3> <div class="menu-menyu1-container"> <ul id="menu-menyu1" class="menu"> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/beauty/">красота</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/psychology/">Психология</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/internet/">интернет</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/cooking/">готвене</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/fashion-and-style/">Мода и стил</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/finance/">Финанси</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/real-estate/">Недвижим имот</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://sks-m.ru/bg/category/sport/">спорт</a></li> </ul> </div> </aside> <aside id="recent-posts-2" class="widget widget_recent_entries clearfix"> <h3 class="widgettitle"><span>Последни записи</span></h3> <ul> <li> <a href="https://sks-m.ru/bg/sport/takhikardija_kak_lechit_uchashhennyjj_puls.html">Тахикардия: как да се лекува ускорен пулс</a> </li> <li> <a href="https://sks-m.ru/bg/sport/10_veshhejj_kotorye_vy_ne_dolzhny_delat_posle_trenirovki.html">10 неща, които НЕ ТРЯБВА да правите след тренировка</a> </li> <li> <a href="https://sks-m.ru/bg/fashion-and-style/kulirka_chto_za_tkan_iz_chego_ee_delajut.html">Kulirka: какъв вид плат, от какво е направен?</a> </li> <li> <a href="https://sks-m.ru/bg/cooking/pochemu_mutneet_ogurechnyjj_rassol_v_bankakh_i_vzduvajutsja_kryshki_chto_delat.html">Защо туршията от краставици става мътна в буркани и капаците се подуват, какво да правя и как да реанимирам</a> </li> <li> <a href="https://sks-m.ru/bg/beauty/kak_pravilno_i_naskolko_chasto_nuzhno_myt_golovu.html">Как да миете косата си и колко често?</a> </li> <li> <a href="https://sks-m.ru/bg/psychology/rastorzhenie_braka_v_organakh_zagsa.html">Развод в службата по вписванията</a> </li> <li> <a href="https://sks-m.ru/bg/fashion-and-style/muzhskojj_stil_denim_v_muzhskom_garderobe.html">Мъжки стил: Деним в мъжкия гардероб</a> </li> <li> <a href="https://sks-m.ru/bg/internet/chem_otlichaetsja_ajjfon_ot_ajjpoda_ili_kak_ne_zaputatsja_v_vybore_jablochnogo.html">Каква е разликата между iPhone и iPod или как да не се объркате при избора на устройство "ябълка"?</a> </li> <li> <a href="https://sks-m.ru/bg/fashion-and-style/kulirka__chto_jeto_za_tkan.html">Кулирка - каква е тази тъкан?</a> </li> <li> <a href="https://sks-m.ru/bg/finance/kurban_omarov_biografija_rod_zanjatijj_chem_znamenit_muzh_borodinojj.html">Защо съпругът на Бородина е известен?</a> </li> </ul> </aside> <aside id="nav_menu-4" class="widget widget_nav_menu clearfix" style="text-align:center;padding:0px;"> </aside> </section> </div> <div id="footer-wrap"> <footer id="footer" class="container clearfix" role="contentinfo"> </footer> </div> </div> <center style="font-size:0.8em;"><br><a href="https://sks-m.ru/bg/" title="Детски свят. красота. готвене. Интернет. Мода и стил. Недвижим имот. Животни">Детски свят. красота. готвене. Интернет. Мода и стил. Недвижим имот. Животни</a> <br>2023 sks-m.ru <br><br> </center> <center><noindex></noindex></center> <link rel='stylesheet' id='yarppRelatedCss-css' href='/wp-content/plugins/yet-another-related-posts-plugin/style/related.css?ver=4.9.1' type='text/css' media='all' /> <script type='text/javascript'> var q2w3_sidebar_options = new Array(); q2w3_sidebar_options[0] = { "sidebar" : "sidebar", "margin_top" : 10, "margin_bottom" : 115, "stop_id" : "", "screen_max_width" : 800, "screen_max_height" : 0, "width_inherit" : false, "refresh_interval" : 1500, "window_load_hook" : false, "disable_mo_api" : false, "widgets" : ['nav_menu-4'] } ; </script> <script type='text/javascript' src='https://sks-m.ru/wp-content/plugins/q2w3-fixed-widget/js/q2w3-fixed-widget.min.js?ver=5.0.4'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.9.1'></script> <script async="async" type='text/javascript' src='https://sks-m.ru/wp-content/plugins/akismet/_inc/form.js?ver=4.0.2'></script> <script src="//yastatic.net/es5-shims/0.0.2/es5-shims.min.js"></script><br> <br> </body> </html>