Пошукова система

Пошукова система (англ. Search engine) - це комп'ютерна система. призначена для пошуку інформації. Одне з найбільш відомих застосувань пошукових систем - веб-сервіси для пошуку текстової або графічної інформації у Всесвітній павутині. Існують також системи, здатні шукати файли на FTP-сервер, товари в інтернет-магазинах. інформацію в групах новин Usenet.
Для пошуку інформації за допомогою пошукової системи користувач формулює запит [1]. Робота пошукової системи полягає в тому, щоб за запитом користувача знайти документи, що містять або зазначені ключові слова. або слова, будь-яким чином пов'язані з ключовими словами [2]. При цьому пошукова система генерує сторінку результатів пошуку. Така пошукова видача може містити різні типи результатів, наприклад: веб-сторінки. зображення. аудіофайли. Деякі пошукові системи також витягають інформацію з відповідних баз даних і каталогів ресурсів в Інтернеті.
За методами пошуку і обслуговування поділяють чотири типи пошукових систем: системи, що використовують пошукових роботів. системи, керовані людиною, гібридні системи і мета-системи [⇨]. В архітектуру пошукової системи зазвичай входять:
- пошуковий робот, який збирає інформацію з сайтів мережі Інтернет або з інших документів,
- індексатор. забезпечує швидкий пошук по накопиченої інформації, і
- пошуковик - графічний інтерфейс для роботи користувача [⇨].
На ранньому етапі розвитку мережі Інтернет Тім Бернерс-Лі підтримував список веб-серверів, розміщений на сайті ЦЕРН [3]. Сайтів ставало все більше, і підтримувати вручну такий список ставало все складніше. На сайті NCSA був спеціальний розділ «Що нового!» (Англ. What's New!) [4]. де публікували посилання на нові сайти.
Незабаром з'явилася безліч інших конкуруючих пошукових машин, таких як: «Magellan» [en]. «Excite», «Infoseek» [en]. «Inktomi» [en]. «Northern Light» [en] і «AltaVista». У певному сенсі вони конкурували з популярними інтернет-каталогами. такими як «Yahoo! ». Але пошукові можливості каталогів обмежувалися пошуком по самим каталогом, а не за текстами веб-сторінок. Пізніше каталоги об'єднувалися або забезпечувалися пошуковими роботами з метою поліпшення пошуку.
Пошук інформації російською мовою
Як працює пошукова система
У східно-азіатських країнах і вУкаіни Google - не найпопулярніша пошукова система. У Китаї, наприклад, більш популярна пошукова система Soso [en].
У Південній Кореї пошуковим порталом власної розробки Naver користується близько 70% жителів [19] Yahoo! Japan і Yahoo! Taiwan - найпопулярніші системи для пошуку в Японії і Тайвані відповідно [20].
Росія і російськомовні пошукові системи
Яндексом користуються 56,2% користувачів вУкаіни (Google - 37,6%) [21].
- Всеязичние:
- Google (37,6%)
- Bing (0,3%)
- Yahoo! (0,1%) і належать цій компанії пошукові машини: Inktomi [en]. AltaVista. Alltheweb [en]
- Англомовні і міжнародні:
- AskJeeves [en] (механізм Teoma)
- Російськомовні - більшість «російськомовних» пошукових систем індексують і шукають тексти на багатьох мовах - українською. білоруському. англійською. татарською та інших. Відрізняються ж вони від «всеязичних» систем, індексуючих всі документи підряд, тим, що, в основному, індексують ресурси, розташовані в доменних зонах. де домінує українська мова, або іншими способами обмежують своїх роботів російськомовними сайтами.
- Яндекс (56,2%)
- Mail.ru (5,3%)
- Рамблер (0,5%)
Деякі з пошукових систем використовують зовнішні алгоритми пошуку.
Кількісні дані пошукової системи Google
Число користувачів Інтернету і пошукових систем і вимог користувачів до цих систем постійно зростає. Для збільшень швидкості пошуку потрібної інформації, великі пошукові системи містять велику кількість серверів. Сервера зазвичай групують в серверні центри (дата центри). У популярних пошукових систем серверні центри розкидані по всьому світу [23].
Про роботу дата-центрів пошуковій системі Google відомо наступне [23]:
Пошукові системи, що враховують релігійні заборони
Відсутність інвестицій і повільний темп поширення технологій в мусульманському світі перешкоджали прогресу і заважали успіху серйозного ісламського пошукача. Очевидним є провал величезних інвестицій в веб-проекти мусульманського способу життя, одним з яких був Muxlim [en]. Він отримав мільйони доларів від інвесторів, таких як Rite Internet Ventures, і тепер - відповідно до останнього повідомленням від I'mHalal перед його закриттям - виступає з сумнівною ідеєю про те, що «наступний Facebook або Google можуть з'явитися тільки в країнах Близького Сходу. якщо ви підтримаєте нашу блискучу молодь »[28]. Проте ісламські експерти в області Інтернету протягом багатьох років займаються визначенням того, що відповідає чи не відповідає шаріату. і класифікують веб-сайти як «халяль» або «харам». Всі колишні та теперішні ісламські пошукові системи являють собою просто спеціальним чином проіндексований набір даних або це головні пошукові системи, такі як Google, Yahoo і Bing, з певною системою фільтрації, що використовується для того, щоб користувачі не могли отримати доступ до харам-сайтам, таким як сайти про наготі, ЛГБТ. азартних іграх і будь-яким іншим, тематика яких вважається антиісламської [28].
Серед інших релігійно-орієнтованих пошукових систем поширеними є Jewogle - єврейська версія Google і SeekFind.org - християнський сайт, що включає в себе фільтри, що оберігають користувачів від контенту, який може підірвати або послабити їх віру [29].
Персональні результати і бульбашки фільтрів
Багато пошукових систем, такі як Google і Bing, використовують алгоритми вибіркового вгадування того, яку інформацію користувач хотів би побачити, грунтуючись на його минулих діях в системі. В результаті, веб-сайти показують тільки ту інформацію, яка узгоджується з минулими інтересами користувача. Цей ефект отримав назву «міхур фільтрів» [30].
Все це веде до того, що користувачі отримують набагато менше суперечить своїй точці зору інформації і стають інтелектуально ізольованими в своєму власному «інформаційному міхурі». Таким чином, «ефект міхура» може мати негативні наслідки для формування громадянського думки [31].
Упередженість пошукових систем