Пошукові системи

  • Вступ
  • 1. Поняття і сутність пошукової системи. Перші пошукові системи інтернету
  • 2. Характеристика основних пошукових систем
  • висновок
  • Список літератури

Пошукова система - програмно-апаратний комплекс з веб-інтерфейсом, що надає можливість пошуку інформації в Інтернеті. Під пошуковою системою зазвичай мається на увазі сайт, на якому розміщений інтерфейс (фронт-енд) системи. Програмною частиною пошукової системи є пошукова машина (пошуковий движок) - комплекс програм, що забезпечує функціональність пошукової системи і зазвичай є комерційною таємницею компанії-розробника пошукової системи.

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на FTP-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

Метою цієї роботи є знайомство з пошуковими система Інтернету.

Завдання роботи: розглянути поняття і сутність пошукової системи, ознайомитися з першими пошуковими системами Інтернету, дати характеристику основним популярним пошуковим системам.

Предмет дослідження: пошукова система як програмно-апаратний комплекс.

Об'єкт дослідження: сучасні пошукові системи інтернету.

1. Поняття і сутність пошукової системи. Перші пошукові системи інтернету

Пошукові системи - це сервіси, призначені для пошуку інформації в світовій мережі Інтернет. У базі даних пошукових систем знаходиться інформація, практично, про всі сайтах мережі Інтернет і ця база постійно оновлюється автоматизованими системами, що стежать за появою нових сайтів.

Одним з перших інструментів пошуку в інтернеті (до Всесвітньої павутини) був Archie.

Крім пошукових машин для Всесвітньої павутини, існували і пошукачі для інших протоколів, такі як Archie для пошуку по анонімним FTP-серверів і "Veronica" для пошуку в Gopher.

Поповнення інформаційних ресурсів Інтернету відбувається високими темпами, і знайти необхідну інформацію стає все важче. Різні друковані довідники застарівають ще до виходу в світ. Єдиним надійним способом пошуку інформації є використання різних пошукових систем, які постійно відстежують зміна інформації в мережі.

За час існування Інтернету робилися різні спроби організації пошукових засобів. Багато з цих спроб виявилися невдалими, інші ж привели до створення зручних засобів пошуку інформації. Найбільш вдалі проекти з'явилися в останні п'ять років. Ми розглянемо пошук інформації у Всесвітній павутині за допомогою декількох найбільш поширених систем пошуку. Всього ж у світі існують сотні різних пошукових систем, і вибір тієї чи іншої системи залежить тільки від ваших особистих пристрастей. Відзначимо, що пошукові системи часто називають пошуковими машинами або машинами пошуку.

Багато пошукових систем дозволяють шукати інформацію не тільки в Web-сторінках, але і в групах новин і сховищах файлів. Таким чином, в результаті пошуку ви можете знайти повідомлення в групі новин або якийсь файл. Тому частіше застосовують замість терміна сторінка більш загальний термін - документ. Під документом маються на увазі Web-сторінка, повідомлення або файл, що містять різну інформацію.

Пошукові Системи зазвичай складаються з трьох компонентів:

1. агент (павук або кроулер), який переміщається по Мережі і збирає інформацію;

2. база даних, яка містить всю інформацію, яка збирається павуками;

3. пошуковий механізм, який люди використовують як інтерфейс для взаємодії з базою даних.

Google - найпопулярніша в світі пошукова система. Нахабна, як і всі американці, але надає багато можливостей. Загалом, безперечний світовий лідер серед пошукових роботів.

Крім пошуку у Google є безліч інших сервісів різного спрямування.

Найбільша пошукова система, що належить корпорації Google Inc.

З пошукових систем Яндекс, мабуть, користується найбільшою популярністю серед російськомовних відвідувачів Інтернету.

Яндекс - вітчизняна пошукова система. Це одне з її небагатьох переваг. В іншому маємо повільне оновлення пошукової бази, постійну зміну правил гри (як для користувачів, так і для власників сайтів), своєрідне розуміння якості пошукової видачі і т.д. Загалом, вона популярна в Рунеті лише тому, що більшість користувачів не здогадується про існування інших іскалок.

Тут є список сервісів Яндекса для вирішення інших проблем.

Відмітна особливість Яндекса - можливість точної настройки пошукового запиту. Це реалізовано за рахунок гнучкого мови запитів.

Нова пошукова система від Microsoft - Bing замінила всі попередні пошукові системи від цієї всесвітньо відомої компанії. І, треба сказати, не випадково. Bing на порядок краще старих пошукових систем від Microsoft. пошуковий інформація яндекс google

Rambler Media Group (AIM: RMG) - інтернет-холдинг, до складу якого як сервісів пошукову систему, рейтинг-класифікатор ресурсів українського Інтернету, інформаційний інтернет-портал.

Пошукова система Рамблер розуміє і розрізняє слова української, англійської та української мов. За замовчуванням пошук ведеться за всіма формами слова. За замовчуванням в Рамблері результати ранжуються за ступенем відповідності (релевантність) запиту і групуються по сайтам.

Налаштування мови пошуку: будь-який, українська, англійська, українська, казахська, белоукраінскій, татарський, французький, німецький. враховується морфологія

Пошукова система містить інформацію про більш ніж 12 мільйонах документів, розташованих на серверахУкаіни і країн СНД. Рамблер обробляє щодоби не менше 500 тисяч пошукових запитів (в середньому - 5 запитів в секунду), скануючи 48 тисяч web-серверів і використовуючи кілька одночасно працюючих програм-роботів.

Запит може складатися з одного або декількох слів, розділених пробілами. Можуть бути використані як українські, так і англійські слова і словосполучення. За замовчуванням знаходяться тільки ті документи, в яких зустрілися всі введені Вами слова. Щоб знайти документи, що містять хоча б одне слово із запиту, використовуйте логічний зв'язку Or (див. Нижче) або виберіть на сторінці детального запиту: "Слова запиту: будь-". Щоб виключити документи, що містять ті чи інші слова, вкажіть на сторінці детального запиту: "Виключити документи, що містять такі слова.".

Все одно, з якої літери написані слова запиту: з великої чи з маленької. І при побудові індексу, і при пошуку за запитом усі великі (великі) букви "знижуються".

Слова запиту можуть бути з'єднані логічними зв'язками And ( "і"), Or ( "або"). Замість зв'язок (або в поєднанні з ними) можуть використовуватися також символи '', '|'.

Частини запиту можуть бути згруповані за допомогою круглих дужок (). Можлива багаторазова вкладеність дужок в поєднанні з логічними операторами.

Рамблер вміє шукати слова у всіх формах (наприклад, амінокислота, амінокислоти, амінокислотою і т. Д.). Щоб слово знаходилося у всіх формах, перед ним треба поставити службовий символ '#'. У меню детального запиту такий режим може бути включений для всіх слів: "Розширення запиту: всі форми слів". Службовий символ '@' перед словом дозволяє знаходити не тільки саме це слово, але і однокореневі слова. У меню детального запиту символу '@' відповідає режим "Розширення запиту: всі однокореневі".

За замовчуванням наша система шукає слова запиту так, як Ви їх ввели, щоб зменшити "шум" в знайдених документах. Якщо Ви не пам'ятаєте, як пишеться слово, чи хочете розширити запит, можна використовувати метасимволи '*' і '?' для позначення довільній частині слова і довільного символу.

Пошук в частині документа

Обмежити пошук частинами документів, такими як назва документа, його заголовок, URL і т.п. можна через меню детального запиту "Шукати в.".

Можна обмежити пошук документами тільки російською або тільки на англійській мові. Для цього треба вибрати відповідний режим в меню детального запиту "Мова документа.". За замовчуванням пошук виконується за документами на всіх мовах.

За замовчуванням знайдені документи сортуються за релевантністю (відповідності запиту). Однак Ви можете зажадати, щоб замість цього в початок списку були поміщені найсвіжіші (або, навпаки, найстаріші документи). Для цього треба вибрати відповідну установку в меню "Сортувати по." На сторінці детального запиту. Також можна обмежити пошук документами, створеними в певний період часу: для цього необхідно на сторінці детального запиту вказати "Від дати. До дати.".

Відстань між словами

Можна вимагати, щоб Рамблер повертав тільки ті документи, де слова із запиту знаходяться на мінімальній відстані один від одного. Режим "Обмежити відстань між словами" може бути включений в детальному запиті. Всі перераховані вище правила можуть бути використані спільно один з одним в необхідної Вам послідовності.

За замовчуванням результати пошуку видаються порціями по 15 документів. Меню "Видавати по." На сторінці детального запиту дозволяє збільшити це число до 30 або 50. Меню "Форма виведення." Дозволяє отримувати опису документів зі збільшеною або зменшеною подробицею.

Особливістю даної системи є те, що в запитах ви можете використовувати українські слова в будь-якій граматичній формі. Інтелектуальний механізм перетворення запитів розбереться з найскладнішими фразами

На поточний момент Апарат є частиною порталу РОЛ. Належить Golden Telecom. При пошуку враховуються особливості української мови.

Якщо Yahoo! не може встановити зв'язок досить швидко з Alta Vista, то в цьому випадку Yahoo! забезпечуватиме сторінку зв'язку з набором інструментів пошуку. Після того як одна з цих зв'язків вибирається, ключові слова передаються до пошукової машини на ваш розсуд.

Засобом, що полегшує пошук, є наявність "tip search" (TS) - пошук за допомогою "натяку": Yahoo! Є підлеглим довідником, що означає, що система не має так багато сторінок, як пошукові машини, однак завдання найбільш загальних ключових слів дозволить знайти необхідну тему на сторінці високого рівня (перша сторінка, яка виникає перед користувачем при відвідуванні сайту) для організації або компанії.

Результати: Зв'язки відображаються відповідно до черговості задаються слів послідовністю пошуку поряд з їх описовим текстом і підпорядкованої ієрархією.

Систему Yahoo зручно використовувати для пошуку спортивних подій, новин, прогнозів погоди, розваг і тому подібної інформації. Це обумовлено особливостями розбиття інформації на розділи в даній системі.

Сьогодні важко уявити собі світ без комп'ютера, і мало хто замислюється, а що ж насправді ми називаємо розумними машинами. І вже точно ніхто не знає наскільки стали розумними ці апарати. Для багатьох людей Штучний інтелект і комп'ютер який стоїть на вашому столі це одне і теж. Але як люди освічені ми знаємо, що до розуму людини, або навіть собаки будь найрозумнішою машині ще далеко.

За час існування Інтернету робилися різні спроби організації пошукових засобів. Багато з цих спроб виявилися невдалими, інші ж привели до створення зручних засобів пошуку інформації. Найбільш вдалі проекти з'явилися в останні п'ять років. Ми розглянули найбільш поширені системи пошуку. Всього ж у світі існують сотні різних пошукових систем, і вибір тієї чи іншої системи залежить тільки від особистих пристрастей. Якщо пошук не приніс бажаних результатів, перше, що потрібно зробити, так це перевірити орфографію введеного слова. Часто пошукова система нічого не може знайти тільки через те, що введеного терміна просто не існує в природі. Щоб з'ясувати це, потрібно поглянути на кількість знайдених ресурсів, що містять шукане слово (більшість пошукових систем виводять ці дані в самому початку листа результатів). Якщо слово не зустрічається жодного разу, то велика ймовірність його помилкового написання. Наступний крок - переконатися в чутливості (або нечутливості) системи до заголовних букв. Відповідно, потрібно скорегувати свій запит, вже виходячи з цієї обставини. Якщо ж слово написано правильно, а пошук все одно не дає результатів, то можна спробувати пошукати необхідну інформацію, використовуючи синоніми. Нарешті, не потрібно боятися розширеного пошуку - функції, що надається більшістю пошукових систем, та й цих слів нехтувати не варто.

Розміщено на Allbest.ru