Формула Байєса - це

«Фізичний сенс» і термінологія

Формула Байєса дозволяє «переставити причину і наслідок»: за відомим фактом події обчислити вірогідність того, що воно було викликано даної причиною.

Події, що відображають дію «причин», в даному випадку зазвичай називають гіпотезами. так як вони - передбачувані події, що призвели до дане. Безумовну ймовірність справедливості гіпотези називають апріорної (наскільки ймовірна причина взагалі), а умовну - з урахуванням факту події, що сталася - апостеріорної (наскільки ймовірна причина виявилася з урахуванням даних про подію).

Важливим наслідком формули Байеса є формула повної ймовірності події, що залежить від декількох несумісних гіпотез (і тільки від них!).

- ймовірність настання події B. залежить від ряду гіпотез Ai. якщо відомі ступеня достовірності цих гіпотез (наприклад, виміряні експериментально);

Якщо подія залежить тільки від причин Ai. то якщо воно відбулося, значить, обов'язково сталася якась із причин, тобто


За формулою Байєса


Перенесенням P (B) вправо отримуємо дані вираз.

Метод фільтрації спаму

Метод, заснований на теоремі Байеса, знайшов успішне застосування в фільтрації спаму.

При навчанні фільтра для кожного зустрінутого в листах слова вираховується і зберігається його «вага» - ймовірність того, що лист з цим словом - спам (в найпростішому випадку - за класичним визначенням ймовірності: «появ в спам / появ всього» [1]).

При перевірці знову прийшов листи обчислюється ймовірність того, що воно - спам, за вказаною вище формулою для безлічі гіпотез. В даному випадку «гіпотези» - це слова, і для кожного слова «достовірність гіпотези» -% цього слова в листі, а «залежність події від гіпотези» P (B | Ai) - вичісленнний раніше «вага» слова. Тобто «вага» листа в даному випадку - не що інше, як усереднений «вага» всіх його слів.

Віднесення листи до «спаму» чи «не-спаму» проводиться за тим, чи перевищує його «вага» якусь планку, задану користувачем (зазвичай беруть 60-80%). Після прийняття рішення по листу в базі даних оновлюються «ваги» для ввійшли в нього слів.

характеристика

Даний метод простий (алгоритми елементарні), зручний (дозволяє обходитися без «чорних списків» і подібних штучних прийомів), ефективний (після навчання на досить великій вибірці відсікає до 95-97% спаму, і в разі будь-яких помилок його можна дообучать). Загалом, є всі показання для його повсюдного використання, що і має місце на практиці - на його основі побудовані практично всі сучасні спам-фільтри.

Втім, у методу є і принциповий недолік: він базується на припущенні. що одні слова частіше зустрічаються в спам, а інші - в звичайних листах. і неефективний, якщо це припущення невірно. Втім, як показує практика, такий спам навіть людина не в змозі визначити «на око» - тільки прочитавши лист і зрозумівши його зміст.

Примітки

  1. ↑ В більш складних випадках можлива попередня обробка тексту: приведення слів в початкову форму, видалення службових слів, обчислення «ваги» для цілих фраз, транслітерація і ін.

Дивитися що таке "Формула Байеса" в інших словниках:

ФОРМУЛА ІМОВІРНОСТЕЙ ГІПОТЕЗ (ФОРМУЛА Байєса) - формула, що має вигляд: де a1, А2. Ап несумісні події, Загальна схема застосування Ф. в. м якщо подія В може відбуватися в разл. умовах, щодо яких зроблено п гіпотез А1, А2. Аn з відомими до досвіду можливостями P (A1), ... ... Геологічна енциклопедія

Формула повної ймовірності - дозволяє обчислити вірогідність цікавить події через умовні ймовірності цієї події в припущенні деяких гіпотез, а також ймовірностей цих гіпотез. Формулювання Нехай дано ймовірнісний простір. і повна група попарно ... ... Вікіпедія

Формула Повної Вірогідність - дозволяє обчислити вірогідність цікавить події через умовні ймовірності цієї події в припущенні деяких гіпотез, а також ймовірностей цих гіпотез. Формулювання Нехай дано ймовірнісний простір. і повна група подій. таких ... ... Вікіпедія

Теорема Байєса - (або формула Байеса) одна з основних теорем теорії ймовірностей, яка дозволяє визначити ймовірність того, що сталося якесь небудь подія (гіпотеза) при наявності лише непрямих підтверджень (даних), які можуть бути неточні ... Вікіпедія

Формули Байєса - Теорема Байєса одна з основних теорем елементарної теорії ймовірностей, яка визначає ймовірність настання події в умовах, коли на основі спостережень відома лише деяка часткова інформація про події. За формулою Байєса можна ... ... Вікіпедія

Байес - Байес, Томас Томас Байес Reverend Thomas Bayes Дата народження: 1702 рік (1702) Місце народження ... Вікіпедія

Байес, Томас - Томас Байес Reverend Thomas Bayes Дата народження: 1702 рік (1702) Місце народження: Лондон ... Вікіпедія

Байєсівський висновок - Байєсівський висновок один з методів статистичного висновку, в якому для уточнення імовірнісних оцінок на істинність гіпотез під час вступу свідоцтв використовується формула Байеса. Використання байєсівського поновлення особливо важливо в ... ... Вікіпедія

Дилема в'язня - Чи будуть укладені один одного зраджувати, слідуючи своїм егоїстичним інтересам, або будуть мовчати, тим самим мінімізуючи загальний термін? Дилема в'язня (англ. Prisoner s dilemma, рідше вживається назва «дилема ... Вікіпедія

  • Теорема Байєса. Джессі Рассел. Ця книга буде виготовлена ​​в відповідності з Вашим замовленням за технологією Print-on-Demand. High Quality Content by WIKIPEDIA articles! Теорема Байєса, Формула Байеса - одна з основних ... Детальніше Купити за 870 руб
  • Теорія ймовірностей і математична статистика в задачах. Більше 360 завдань і вправ. Борзих Д.А. У пропонованому посібнику містяться завдання різного рівня складності. Однак основний акцент зроблений на завданнях середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до ... Детальніше Купити за 676 руб
  • Теорія ймовірностей і математична статистика в задачах. Більше 360 завдань і вправ. Борзих Д.А. У пропонованому посібнику містяться завдання різного рівня складності. Однак основний акцент зроблений на завданнях середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до ... Детальніше Купити за 383 руб
Інші книги по запросу «Формула Байеса» >>