Формула Байєса - це
«Фізичний сенс» і термінологія
Формула Байєса дозволяє «переставити причину і наслідок»: за відомим фактом події обчислити вірогідність того, що воно було викликано даної причиною.
Події, що відображають дію «причин», в даному випадку зазвичай називають гіпотезами. так як вони - передбачувані події, що призвели до дане. Безумовну ймовірність справедливості гіпотези називають апріорної (наскільки ймовірна причина взагалі), а умовну - з урахуванням факту події, що сталася - апостеріорної (наскільки ймовірна причина виявилася з урахуванням даних про подію).
Важливим наслідком формули Байеса є формула повної ймовірності події, що залежить від декількох несумісних гіпотез (і тільки від них!).
- ймовірність настання події B. залежить від ряду гіпотез Ai. якщо відомі ступеня достовірності цих гіпотез (наприклад, виміряні експериментально);
Якщо подія залежить тільки від причин Ai. то якщо воно відбулося, значить, обов'язково сталася якась із причин, тобто
За формулою Байєса
Перенесенням P (B) вправо отримуємо дані вираз.
Метод фільтрації спаму
Метод, заснований на теоремі Байеса, знайшов успішне застосування в фільтрації спаму.
При навчанні фільтра для кожного зустрінутого в листах слова вираховується і зберігається його «вага» - ймовірність того, що лист з цим словом - спам (в найпростішому випадку - за класичним визначенням ймовірності: «появ в спам / появ всього» [1]).
При перевірці знову прийшов листи обчислюється ймовірність того, що воно - спам, за вказаною вище формулою для безлічі гіпотез. В даному випадку «гіпотези» - це слова, і для кожного слова «достовірність гіпотези» -% цього слова в листі, а «залежність події від гіпотези» P (B | Ai) - вичісленнний раніше «вага» слова. Тобто «вага» листа в даному випадку - не що інше, як усереднений «вага» всіх його слів.
Віднесення листи до «спаму» чи «не-спаму» проводиться за тим, чи перевищує його «вага» якусь планку, задану користувачем (зазвичай беруть 60-80%). Після прийняття рішення по листу в базі даних оновлюються «ваги» для ввійшли в нього слів.
характеристика
Даний метод простий (алгоритми елементарні), зручний (дозволяє обходитися без «чорних списків» і подібних штучних прийомів), ефективний (після навчання на досить великій вибірці відсікає до 95-97% спаму, і в разі будь-яких помилок його можна дообучать). Загалом, є всі показання для його повсюдного використання, що і має місце на практиці - на його основі побудовані практично всі сучасні спам-фільтри.
Втім, у методу є і принциповий недолік: він базується на припущенні. що одні слова частіше зустрічаються в спам, а інші - в звичайних листах. і неефективний, якщо це припущення невірно. Втім, як показує практика, такий спам навіть людина не в змозі визначити «на око» - тільки прочитавши лист і зрозумівши його зміст.
Примітки
- ↑ В більш складних випадках можлива попередня обробка тексту: приведення слів в початкову форму, видалення службових слів, обчислення «ваги» для цілих фраз, транслітерація і ін.
Дивитися що таке "Формула Байеса" в інших словниках:
ФОРМУЛА ІМОВІРНОСТЕЙ ГІПОТЕЗ (ФОРМУЛА Байєса) - формула, що має вигляд: де a1, А2. Ап несумісні події, Загальна схема застосування Ф. в. м якщо подія В може відбуватися в разл. умовах, щодо яких зроблено п гіпотез А1, А2. Аn з відомими до досвіду можливостями P (A1), ... ... Геологічна енциклопедія
Формула повної ймовірності - дозволяє обчислити вірогідність цікавить події через умовні ймовірності цієї події в припущенні деяких гіпотез, а також ймовірностей цих гіпотез. Формулювання Нехай дано ймовірнісний простір. і повна група попарно ... ... Вікіпедія
Формула Повної Вірогідність - дозволяє обчислити вірогідність цікавить події через умовні ймовірності цієї події в припущенні деяких гіпотез, а також ймовірностей цих гіпотез. Формулювання Нехай дано ймовірнісний простір. і повна група подій. таких ... ... Вікіпедія
Теорема Байєса - (або формула Байеса) одна з основних теорем теорії ймовірностей, яка дозволяє визначити ймовірність того, що сталося якесь небудь подія (гіпотеза) при наявності лише непрямих підтверджень (даних), які можуть бути неточні ... Вікіпедія
Формули Байєса - Теорема Байєса одна з основних теорем елементарної теорії ймовірностей, яка визначає ймовірність настання події в умовах, коли на основі спостережень відома лише деяка часткова інформація про події. За формулою Байєса можна ... ... Вікіпедія
Байес - Байес, Томас Томас Байес Reverend Thomas Bayes Дата народження: 1702 рік (1702) Місце народження ... Вікіпедія
Байес, Томас - Томас Байес Reverend Thomas Bayes Дата народження: 1702 рік (1702) Місце народження: Лондон ... Вікіпедія
Байєсівський висновок - Байєсівський висновок один з методів статистичного висновку, в якому для уточнення імовірнісних оцінок на істинність гіпотез під час вступу свідоцтв використовується формула Байеса. Використання байєсівського поновлення особливо важливо в ... ... Вікіпедія
Дилема в'язня - Чи будуть укладені один одного зраджувати, слідуючи своїм егоїстичним інтересам, або будуть мовчати, тим самим мінімізуючи загальний термін? Дилема в'язня (англ. Prisoner s dilemma, рідше вживається назва «дилема ... Вікіпедія
- Теорема Байєса. Джессі Рассел. Ця книга буде виготовлена в відповідності з Вашим замовленням за технологією Print-on-Demand. High Quality Content by WIKIPEDIA articles! Теорема Байєса, Формула Байеса - одна з основних ... Детальніше Купити за 870 руб
- Теорія ймовірностей і математична статистика в задачах. Більше 360 завдань і вправ. Борзих Д.А. У пропонованому посібнику містяться завдання різного рівня складності. Однак основний акцент зроблений на завданнях середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до ... Детальніше Купити за 676 руб
- Теорія ймовірностей і математична статистика в задачах. Більше 360 завдань і вправ. Борзих Д.А. У пропонованому посібнику містяться завдання різного рівня складності. Однак основний акцент зроблений на завданнях середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до ... Детальніше Купити за 383 руб