Множество — это совокупность объектов, объединённых по какому-либо признаку. В контексте поисковых запросов множество — это набор страниц, которые содержат определённое слово или соответствуют запросу.
Например:
Запрос Царь | Иван найдёт страницы, где есть слово «Царь» или слово «Иван» (или оба).
Запрос Царь & Иван найдёт страницы, где есть оба слова одновременно.
Запрос Царь & !Иван найдёт страницы со словом «Царь», но без слова «Иван».
Запрос A | B | C найдёт страницы, где есть хотя бы одно из слов.
Запрос A & B & C найдёт страницы, где есть все три слова.
Запрос A & (B | C) найдёт страницы, где есть A и хотя бы одно из B или C.
Объединение = сумма минус пересечение (чтобы не считать дважды)
Раскрываем скобки по правилу дистрибутивности
Нарисуйте три пересекающихся круга для каждого множества. Обозначьте области.
Отметьте на диаграмме все известные значения из условия задачи.
Используйте формулы для связей между областями. Выразите искомую область.
Подставьте значения и вычислите ответ. Проверьте логику.
Запросы: «Крокодил» — 432 тыс., «Гена» — 543 тыс., «Крокодил & Гена» — 205 тыс.
Найти: «Крокодил | Гена» = ?
Решение:
По формуле: A | B = A + B - A & B
«Крокодил | Гена» = 432 + 543 - 205
= 975 - 205 = 770 тыс.
✓ Ответ: 770 тысяч страниц
Дано: «Царь» — 340 тыс., «Иван» — 260 тыс., «Полтава» — 120 тыс.
«Царь | Иван | Полтава» — 660 тыс., «Царь & Иван» — 40 тыс., «Царь & Полтава» — 0 тыс.
Найти: «Иван & Полтава» = ?
Решение:
По формуле для трёх множеств:
A|B|C = A + B + C - A&B - A&C - B&C + A&B&C
Поскольку «Царь & Полтава» = 0, то и A&B&C = 0
660 = 340 + 260 + 120 - 40 - 0 - X + 0
660 = 720 - 40 - X
X = 680 - 660 = 20 тыс.
✓ Ответ: 20 тысяч страниц
Дано: A & (B | C) = 915, A & B & C = 405, A & C = 615
Найти: A & B = ?
Решение:
Формула: A & (B | C) = A&B + A&C - A&B&C
915 = X + 615 - 405
X = 915 - 615 + 405 = 705