Фильтрация по базе ЦАИР EcoNAT Documentation / Фильтрация по базе ЦАИР
В системе EcoSGE реализована возможность URL-фильтрации по базе данных Центра анализа интернет-ресурсов (ЦАИР). Для подключения базы необходима соответствующая лицензия (CAIR).
Список установленных лицензий выводится командой show license.
EcoSGE:# show license
CGNAT: Ok
BRAS: Ok
DPI: Ok
URL filter: Ok
RADIUS: Ok
CAIR: Ok
При наличии данной лицензии в ветке конфигурации system.dpi доступен элемент cair, который является модифицированной версией списка DPI со следующими параметрами:
EcoSGE:system.dpi.cair# ls
base_url "http://md5.base.cdn.cair.ru/last.txt"
uplevel_domains_url "http://md5.base.cdn.cair.ru/uplevel_domains.txt"
update_schedule interval 86400
Где:
base_url – адрес базы ЦАИР;
uplevel_domains_url – адрес базы доменов верхнего уровня (ДВУ);
update_schedule – периодичность автоматического обновления баз в секундах; при значении never автоматическое обновление выключено.
Загрузка баз ЦАИР и ДВУ вручную производится командами dpiload cair и dpiload uplevel соответственно. Рекомендуется регулярно обновлять обе базы (автоматически или вручную).
Информация о сайтах в базах хранится в формате <md5 hash hostname> <номера категорий сайтов в 16-ричном виде через двоеточие>. Пример:
# head cair.txt -1
823211830251a3d40804125cdf1a1b13 2
Базы содержат только домены, то есть, например, "www.example.com", но не "www.example.com/theme/1".
Все домены, содержащиеся в базе ЦАИР, блокируются аналогично принципу блокировки записей типа "domain-mask". Например, если в базе ЦАИР есть запись вида "example.com", то будет осуществляться фильтрация HTTP- и HTTPS-запросов к ресурсам "www.example.com", "help.example.com", "123.example.com" и так далее.
Для включения категорий ЦАИР в действие какого-либо списка DPI используется параметр cair_categories, в котором категории также указываются в 16-ричном виде через двоеточие. Пример:
EcoSGE:system.dpi.dpilist1# ls
enable
bittorrent off
whitelist_mode off
log_matches off
log_pictures off
exceptions off
behaviour ignore
redirect_use_interval off
redirect_interval 600
redirect_interval_url 2592000
redirect_url "http://blocked.operator.ru"
color_direction both
color_tos_byte 32
download_url ""
update_schedule never
cair_categories "1:2:20:30:35:36:37:38:39:3c:3e:3f:41:44:49:4e:4f:54:5c:5d:5e:63"
no_ip ( )
no_ip_remote ( )
ip ( 0.0.0.0/0 )
no_ipv6 ( )
ipv6 ( )
Список категорий и соответствующие им номера представлены в таблице ниже.
Номер 10-ричный | Номер 16-ричный | Категория |
---|---|---|
1 | 1 | Алкоголь |
2 | 2 | Эротика, порнография |
3 | 3 | Реклама |
4 | 4 | Власти, правительство |
5 | 5 | Авто |
6 | 6 | Кино, онлайн-видео |
7 | 7 | Строительство и ремонт |
8 | 8 | Предметы потребления |
9 | 9 | Кулинария |
10 | A | Дача |
11 | B | Курсы, обучение |
12 | C | Электроника и электротехника |
13 | D | Промышленное оборудование |
14 | E | Семья |
15 | F | Мода и стиль |
16 | 10 | Финансы |
17 | 11 | Изобразительное искусство |
18 | 12 | Компьютеры, аппаратное обеспечение |
19 | 13 | Здоровье |
20 | 14 | Хобби |
21 | 15 | Юмор |
22 | 16 | Интерьер |
23 | 17 | Доступ в Интернет Сайты компаний, предоставляющих услуги доступа в Интернет. |
24 | 18 | Юридические услуги |
25 | 19 | Литература, электронные книги |
26 | 1A | СМИ |
27 | 1B | Машиностроение |
28 | 1C | Металлургия |
29 | 1D | Мобильная связь |
30 | 1E | Музыка |
31 | 1F | Общественные организации |
32 | 20 | Компьютерные игры |
33 | 21 | Домашние животные |
34 | 22 | Фото |
35 | 23 | Афиша |
36 | 24 | Недвижимость |
37 | 25 | Религия |
38 | 26 | Школа |
39 | 27 | Наука |
40 | 28 | Спорт |
41 | 29 | Театры |
42 | 2A | Транспорт |
43 | 2B | Туризм |
44 | 2C | Университеты |
45 | 2D | Работа и вакансии |
46 | 2E | Создание сайтов |
47 | 2F | Чаты |
48 | 30 | Сайты знакомств |
49 | 31 | Войска и вооружение |
50 | 32 | Форумы и блоги |
51 | 33 | Сервера бесплатной электронной почты |
52 | 34 | Бесплатные хостинги |
53 | 35 | Нелегальная помощь школьникам и студентам |
54 | 36 | Убийства, насилие, трупы |
55 | 37 | Онлайн-казино |
56 | 38 | Социальные сети |
57 | 39 | Терроризм, экстремизм |
58 | 3A | Торговля |
59 | 3B | Нижнее белье, купальники |
60 | 3C | Обеспечение анонимности, обход контентных фильтров |
61 | 3D | Службы обмена сообщениями |
62 | 3E | Файлообменные сети и сайты |
63 | 3F | Табак |
64 | 40 | Поисковые системы |
65 | 41 | Наркотики |
66 | 42 | Злоупотребление свободой в СМИ |
68 | 44 | Вредоносные программы |
69 | 45 | Ненадлежащая реклама |
70 | 46 | Информация с ограниченным доступом |
71 | 47 | Банеры и рекламные программы |
72 | 48 | Вождение и автомобили (негатив) |
73 | 49 | Досуг и развлечение (негатив) |
74 | 4A | Здоровье и медицина (негатив) |
75 | 4B | Корпоративные сайты |
77 | 4D | Отправка СМС сообщений с помощью Интернет-ресурсов |
78 | 4E | Доски объявлений |
79 | 4F | Неприличный и грубый юмор |
81 | 51 | Системы поиска изображений |
82 | 52 | Программное обеспечение |
83 | 53 | Информационный мусор |
84 | 54 | Баннерные сервера |
85 | 55 | Белый список |
86 | 56 | Безопасные для детей сайты |
87 | 57 | Сервисы коротких ссылок |
88 | 58 | Спам |
89 | 59 | Нарушение авторских прав и смежных прав |
90 | 5A | Единый реестр Роскомнадзор Сайты содержащие информацию, распространение которой в Российской Федерации запрещено (http://eais.rkn.gov.ru). |
91 | 5B | Мошенники |
92 | 5C | Федеральный список экстремистских материалов |
93 | 5D | Детское порно |
94 | 5E | Магия, колдовство, оккультизм, теургия |
95 | 5F | Счетчики, аналитика, метрика, статистика |
96 | 60 | Женские сайты и журналы |
97 | 61 | Мужские сайты и журналы |
98 | 62 | Заработок в Интернет Сайты, заявленные для заработка в интернете, торговля бинарными опционами и прочими |
100 | 64 | Подделка документов |
101 | 65 | Служебные сайты (api, скрипты, js) |
102 | 66 | Прочие услуги |
103 | 67 | Справочники, каталоги |
145 | 91 | Реестр безопасных образовательных сайтов (РБОС). Подробная информация доступна по ссылке |
Команда show cairrecords <URL> позволяет узнать, к каким категориям ЦАИР относится тот или иной адрес. Пример:
EcoSGE:system.dpi.dpilist1# show cairrecords example1.com
domain example1.com is present in CAIR categorie(s) 30:2f:38
EcoSGE:system.dpi.dpilist1# show cairrecords example2.com
domain example2.com is present in CAIR categorie(s) 37:5a
EcoSGE:system.dpi.dpilist1# show cairrecords example3.com
domain example3.com is not present in CAIR categories