Обнаружение поддельных электронных писем — игнорируются диакритические знаки в словаре?
-
Здравствуйте, у нас есть настраиваемый фильтр контента — для обнаружения поддельных писем — который включает словарь с некоторыми внутренними названиями компаний. Этот фильтр в целом работает хорошо, обнаруживает поддельные письма и отправляет их в карантин. Но сегодня через этот фильтр прошло ложное электронное письмо, содержащее имя и фамилию, которые включены в словарь. Единственное, что приходит в голову, это то, что проблема может быть в диакритических знаках, которые содержатся в этом словаре: ří č ý В чем может быть причина того, что ESA-a не обнаружила это поддельное письмо на основе нашего словаря? Кто-нибудь еще сталкивался с подобной проблемой? С уважением, Лука
-
Привет,
@lukaklepic
, Насколько я понимаю, ESA использует кодировку ASCII для сопоставления словарей, которая не поддерживает диакритические знаки, такие как ř, í, č и ý. Поэтому словарная запись с этими символами не распознается ESA как действительное совпадение.
Здравствуйте! Похоже, вам интересна эта беседа, но у вас пока нет учетной записи.
Вы устали просматривать одни и те же посты каждый раз, когда заходите на сайт? После регистрации, вам не придётся искать обсуждения в которых вы принимали участие, настройте уведомления о новых сообщениях так как вам это удобно (по электронной почте или уведомлением). У вас появится возможность сохранять закладки и ставить лайки постам, чтобы выразить свою благодарность другим участникам сообщества.
С вашими комментариями этот пост может стать ещё лучше 💗
Зарегистрироваться Войти