Технологии от Infowatch. Информационная безопасность предприятия

DLP-система InfoWatch Traffic Monitor

Контроль информационных потоков и предотвращение неправомерных действий с информацией

Получить консультацию

Технологии

Лингвистический анализ

Детектор текстовых объектов

Детектор эталонных документов

Детектор графических объектов

Детектор выгрузок из баз данных

Детектор заполненных бланков

Лингвистический анализ

Запатентованные технологии лингвистического анализа

Лингвистический анализ InfoWatch имеет дело не с документами (их может быть больше миллиона в одной компании), а с категориями данных – их десятки, реже - сотни.

InfoWatch Traffic Monitor автоматически классифицирует информационные потоки компании, распределяя их «по полочкам» - категориям и терминам. Например, могут быть заданы такие категории: грифы секретности, Финансы, Маркетинг, Продажи. Информационные потоки, собранные в такие категории, подкатегории и термины образуют контентное дерево компании - базу контентной фильтрации (БКФ).

Общие категории и термины

В состав InfoWatch Traffic Monitor входит стандартная БКФ, содержащая наиболее общие категории и термины, встречающиеся практически в любых областях. Такая БКФ гарантирует детектирование данных по общим тематикам – «Счета», «Бухгалтерия», «Кредиты», «Тендеры», «HR» и т.д.

Оптимизированные БКФ

На основе своего многолетнего сотрудничества с компаниями, работающими на различных вертикальных рынках, InfoWatch разработала ряд БКФ, оптимизированных под потребности конкретных сегментов рынка.

Высокая точность детектирования информации

Использование отраслевой БКФ, оптимизированной под определенный вертикальный рынок, позволяет компании незамедлительно обеспечить высокую точность детектирования конфиденциальной информации и повышать эффективность использования DLP-системы.

Сегодня InfoWatch предлагает более 290 отраслевых и тематических БКФ, среди них:

банковская
страховая
нефтегазовая
телекоммуникационная
медицинская
строительная

инженерно-производственная
государственная (выявление нарушений законодательства РФ)
мошенничество
геополитика
т.д.

Создание индивидуальной БКФ

В InfoWatch Traffic Monitor реализована технология создания собственной базы контентной фильтрации «под ключ».

Искусственный интеллект анализирует весь трафик компании, разбивает все документы на категории и строит для каждой из них лингвистическую модель – набор правил, по которым система научится классифицировать документы, как относящиеся к этой категории. На основе такой модели можно настроить политику безопасности. Качество такой модели соответствует качеству работы профессионального компьютерного лингвиста.

Детектор эталонных документов защищает большие по объему документы, содержание которых не изменяется или меняется незначительно.

Технология автоматически обнаруживает в анализируемом тексте цитаты из эталонных документов (образцов), содержащих конфиденциальную информацию.

Детектор эталонных документов рекомендуется применять в случаях, когда необходимо:

защищать редко изменяемые или статичные документы (регламенты, Устав, инструкции и т.д.)
распознавать цитаты из документов-образцов, находить схожие документы
выявлять в потоках данных не только дословные совпадения, но и модифицированные фрагменты текста

Из эталонных документов организации создаются цифровые отпечатки. Технология выявляет в потоке данных совпадения с цифровыми отпечатками с учетом лингвистики, что повышает качество детектирования конфиденциальной информации и обеспечивает надежную защиту с минимальным количеством ложных срабатываний.

Технология работает, даже при попытках «замусоривания» текста, когда злоумышленник пытается изменить форматирование, добавить лишние символы и пунктуацию, пишет транслитерацией или в разных регистрах.

Запатентованная InfoWatch технология, которая защищает базы данных компании от утечек.

«Детектор выгрузок из баз данных» фиксирует наличие эталонных выгрузок из баз данных в сетевом трафике, текстовых документах и вложениях. Технология делает возможным оперативно реагировать на передачу информации, скопированной из базы данных, выявлять нарушителя и использовать цифровые доказательства по инциденту в случае необходимости проведения расследования.

Офицер безопасности может задавать критерии срабатывания технологии: определять, какая комбинация столбцов из базы данных будет детектироваться как утечка, а какая комбинация выгрузки не является критичной для бизнеса. Например, фамилии и имена клиентов сами по себе не будут определяться как утечка, а список клиентов с полными контактами уже относится к коммерческой тайне и детектироваться системой. Тайну могут составлять как один, так и несколько столбцов, а также сочетание одного столбца и любого из нескольких заданных (например, различное написание названия организации).

высокая производительность технологии, что позволяет защищать большие объемы баз данных:
- обработка до 54 млн записей в секунду
- объем поддерживаемого отпечатка базы данных - 5 млн записей
гибкая настройка под специфические форматы данных, хранящихся в базах данных
простое создание новых эталонных выгрузок баз данных
технология срабатывает, даже если база данных выгружается в виде текста (plain text) или html-кода (html text)

Технология отслеживает передачу по различным каналам анкет и квитанций, содержащих персональные данные, и уведомляет офицера безопасности и всех заинтересованных лиц.

Настройка технологии не требует специальных знаний. Офицер безопасности загружает эталонные бланки через консоль InfoWatch Traffic Monitor. Поддерживаются различные форматы файлов: docx, doc, dot, dotm, dotx, xls, xlsx, xlt, xltm, xltx, ods, odt, rtf, txt, vsd, html, htm, pdf, chm. При обнаружении признаков эталонной формы в потоке сетевого трафика офицер информационной безопасности получает уведомление об утечке конфиденциальной информации.

Производительность технологии составляет 12,7 млн знаков в секунду, в условиях анализа одновременно 150-ти анкет. Это позволяет защищать большой объем персональных данных, содержащихся в опросниках, анкетах, бланках организации и т.д.

детектирует заполненные формы различных форматов (.doc/.docx,.rtf.xls/.xlsx,.pdf, jpg, png, gif)
перехватывает бланки, заполненные от руки, отсканированные анкеты, частично заполненные формы, а также формы, пересылаемые в теле сообщения
низкий показатель ложных срабатываний
простое добавление новых эталонных бланков