Технологии
Запатентованные технологии лингвистического анализа
Лингвистический анализ InfoWatch имеет дело не с документами (их может быть больше миллиона в одной компании), а с категориями данных – их десятки, реже - сотни.
InfoWatch Traffic Monitor автоматически классифицирует информационные потоки компании, распределяя их «по полочкам» - категориям и терминам. Например, могут быть заданы такие категории: грифы секретности, Финансы, Маркетинг, Продажи. Информационные потоки, собранные в такие категории, подкатегории и термины образуют контентное дерево компании - базу контентной фильтрации (БКФ).
Общие категории и термины
В состав InfoWatch Traffic Monitor входит стандартная БКФ, содержащая наиболее общие категории и термины, встречающиеся практически в любых областях. Такая БКФ гарантирует детектирование данных по общим тематикам – «Счета», «Бухгалтерия», «Кредиты», «Тендеры», «HR» и т.д.
Оптимизированные БКФ
На основе своего многолетнего сотрудничества с компаниями, работающими на различных вертикальных рынках, InfoWatch разработала ряд БКФ, оптимизированных под потребности конкретных сегментов рынка.
Высокая точность детектирования информации
Использование отраслевой БКФ, оптимизированной под определенный вертикальный рынок, позволяет компании незамедлительно обеспечить высокую точность детектирования конфиденциальной информации и повышать эффективность использования DLP-системы.
Сегодня InfoWatch предлагает более 290 отраслевых и тематических БКФ, среди них:
- банковская
- страховая
- нефтегазовая
- телекоммуникационная
- медицинская
- строительная
- инженерно-производственная
- государственная (выявление нарушений законодательства РФ)
- мошенничество
- геополитика
- т.д.
Создание индивидуальной БКФ
В InfoWatch Traffic Monitor реализована технология создания собственной базы контентной фильтрации «под ключ».
Искусственный интеллект анализирует весь трафик компании, разбивает все документы на категории и строит для каждой из них лингвистическую модель – набор правил, по которым система научится классифицировать документы, как относящиеся к этой категории. На основе такой модели можно настроить политику безопасности. Качество такой модели соответствует качеству работы профессионального компьютерного лингвиста.