Московская Секция ACM SIGMOD
Научный сотрудник лаборатории Сергей Шершаков - докладчик на семинаре Московской секции ACM SIGMOD
31 октября в МГУ состоялось 207-е заседание семинара Московской секции ACM SIGMOD.
Сергей Шершаков выступил с докладом о реляционных системах управления баз данных (РСУБД) в process mining.
Мир становится сложнее с каждым днем. Сложнее становятся и процессы, окружающие нас. Трудно представить процесс, в который вовлечено большое число участников и/или ресурсов, без поддержки со стороны информационных систем (ИС). Специализированные ИС, разрабатываемые для поддержки процессов, относят к классу процессно-ориентированных ИС. Большинство современных ИС фиксируют информацию об отдельных моментах своей работы в виде журналов (логов), которые могут быть использованы для обнаружения дефектов и контроля правильности их работы. Особенность ПОИС заключается в том, что их логи часто содержат информацию о событиях, по которой можно восстанавливать модели процессов, сопровождаемые этими системами.
Process mining (извлечение и анализ процессов) — это обобщающее название для группы исследовательских дисциплин по извлечению из логов (журналов) событий процессов в виде моделей, их анализу и улучшению процессов. К настоящему моменту разработано большое количество техник process mining. Все их объединяет использование журналов событий в качестве отправной точки для исследования. В большинстве случаев такие журналы являются плоскими (flat event logs) и, как правило, представляются в формате текстового файла. Обычно один плоский журнал содержит одну подготовленную для исследования перспективу (view) процесса.
Значительное число ИС, работающих с данными большого объема, используют технологии реляционных баз данных (РБД) для их эффективного хранения и обработки. В последнее время наметилась тенденция к интеграции систем управления РБД (РСУБД) с инструментами process mining. Тесное взаимодействие инструментов process mining с РСУБД позволяет перенести часть дорогостоящих операция по предобработке данных непосредственно на уровень РСУБД.
В докладе Сергей обозначил текущее состояние исследований в части взаимодействия process mining и РСУБД. Был представлен подход, в соответствии с которым произвольная БД может служить прямым источником событийных данных для инструментов process mining. В соответствии с этим подходом необходимые данные извлекаются некоторым алгоритмом process mining непосредственно из БД без формирования промежуточных плоских логов. В основе подхода лежит метод по трансляции конкретной структуры событийных данных, представленной в БД, в абстрактное представление журнала событий. Особенностью подхода является метод вложения (embedding) схем трансляции — непосредственно в БД в виде т.н. конфигураций. Каждая такая конфигурация представляет одну процессную перспективу (process view). Вложение в журнал нескольких конфигураций позволяет превратить БД в мульти-перспективный журнал событий, позволяющий осуществлять переключение между отдельными перспективами без необходимости перестроения такого журнала.
Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований, проект № 18-37-00438 "мол_а".