Семинар НУЛ ПОИС "Устранение семантического разрыва в управлении метаданными с помощью LLM"
Научно-учебная лаборатория процессно-ориентированных информационных систем (ПОИС): Научный сотрудник
Дата проведения: 12 февраля 17:00
Аннотация:
Каталог данных — это система управления метаданными, которая организует, описывает и обеспечивает поиск данных в корпоративной среде. Его эффективность напрямую зависит от полноты и качества метаданных; однако на практике многие объекты данных не имеют содержательных описаний. В исследовании предлагается подход к улучшению каталога данных с использованием больших языковых моделей (LLM), который позволяет автоматически генерировать текстовые описания как для таблиц, так и для их отдельных атрибутов на основе их имен, типов данных и выборочных значений. Экспериментальная оценка с использованием нескольких различных LLM показала, что этот метод повышает полноту и удобство использования каталога, улучшает и ускоряет поиск и интерпретацию данных, а также экономит время для администраторов данных и менеджеров каталога. Результаты подтверждают перспективность использования LLM для автоматизации управления метаданными и повышения ценности каталога данных для бизнес-пользователей.
