|
|
Меры важности концептов в семантической сети онтологической базы знаний # 07, июль 2010 Статья в PDF УДК 519.6
МГТУ им. Н.Э. Баумана,
Введение Можно выделить три следующих класса систем поддержки принятия решений (СППР): системы, основанные на использовании типовых решений; системы, использующие типовые правила синтеза решений; системы, использующие поиск прецедентов. Корпоративная база знаний представляет собой, как правило, совокупность разного рода слабоструктурированных документов, в которых с той или иной степенью подробности описаны прецеденты – некоторые ситуации и решения, которые были приняты в этих ситуациях. В СППР, которые используют такие базы знаний, поиск решения заключается в поиске в этих базах наиболее подходящих прецедентов и соответствующих им документов [1]. Эффективность поиска решений в базах знаний прецедентов в значительной мере зависит от используемых методов поиска. Современные поисковые системы основаны, преимущественно, на применении полнотекстового поиска – поиска в каждом из документов всех терминов, входящих в запрос. При этом учитывается частота встречаемость терминов в документе и их средняя языковая частотность [2]. Более эффективной альтернативой полнотекстовому поиску является поиск по метаданным – поиск по атрибутам документов, содержащимся в их метаданных. При этом классический атрибутивный поиск основывается на использовании в качестве метаданных документа преимущественно его регистрационных атрибутов (авторы документа, название документа, дата создания, тема и т.п.) [3]. Эффективный поиск решений в базах знаний прецедентов должен, очевидно, основываться не на регистрационных атрибутах документов, а на параметрах, характеризующих ситуацию принятия решения и само решение. Поэтому для СППР классический поиск по метаданным может играть лишь вспомогательную роль. В работе рассматривается подход к поиску решений в базах знаний прецедентов, в котором метаданные формируются на основе онтологии соответствующей предметной области, заданной в виде семантической сети. При этом релевантность документов оценивается близостью в некоторой метрике концептов, входящих в метаданные документа, и концептов поискового запроса [1]. Можно предложить значительное количество таких метрик, при построении которых может оказаться целесообразным учитывать «важность» фигурирующих в них концептов. В работе предлагается ряд мер важности концептов в семантической сети онтологической базы знаний. При разработке этих мер существенно используются некоторые результаты наших публикаций [4 - 8].
Модели семантических сетей Пусть Семантическую сеть Пусть Семантическую сеть Веса вершин и дуг графов
Метрики графа семантических сетей При построении мер важности концептов в семантических сетях Положим прежде, что между собой связаны все концепты семантической сети Тогда в качестве метрик графа Номер яруса ЯПФ графа Положим теперь, что тип отношений Наконец, в качестве метрики графа
где Аналогично, при построении мер важности концептов в семантической сети документа
Кластеризация семантических сетей Если концепты Пусть в узком смысле отношением типа Обозначим Отметим, что, поскольку концепт
Аналогично, обозначим Отметим, что кластер Совокупность всех концептов кластера Взвешенные мультиграфы, соответствующие кластерам Аналогично определим связи концептов документа
Веса вершин и дуг семантических сетей Поставим в соответствие каждому из типов отношений Определим прежде веса
Если отношения типа
Аналогично, вес
Для произвольного типа отношений
Аналогично, веса
Наряду с рассмотренными весами
и т.д. Большое количество выражений для весов Положим, что веса отношений
Аналогично можно использовать взвешенное число концептов, содержащихся во всех
Положим, что в формуле (1) влияние концептов на вес концепта
Формулы для вычисления веса
Аналогично, веса
Наряду с рассмотренными весами
Меры важности концептов в семантической сети документа Положим, что вес 1). Взвешенное число концептов, содержащихся во всех
2). Взвешенное число концептов, содержащихся во всех
3). Нормированное взвешенное число концептов, содержащихся во всех
4). Взвешенные максимальный, суммарный и средний из диаметров кластеров
5). Взвешенные максимальная, суммарная и средняя из реберных плотностей кластера
Кроме того, в качестве мер важности можно, очевидно, использовать нормированные тем или иным образом аналоги рассмотренных мер важности, а также различные свертки тех же мер важности. Отметим, что большие значения всех предложенных мер, соответствуют большим значениям важности соответствующих концептов.
Заключение В работе под онтологий Под отношениями Автор выражает благодарность И.П. Норенкову за постановку рассмотренной в работе задачи, а также за конструктивные обсуждения подходов к ее решению. Работа выполнена при поддержке гранта РФФИ 10-07-00401.
Литература 1. Норенков И.П. Интеллектуальные технологии на базе онтологий // Информационные технологии, 2010, ╧1, с.17-23. 2. Толчеев В.О. Методы выявления информационных признаков в задачах классификации текстовых документов // Информационные технологии, 2005, ╧8, с.14-21. 3. The Dublin Core® Metadata Initiative // (http://dublincore.org/). 4. Карпенко А.П., Соколов Н.К. Оценка сложности семантической сети в обучающей системе // Наука и образование: электронное научно- техническое издание, 2008, 11, (http://technomag.edu.ru/doc/106658.html). 5. Карпенко А.П., Соколов Н.К. Расширенная семантическая сеть обучающей системы и оценка ее сложности // Наука и образование: электронное научно- техническое издание, 2008, 12, (http://technomag.edu.ru/doc/111716.html). 6. Карпенко А.П., Галямова Е.В., Соколов Н.К. Методика контроля понятийных знаний субъекта обучения в обучающей системе // Наука и образование: электронное научно- техническое издание, 2009, 2, (http://technomag.edu.ru/doc/115086.html). 7. Карпенко А.П., Соколов Н.К. Меры сложности семантической сети в обучающей системе // М.: Вестник МГТУ им. Н.Э. Баумана, серия «Приборостроение», 2009, ╧1(74), с. 50-66. 8. Галямова Е.В., Карпенко А.П., Соколов Н.К., Ягудаев Г.Г. Контроль понятийных знаний субъекта обучения в обучающей системе // М.: Вестник МАДИ (ГТУ), 2009, ╧2(17), с.82-86. 9. Федотов И.Е. Некоторые приемы параллельного программирования: Учебное пособие.- М.: Изд-во МГИРЭА (ГУ), 2008.- 188 с. 10. Евстигнеев В.А. Применение теории графов в программировании. –М.: Наука, 1985.-332 с. 11. Ларичев О.И. Теория и методы принятия решений, а также Хроника событий в Волшебных странах. – М.: Университетская книга, Логос, 2006. -292 с.
Публикации с ключевыми словами: семантическая сеть, база знаний, система поддержки принятия решений, онтология Публикации со словами: семантическая сеть, база знаний, система поддержки принятия решений, онтология Смотри так же: Тематические рубрики: |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||