36. Классификация и кодирование информации

Классификация - это система распределения объектов по классам в соответствии с определенным признаком.

Применительно к информации как к объекту классификации выделенные классы называются Информационными объектами. Свойства информационного объекта определяются параметрами, которые называются Реквизитами.

Реквизит - это логически неделимый элемент, описывающий определенное свойство объекта.

В любой стране применяются государственные, отраслевые или региональные классификаторы. Классификатор - это систематизированный свод наименований и кодов классификационных группировок.

Разработаны три метода классификации объектов: иерархический, фасетный и дескрипторный. Они различаются разной стратегией применения классификационных признаков, которые позволяют установить сходство или различие объектов.

Иерархическая система

Сначала исходное множество элементов составляет нулевой уровень и делится в зависимости от выбранного признака на классы, которые образуют первый уровень; затем каждый класс первого уровня делится на подклассы второго уровня в соответствии со своим, характерным для него признаком, и т. д. (рис.2).

Получается жёсткая структура, поэтому следует особое внимание уделить выбору классификационных признаков.

Достоинства иерархической сис­темы:

¾ простота построения;

¾ возможность использования незави­симых признаков в различных ветвях иерархии.

Недостатки:

¾ жёсткая структура приводит к сложности внесения изменений (приходится перераспределять все классификационные группировки);

¾ невозможно группировать объекты по заранее не предусмотренным сочетаниям признаков.

Фасетная система

Позволяет выбирать признаки классификации независимо друг от друга. Признаки называются Фасетами (facet-рамка). Каждый фасет Фi содержит совокупность однородных значений данного признака. Значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочить.

Пример. Фасет Цвет содержит значения: красный, белый, зеленый, черный, желтый. Фасет Специальность содержит названия специальностей. Фасет Образование содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации обычно оформляется в виде таблицы:

 


Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. Могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов и порядок их следования:

Структурная формула KS=(Ф1, Ф2, … , Фn)

Фi - фасет, n-количество фасетов.

Необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

Достоинства фасетной системы:

¾ можно создать классификацию большой емкости;

¾ простота модификации системы без изменения существующей структуры.

Недостаток-сложность построения при учете всего многообразия признаков.

Пример.

Факультет

Возраст

Пол

Дети

Экономический

До 20

Мужской

Есть

Юридический

20-30

Женский

Нет

Больше 30

Структурная формула любого класса:

К1=(Экономический, до 20, мужской, есть дети)

К2=(Юридический, 20-30, женский, нет детей) и т. д.

Дескрипторная (описательная) система.

По этой системе отбирается совокупность ключевых слов, описывающих предметную область или совокупность объектов. Выбранные ключевые слова Нормализуются, т. е. из совокупности синонимов выбираются наиболее употребительные. Наконец, Создается словарь дескрипторов. Между дескрипторами устанавливают связи: синонимические, родо - видовые и ассоциативные.

© 2011-2024 Контрольные работы по математике и другим предметам!