Прогнозирование результатов учебы студентов с помощью методов ИИ

Автор работы: Пользователь скрыл имя, 09 Декабря 2010 в 08:40, курсовая работа

Описание работы

РО, ЭС. Анализ результатов тестирования. Прогнозирование результатов тестирования, объяснение результатов прогноза, оценка знаний студентов.

Файлы: 1 файл

Курсовая работа.doc

— 662.50 Кб (Скачать файл)

     В пакете имеются три различные возможности формирования названных выборок:

  1. по результатам таксономии,
  2. случайным образом,
  3. по указанию пользователя.

 

      1. Задачи классификации, диагностики и прогнозирования.

     Под диагностикой состояния системы  понимается его классификация, т.е. отнесение его к одному из известных  классов- образов. Часто возникают  вопросы относительно числа и  состава признаков, необходимых  для описания классифицируемых объектов, количества классов-образов, критериев решения задачи обучения и т. д. К сожалению, на эти вопросы трудно ответить однозначно, не зная конкретной задачи. Тем не менее, некоторые рекомендации можно привести.

     Так при решении задач медицинской диагностики выбирают 10-50 признаков (на первом этапе)  В их число должны входить доступные учеты и измерению признаки, имеющие прямое или косвенное отношение к природе рассматриваемого явления,  по мнению специалистов.

     Выбранная система может оказаться избыточной или содержать малоинформативные признаки, поэтому в пакете КВАЗАР предусмотрена возможность оценки информативности и отбора признаков.

     Что касается объема обучающей выборки, то желательно, чтобы число входящих в неё векторов, по крайней мере, в 3-5 раз (некоторые авторы рекомендуют в 10 и более) превосходило число существенных признаков.

 

  1. ПРАКТИЧЕСКАЯ ЧАСТЬ

     Исходными данными для анализа являются результаты тестирования студентов. Результаты тестов формируются в файл в формате .dat, где номер вектора – это порядковый номер студента, а признаки – это тесты.

3.1. Описание входных данных.

     Файл  данных обычно бывает подготовлен в  символьном виде массива – матрица  “ объект  - признаки”. При решении задачи обучения по прецедентам (фактам) в входном файле должен соблюдаться следующий порядок векторов – объектов:

  1. векторы известной принадлежности, представленные на обучение (из них пакет автоматически или на основе указаний пользователя может сформировать обучающую и проверочные выборки); при этом сначала следуют векторы 1 класса – образа, затем второго и т.д.;
  2. векторы, предъявленные для рабочего распознавания (при наличии)

     Работая с пакетом КВАЗАР, нумеровать векторы  не следует. Номер вектора определяется его местом в файле  (массиве) обрабатываемых данных.

     Каждая запись – объект  “ n”- мерный вектор состоит из признаков вещественных чисел, которые разделяются пробелом или запятой, в конце описания вектора ставится символ “;”. Набор следующего вектора  новая запись, т.е. новая строка. В начале вектора можно указывать имена векторов, которые отделяются от признаков символом “:”.

     Данные  должны быть набраны в “DOS” кодировке в любом редакторе, например БЛОКНОТ шрифт Terminal. Имя файла должно состоять из 8 латинских символов – “ группа и ваш номер по списку”. Тип файла обязательно должен быть DAT и записан для удобства работы в каталог DATA пакета КВАЗАР.

Пример:

     Файл -  I1601001.dat, I16010 – группа, 01- ваш номер по списку.

     ИМЯ : 2  2  9  1. 1. 6. 1. 2.;

     3. 9. 8. 7. 6. 5. 3. 2.;

     0. 0. 7. 9. 0. 8. 7. 8.;

     3. 4. 6. 7. 5. 6. 9. 6.;  

      3.3.1. Первый поток студентов.

     В таблице, представленной ниже, даны результаты тестирования студентов из групп  ИТ-190101,ВИ-190102,ВИ-190301 за 2008-2009г.

Фамилия Имя МК1 МК2 О/M МК3 МК4 МК5 ВА МК6 МК7 МК8 АГ МК9 МК10 СУМ
1 Пипкина Алёна 100 88 346 100 50 75 88 75 75 25 88 75 100 1284
2 Зиганурова Лилия 100 38 385 75 100 100 76 19 50 50 56 75 50 1174
3 Конев Антон 100 88 423 75 100 25 39 100 0 25 81 75 0 1131
4 Соколова Евгения 38 50 423 75 100 75 75 0 75 0 56 75 50 1092
5 Демин Михаил 46 13 385 75 75 50 50 38 75 50 25 50 50 981
6 Сайсанова Елена 85 0 346 50 100 25 49 0 0 25 52 75 75 881
7 Задорожный Антон 31 25 353 75 100 75 51 50 0 0 69 0 50 878
8 Быковский Михаил 54 25 365 50 50 75 29 25 50 25 69 50 0 867
9 Алфутов Сергей 38 0 321 100 75 25 59 25 25 0 69 25 75 837
10 Назаров Михаил 15 13 385 50 50 50 35 0 50 25 59 50 50 832
11 Высоцкий Вячеслав 69 13 308 0 100 25 34 50 0 0 69 75 75 817
12 Хизматулин Владимир 69 0 308 75 100 50 38 0 25 0 63 75 0 803
13 Ибрашова Мария 100 0 269 75 75 75 54 0 0 50 27 25 50 800
14 Медведев Сергей 54 38 308 50 75 25 66 0 0 25 53 50 50 793
15 Аббасов Анар 31 13 308 25 100 0 22 0 25 25 81 75 75 779
16 Шитов Артём 38 38 360 75 50 50 25 0 0 25 73 25 0 760
17 Луговцов Михаил 0 0 192 50 100 50 62 0 50 25 44 75 75 723
18 Раскатов Павел 54 0 160 75 75 0 47 0 25 25 81 75 100 717
19 Приходько Андрей 15 13 256 75 25 50 39 13 25 0 47 75 75 707
20 Раёва Алина 15 0 192 50 75 0 57 50 0 25 53 75 75 668
21 Рыжков Никита 38 0 256 75 25 25 44 0 50 0 69 25 50 658
22 Бакланов Михаил 23 38 231 50 75 25 37 0 50 0 50 25 50 654
23 Алёхина Анастасия 0 25 359 0 75 25 17 50 0 0 66 25 0 641
24 Коршунова Евгения 0 13 192 50 75 50 37 0 25 25 67 25 75 634
25 Дементьева Ксения 31 13 192 50 100 0 25 0 0 25 72 50 75 632
26 Горбунов Александр 46 25 212 50 25 25 62 0 25 0 63 50 50 632
27 Телятников Владимир 69 13 288 25 100 50 0 31 0 0 41 0 0 617
28 Пермякова Наталья 15 0 192 50 50 0 40 63 0 0 69 75 50 604
29 Гатауллина Динара 23 0 192 50 50 75 29 19 25 0 33 25 75 596
30 Гладких Иван 23 0 295 25 25 50 31 0 25 0 44 50 0 568
31 Мустафин Юрий 54 13 231 50 0 25 34 0 50 0 69 0 0 525
32 Дзядук Иван 85 13 0 50 75 75 35 38 25 0 44 50 25 514
33 Чекасина Екатерина 23 38 237 25 0 25 29 0 0 0 52 25 50 504
34 Китов Данила 31 25 69 0 100 75 42 13 25 0 69 25 25 498
35 Сидорова Дарья 23 0 308 25 50 25 20 0 0 25 19 0 0 494
36 Болотов Валентин 0 0 186 75 0 50 39 25 25 0 41 0 50 491
37 Гильмуллина Лилия 31 13 199 75 25 0 0 13 0 25 31 25 25 461
38 Ветлужских Михаил 0 0 115 75 50 0 41 0 50 0 44 50 25 450
39 Антропов Андрей 46 50 0 75 75 50 36 0 25 0 44 0 25 426
40 Ярош Диана 23 0 173 0 50 0 14 0 0 0 39 50 75 424
41 Корчемкина Дарья 38 0 160 50 75 0 6 0 0 0 33 50 0 412
42 Иванов Михаил 46 0 167 50 0 0 0 0 0 0 69 50 0 382
43 Дунаева Анна 54 0 154 25 50 0 12 19 0 0 42 0 25 380
44 Зотов Кирилл 23 0 154 75 25 0 37 0 25 0 0 25 0 364
45 Строков Михаил 85 38 0 50 0 0 28 0 50 25 16 0 25 316
46 Мышаков Роман 62 13 135 0 0 0 17 0 25 0 27 0 25 302
47 Пеганов Александр 15 13 135 0 25 50 4 0 0 0 31 0 25 298
48 Усс Павел 38 0 30 75 50 0 12 0 50 0 16 0 0 271
49 Чеботаев Юрий 0 0 0 75 50 0 23 0 0 0 13 0 25 185
50 Бульц Регина 0 0 0 100 0 0 0 0 0 0 0 0 0 100
51 Колосов Александр 23 0 0 0 0 0 0 0 25 0 0 0 0 48

АНАЛИЗ  ИНФОРМАТИВННОСТИ ПРИЗНАКОВ

Информационные  веса признаков (в относит. единицах):

-------------------------------------------------------------------------------

Признак :    12     5      3      14     10     13     11     7      6      4 

-------------------------------------------------------------------------------

Инф. вес:  1.000  0.936  0.891  0.707  0.672  0.598  0.551  0.493  0.243  0.143

-------------------------------------------------------------------------------

-------------------------------------------------------------------------------

Признак :    2      9      1      8 

-------------------------------------------------------------------------------

Инф. вес:  0.075  0.052  0.025  0.000

-------------------------------------------------------------------------------

     Вывод: В результате исследования информативности признаков было выявлено, что наиболее существенными признаками являются тесты № 12, 5 и 3.

ТАКСОНОМИЯ МНОЖЕСТВА ПРИЗНАКОВ

     Параметры алгоритма таксономии устанавливаются  автоматически. Для этого выполняется расчет макс. и мин. (по модулю) значений. коэффициента парной корреляции. В результате выполнены следующие назначения:

начальное пороговое  значение коэф-та парной корреляции (по модулю) - 0.848

конечное пороговое  значение коэф-та парной корреляции (по модулю) - 0.013

шаг изменения  порогового значения     0.083

           Таксономия  при RO =  0.848

Все таксоны  единичные.

           Таксономия  при RO =  0.764

*Таксон  1:   3, 14.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.681

*Таксон  1:   3,  7, 14.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.597

*Таксон  1:   3,  5,  7, 11, 12, 14.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.514

*Таксон  1:   2,  3,  5,  6,  7, 10, 11, 12, 13, 14.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.430

Все признаки  вошли в один таксон.

R0 МУВ Устойчивость
0.764 3,14 неустойчивый
0.681 3,7,14 неустойчивый
0.597 3,5,7,11,12,14 неустойчивый
0,514 2,3,5,6,7,10,11,12,13,14 неустойчивый
 

     Всего таксонов – 4

     ρ = 78 %

     По  шкале интеллектуальных задач (ШИЗ) хорошо, т.к. 0,78 > 0,75 и 0,78 < 0,95.

     Вывод: по результатам таксономии выявлено, что наиболее общие свойства и признаков 3, 14.

 

    3.3.2. Второй поток студентов.

     В таблице, представленной ниже, даны результаты тестирования студентов из групп  ИТ-18011,ВИ-18013,ВИ-18031 за 2008-2009г. 

Фамилия Имя МК1 МК2 МК3 МК4 Прил.диф. исч. МК5 МК6 МК7 МК8 Интегр. МК12 Рег12 Рег13 МК13 МК14 ДУ Сум
1 Байрамлы Абдулла 0 0 25 50 25 25 25 17 0 25 70 0 0 0 25 0 287
2 Бачаев Иван 25 0 25 25 21 0 0 0 0 38 50 0 0 0   0 183
3 Бездомова Анна 0 75 75 25 188 50 25 50 0 0 0 0 0 25 0 6 518
4 Беляева Анастасия 0 100   50 234 38 30 50 0 0 50 0 0 75 63 167 856
5 Герасименко Алена 25 71 25 25 131 0 30 83 0 94 25 0 0 38 25 50 622
6 Добрых Александр 50 0 25 50 35 38 0 33 25 31 25 0 0 25 0 6 343
7 Иванов Владимир 0 0 0 50 34 50 0 0 0 0 0 0 0 0 0 0 134
8 Искорцева Елена 0 0 100 75 100 38 25 50 25 0 0 0 25 25 50 513
9 Киселев Максим 0 100 0 0 9 0 0 0 0 0 0 0 0 0 0 0 109
10 Козионов Илья 0 50 0 0 19 50 0 25 0 25 50 0 0 25 0 0 244
11 Кузнецов Александр 0 0 0 0 6 25 0 25 0 0 0 0 0 0 0 0 56
12 Нещерецкая Ольга 50 38 25 0 96 38 0 100 0 156 25 0 0 0 25 111 663
13 Парищук Иван 25 0 25 75 28 0 0 0 0 0 50 0 0 0 0 0 203
14 Першин Михаил 0 21 50 50 34 25 30 17 0 44 0 0 25 13 309
15 Петрова Марина 0 50 50 75 138 13 5 0 44 0 0 0 0 25 44 443
16 Помехина Ангелина 50 0 75 25 163 63 40 58 0 113 25 0 0 100 25 111 847
17 Родионов Роман 0 25 0 75 41 13 40 75 0 44 0 0 0 25 25 0 362
18 Самсонова Эмилия 50 58 75 75 266 38 5 33 0 188 30 0 75 63 139 1094
19 Семагин Артем 25 13 0 0 169 38 30 17 0 94 35 0 0 25 13 89 546
20 Тузин Мирослав 25 0 0 75 22 0 0 0 0 0 25 0 0 13 0 17 176
21 Швецов Артем   25 25 100 79 75 0 0 0 0 100 0 0 0 25 0 429
22 Батурин Олег 25 50 25 50 24 38 25 50 25 25 50 0 0 25 0 50 461
23 Белкина Анна 25 50 75 25 250 38 5 75 25 63 50 0 0 63 50 167 959
24 Бухрякова Светлана 50 8 0 0 88 13 0 58 0 38 0 0 0 25 25 0 304
25 Ванчугов Александр 25 38 0 0 16 13 0 0 0 0 0 0 0 0 0 0 91
26 Веретенникова Екатерина 25 50 75 25 263 38 15 100 25 188 50 0 0 63 38 306 1258
27 Годонюк Дмитрий 50 38 75 50 40 50 30 38 25 25 0 0 0 25 0 22 467
28 Демин Алексей 0 0 0 25 13 50 0 58 25 0 0 0 0 0 0 11 182
29 Костромина Юлия 25   50 0 38 0 0 8 0 19 0 0 0 0 0 140
30 Лейчук Диана 75 50 50 50 484 50 75 75 0 375 50 0 0 75 63 167 1639
31 Локтеев Илья 0 13 0 50 21 13 0 0 0 6 0 0 0 0 0 0 102
32 Николаева Дарья 0 25 0 0 18 13 5 25 0 13 0 0 0 0 25 11 134
33 Пряничникова Евгения 25 0 0 50 28 0 25 25 0 0 0 0 0 0 0 0 153
34 Разумова Виктория 0 46 75 50 125 25 0 75 0 25 50 0 0 25 25 22 543
35 Фролова Наталья 0 50 50 50 358 63 40 25 25 250 35 0 0 50 25 222 1243
36 Шевченко Кристина 0 8   50 38 0 15 50 0 6 0 0 0 25 44 23 259
37 Базинская Татьяна 0   25 25 0 0 0 0 0 0 0 0 13 0 6 68
38 Вешкурова Кристина 25 38 0 75 24 13 5 33 0 25 50 0 0 0 0 50 337
39 Габдрахманова Альбина 0 0   25 25 13 0 0 0 6 45 0 0 50 25 44 233
40 Горенко Ольга 25   50 50 309 38 65 75 25 313 0 0 38 25 306 1317
41 Здобнова Екатерина 0 25 75 25 15 0 15 33 0 38 0 0 0 25 0 19 269
42 Кащук Юлия 25 25 25 50 54 0 0 0 0 63 5 0 0 0 38 67 351
43 Клепинин Алексей 0 25 0 50 113 13 15 50 0 19 50 0 0 0 38 11 382
44 Кобзарева Дарья 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 00 6
45 Козий Екатерина 0 0 25 75 11 0 0 0 0 0 0 0 50 11 173
46 Масленников Павел 0 0 0 50 119 13 30 50 0 25 50 0 0 50 25 111 522
47 Никифорова Елена 25 25 50 50 113 0 0 75 25 75 50 0 0 0 25 67 579
48 Пузаков Антон 0 50 25 75 84 0 30 0 0 25 60 0 0 75 13 67 504
49 Путилова Ирина 0 8 25 75 3 0 5 50 0 0 25 0 0 25 13 17 246
50 Русинов Александр 0 0 50 50 20 25 15 0 0 25 0 0 0 50 19 17 270
51 Рычков Антон 0 46 50 50 23 13 30 8 0 0 75 0 0 25 0 33 353

АНАЛИЗ  ИНФОРМАТИВННОСТИ ПРИЗНАКОВ

Информационные  веса признаков (в относит. единицах):

-------------------------------------------------------------------------------

Признак :    15     6      5      3      14     12     8      2      10     9 

-------------------------------------------------------------------------------

Инф. вес:  1.000  0.959  0.838  0.807  0.764  0.754  0.741  0.693  0.620  0.484

-------------------------------------------------------------------------------

-------------------------------------------------------------------------------

Признак :    13     7      11     1      4 

-------------------------------------------------------------------------------

Инф. вес:  0.472  0.417  0.292  0.251  0.000

-------------------------------------------------------------------------------

     Вывод: В результате исследования информативности признаков было выявлено, что наиболее существенными признаками являются тесты № 15, 6 и 5.

ТАКСОНОМИЯ МНОЖЕСТВА ПРИЗНАКОВ

     В результате выполнены следующие  назначения:

начальное пороговое  значение коэф-та парной корреляции (по модулю) - 0.955

конечное пороговое  значение коэф-та парной корреляции (по модулю) -  0.003

шаг изменения  порогового значения      0.095

        Таксономия  при RO =  0.955

Все таксоны  единичные.

           Таксономия при RO =  0.860

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.765

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.669

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны  единичные.

           Таксономия при RO =  0.574

*Таксон  1:   5,  7, 10, 12, 13, 14, 15.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.479

*Таксон  1:   3,  5,  6,  7,  8,  9, 10, 12, 13, 14, 15.

Остальные таксоны  единичные.

           Таксономия  при RO =  0.384

Информация о работе Прогнозирование результатов учебы студентов с помощью методов ИИ