УДК 635.35:519.2 doi: 10.21498/25181017.19.4.2023.291221
О. Й. Дидів1, В. В. Хареба2, О. В. Хареба2, Н. В. Лещук3*, Н. С. Орленко3, О. Б. Орленко3
1Львівський національний університет природокористування, вул. Володимира Великого, 1, м. Дубляни,
Львівський рн, Львівська обл., 80381, Україна
2Національна академія аграрних наук України, вул. ОмеляновичаПавленка, 9, м. Київ, 01010, Україна
3Український інститут експертизи сортів рослин, вул. Генерала Родимцева, 15, м. Київ, 03041, Україна,
*email: nadiya1511@ukr.net
Мета. Використати кластерний аналіз морфологічних ознак для спрощення ідентифікації сортів Brassica oleracea var. italica та сформувати групи схожих сортів для тесту на відмінність. Методи. У процесі роботи послуговувалися аналітичним, математичним і статистичним методами. Як вхідну інформацію для статистичного опрацювання отриманих результатів застосовували відомості про результати експертизи на відмінність, однорідність і стабільність (ВОС) із бази даних автоматизованої інформаційної системи Українського інституту експертизи сортів рослин. Моделювання кластерів здійснювали за допомогою статистичного пакета IBM SPSS Statistics «Statistical Package for the Social Sciences». Результати. За 32 ознаками для тесту на відмінність, однорідність і стабільність проведено морфологічний опис сортів капусти броколі. Морфологічні кодові формули останніх, складені з відповідних кодів прояву ідентифікаційних ознак вегетативних і генеративних органів рослин, слугували джерелом вихідних даних. Серед 41 сорту, описаного за 32 морфологічними характеристиками, вдалося виокремити лише дві групи подібних за ідентифікаційними ознаками сортів. Як параметри моделі застосовували два типи змінних: цільова ‒ ознака «головка: антоціанове забарвлення», фокусна – «головка: забарвлення». Повний перелік характеристик був таким: «рослина: за висотою (за збиральної стиглості)», «листок: положення (на початку формування головки)», «листкова пластинка: хвилястість краю», «листкова пластинка: пухирчастість», «черешок: за довжиною», «головка: забарвлення», «головка: антоціанове забарвлення», «головка: за щільністю», «квітка: забарвлення», «квітка: інтенсивність жовтого забарвлення», «чоловіча стерильність». Способом комп’ютерного моделювання було сформовано кластери з 17 подібних сортів капусти броколі та 9 контрольних об’єктів (сортів), ідентифікація яких передбачала 11 морфологічних ознак. Висновки. Для пошуку відмітних ознак у процесі тесту на відмінність сорти капусти броколі було згруповано в кластери за такими морфологічними характеристиками, як положення листка на початку формування головки; хвилястість краю листкової пластинки; пухирчастість листкової пластинки; довжина черешка; забарвлення головки; наявність антоціанового та інтенсивність жовтого забарвлення.
Ключові слова: капуста броколі; статистичний аналіз; класифікація; сорт; код; відмінність; кластер; ознака; колекція.
Olha Dydiv
https://orcid.org/0000000341555945
Volodymyr Khareba
https://orcid.org/0000000199472689
Olena Khareba
https://orcid.org/0000000267631988
Nadiia Leshchuk
https://orcid.org/0000000160253702
Natalia Orlenko
https://orcid.org/0000000304942065
Oleksandr Orlenko
https://orcid.org/0009000133090757
Вступ
Сучасні інформаційні технології дають змогу накопичувати, акумулювати та зберігати досить велику кількість даних [1], що є характерним також і для Українського інституту експертизи сортів рослин (далі – УІЕСР).
Результати кваліфікаційної експертизи на відмінність, однорідність і стабільність (ВОС-тест) сортів капусти броколі як науково-технічні дані накопичуються роками та досить часто є різнорідними (невпорядкованими). Вони можуть бути представлені як в числовому, так і категорійному форматі.
Різний набір вхідних параметрів великої кількості алгоритмів кластеризації може спричинити відмінність, а відповідно і складність оцінювання її результатів. Одним зі способів оцінювання результатів кластеризації є розташування об’єктів і центрів кластерів на координатній площині, що можливо лише якщо дані не багаторозмірні. В іншому разі необхідно використовувати методику [2].
Проблема вибору серед алгоритмів для максимально правильної кластеризації полягає в тому, що більшість з них очікують вхідним параметром зазвичай заздалегідь невідому кількість кластерів [2, 3]. Саме тому для встановлення оптимальної чисельності останніх потрібно послуговуватися деякими емпіричними правилами. Завдання кластеризації стають значно вагомішими, якщо кластери застосовують не лише для наочного представлення об’єктів, але й для розпізнавання нових.
Кожен новий сорт належить до тієї групи, приєднання до якої найкраще задовольняє критерії якості кластеризації та з об’єктами в якій він найбільше схожий за характеристикою [4].
Броколі або спаржева капуста (Brassica oleracea var. italica) – однорічна овочева рослина родини капустяних, підвид цвітної капусти. Її споживча стиглість настає за максимального розвитку суцвіття (головки), яке є продуктовим органом. Час достигання головок визначають за умови, що 50% рослин вступили в фенологічну фазу збиральної стиглості. Залежно від сорту він може бути дуже раннім (до 35 діб); раннім (35–40); середнім (41–50); пізнім (51–60); дуже пізнім (понад 60 діб) [5].
Відповідність критеріям відмінності, однорідності та стабільності, а також господарсько-цінним характеристикам для задоволення потреб споживачів, відсутність загрози довкіллю та здоров’ю людини є обов’язковими вимогами для поширення на території України нових сортів капусти броколі. Їхній морфологічний опис за ознаками вегетативних і генеративних органів рослин здійснюють у відповідні фенологічні фази росту та розвитку [6].
Науково-технічна експертиза сортів рослин групи овочевих – це комплекс польових і лабораторних досліджень, результати яких формують джерелознавчу базу даних. Кінцевого інформаційного продукту для практичного використання досягають через алгоритм статистичного опрацювання. Саме тому досить актуальним є пошук сучасних статистичних методів оброблення результатів (кодів прояву ознак) з тесту на відмінність у процесі ідентифікації сортів [3, 7].
Моніторинг іноземної та вітчизняної літератури продемонстрував, що кластерний аналіз (англ. Data clustering) забезпечує структуризацію вибірки об’єктів (ознак) на підмножини (кластери) так, щоб об’єкти, з яких вони складаються, були схожими між собою й відрізнялися від об’єктів з інших [1, 3, 8]. Отже, кластеризацію можна вважати задачею багатокритеріальної оптимізації, алгоритм і вибір параметрів якої (функція відстані, порогове значення щільності або кількість очікуваних кластерів) залежать від конкретного набору даних та мети використання результатів [8].
На думку низки дослідників, технологічну процедуру з визначення відмінності сортів, за відсутності статистичного методу, можна спростити, здійснивши автоматизоване групування найподібніших з них за кодами прояву ідентифікаційної ознаки (QN, QL, PQ). Відмінні сорти в межах групи слід використовувати не тільки для тесту на відмінність, але й для тесту на стабільність [9]. Оцінювання груп можна здійснювати, застосовуючи різні статистичні методи інтелектуального аналізу кодів і ступенів прояву характеристик нових сортів капусти броколі.
Оскільки кількість ознак, використовуваних для групування під час тесту на відмінність, обмежена («рослина: кількість стебел», «головка: забарвлення», «рослина: час збиральної стиглості», «рослина: чоловіча стерильність»), для статистично обґрунтованого розширення їхнього діапазону виникає потреба працювати з кодами прояву у відповідні фенологічні фази росту та розвитку рослин [10–12]. Спростити цей процес можна за допомогою комп’ютерного оброблення даних, використовуючи метод кластерного аналізу, що дасть змогу зменшити розмірність кодів і ступенів їхнього прояву, які підлягають аналізу, та згрупувати сорти з морфологічними ознаками для оперативного та прозорого пошуку серед них хоча б однієї відмітної [6, 8].
Мета досліджень – використати кластерний аналіз морфологічних ознак для спрощення ідентифікації сортів Brassica oleracea var. italica та сформувати групи схожих сортів для тесту на відмінність.
Матеріали та методика досліджень
Як вхідну інформацію для статистичного опрацювання отриманих результатів використовували відомості про результати експертизи на відмінність, однорідність і стабільність (ВОС) з бази даних автоматизованої інформаційної системи УІЕСР. Поширений на території України сорт капусти броколі має офіційно оприлюднений опис із 32 морфологічних ознак вегетативних і генеративних органів, представлений кодами та ступенем їхнього прояву в морфологічній кодовій формулі. Саме коди ознак вегетативних і генеративних органів рослин сортів капусти броколі, що перебувають у базі УІЕСР, формують масив даних для тесту на відмінність [13]. Перелік сортів за країнами походження подано у таблиці 1.
Таблиця 1
Перелік сортів капусти броколі за країнами походження
Назва сорту |
Країна походження |
‘Libra’ |
Болгарія |
‘Klieopatra’ |
Канада |
‘TM-04/FL’, ‘Limba’, ‘Apolena’ |
Чехія |
‘Naxos’, ‘Rumba’, ‘Kaptan’, ‘Tambora’, ‘Green Magic’, ‘Marathon’, ‘Parthenon’, ‘Koros’, ‘Eos’, ‘Cigno’, ‘Babilon’, ‘Abilon’, ‘Stirling’, ‘Cusco’ |
Франція |
‘Kostal’, ‘Agassi F1’ |
Німеччина |
‘Moycan’, ‘Samoa’ |
Італія |
‘Empieror’ |
Японія |
‘Batavia F1’, ‘Bielіnda’, ‘Korvat F’, ‘Korvet’, ‘Milady F1’, ‘Skіff’, ‘Monaco F1’, ‘Ironman F1’, ‘Quinta F1’, ‘Beaumont F1’, ‘Corato’, ‘Monrello’, ‘Belstar F1’, ‘Bay Meadows Cemes F1’, ‘Reggi’, ‘Besty’, ‘Orantes’, ‘SV1002BL’, ‘Steel’, ‘Edberg’, ‘Batory’, ‘Stromboli’, ‘Larsson’, ‘Titanium’, ‘Tesmari’, ‘Vicario’ |
Голландія |
‘Wiarus’, ‘Cezar’ |
Польща |
‘Baro Star’ |
Південна Корея |
‘Atlantіk’, ‘Monrello’, ‘MClaren’, ‘Gongga’ |
Швейцарія |
‘Lednitska’, ‘Vіtamіnna’, ‘Cezar’, ‘TM-04/FL’, ‘Trubadur’, ‘Muline’, ‘Cazzy F1’ |
Україна |
‘Yahuar’, ‘SSTs 5186 R’, ‘Spartan Erlі’ |
США |
Предметом проведених досліджень був вихідний масив даних кодів прояву морфологічних ознак сортів капусти броколі вітчизняної та іноземної селекції.
Як цільову змінну обрано ознаку «головка: антоціанове забарвлення», фокусну – «головка: забарвлення». Повний перелік характеристик був таким: «рослина: за висотою (за збиральної стиглості)», «листок: положення (на початку формування головки)», «листкова пластинка: хвилястість краю», «листкова пластинка: пухирчастість», «черешок: за довжиною», «головка: забарвлення», «головка: антоціанове забарвлення», «головка: за щільністю», «квітка: забарвлення», «квітка: інтенсивність жовтого забарвлення», «чоловіча стерильність» [11, 14].
У процесі комп’ютерного опрацювання даних (кодів морфологічних ознак) використовували дві шкали. А саме: номінальну – для групування подібних сортів за такими морфологічними характеристиками, як «листок: положення (на початку формування головки)», «квітка: забарвлення», «листкова пластинка: хвилястість краю», «листкова пластинка: пухирчастість», «головка: забарвлення»; порядкову – для ознак «рослина: за висотою (за збиральної стиглості)», «черешок: за довжиною», «головка: за щільністю», «квітка: інтенсивність жовтого забарвлення» [6].
Результати експертизи опрацьовували статистичним методом кластерного аналізу через пошук алгоритму подібності ознак для формування груп-кластерів. Моделювання останніх, а також розрахунки виконували у середовищі статистичного пакета IBM SPSS Statistics «Statistical Package for the Social Sciences», застосовуючи параметри класифікаційного методу Nearest Neighbor Analysis для генетично маркованих ознак [4, 7, 8].
Вищевказаним методом передбачено, що початково є деяка кількість об’єктів з точною класифікацією подібних сортів капусти броколі, тому необхідно виробити правило, яке дасть змогу зараховувати новий сорт до одного з можливих класів (набору подібних за морфологічними ознаками сортів рослин).
Алгоритм кластеризації складається з добору коефіцієнта (k) та атрибутів (n), що визначають міру подібності, для нових сортів капусти броколі [6]. Д? е k – це кількість записів, які будуть вважатися близькими за використання таких правил:
(x,y) ≥ 0, d(x,y) = 0 тоді й лише тоді,
коли x = y;
d(x,y) = d(y,x);
d(x,z) ≤ d(x,y) + d(y,z) за умови, що точки x, y, z не лежать на одній прямій.
x, y, z – це вектори ознак об’єктів, які порівнюють.
Значення атрибутів упорядковують, використовуючи як міру схожості спостережень відстань Евкліда, і розраховують за формулою:
де n – кількість атрибутів.
Відповідно до міжнародних вимог «Методики проведення експертизи сортів капусти на відмінність, однорідність і стабільність (Guidelines for the conduct of tests for distinctness, uniformity and stability UPOV)», тестування на ВОС проводили в польових умовах протягом двох послідовних вегетаційних сезонів.
Результати морфологічного опису сортів за роки досліджень автоматично акумулюються в базі даних з інстальованою таблицею морфологічних ознак і підлягають розподілу за ознаками, роками та пунктом досліджень.
Якщо відстань d (in, ip) менша за деяке значення s, то можна зробити висновок, що елементи розташовані близько один до одного та перебувають в єдиному кластері; в іншому разі елементи розміщені в різних кластерах. Розбиття елементів на групи повинно відповідати деякому критерію – певному функціоналу, який ще називають цільовою функцією. Тому для полегшення оцінювання відмінності найкраще обирати цільову змінну «головка: забарвлення» як альтернативу заданих ознак, рекомендованих методикою для групування сортів-кандидатів із подібними загальновідомими сортами. Для кластеризації використовують ознаки, окремо або в комбінаціях з іншими, які не варіюють або дуже слабко варіюють у межах сорту [6].
Результати досліджень
Загальновідомі сорти капусти броколі вітчизняної та іноземної селекції, заявки на які подавали починаючи з 2002 року і дотепер, є складниками національних сортових рослинних ресурсів. Нині інформаційна система УІЕСР налічує 41 їхню морфологічну формулу та щорічно поповнюється ще трьома-чотирма сортами (рис. 1).
Повний перелік груп сортів капусти броколі за результатами моделювання низки (11) морфологічних ознак, коди яких утворюють кодові формули, наведено в таблиці 2.
Із сукупності досліджуваних сортів було виокремлено чотири групи. До першої увійшли пари ‘Batory’ й ‘Monrello’ та ‘Titanium’ і ‘Sv1002bl’. Відстань між ними нульова за алгоритмом найближчих сусідів, що свідчить про збіг 11 з 32 морфологічних ознак. А саме: «рослина: за висотою (за збиральної стиглості)», «листок: положення (на початку формування головки)», «листкова пластинка: хвилястість краю», «листкова пластинка: пухирчастість», «черешок: за довжиною», «головка: забарвлення», «головка: антоціанове забарвлення», «головка: за щільністю», «квітка: забарвлення», «квітка: інтенсивність жовтого забарвлення», «чоловіча стерильність». Утім за деякими ознаками, що не потрапили до вибірки для класифікації, вищевказані сорти відрізняються. Так, ‘Batory’ має блакитно-зелене забарвлення листкової пластинки, середній за шириною та довжиною (включно з черешком) листок та велику кількість його часток. Листкова пластинка ‘Monrello’ сіро-зелена, листок широкий і довгий, кількість його часток середня.
Пара ‘Sv1002bl’ і ‘Titanium’ різниться за часом збиральної стиглості – пізній і середній відповідно. Головка за збиральної стиглості у сорту ‘Sv1002bl’ зелена з помірними інтенсивністю забарвлення та структурою тканини; у ‘Titanium’ – блакитно-зелена зі слабкими інтенсивністю забарвлення та структурою тканини.
Унаслідок аналізу масиву даних результатів морфологічного опису виявлено, що подібні за ідентифікаційними характеристиками сорти, базуючись лише на інформації про них та їхні взаємозв’язки, можна сформувати у групи (кластери) методом кластеризації. Найкращою кластеризація є тоді, коли об’єкти з однієї групи максимально схожі між собою та сильно відрізняються від об’єктів з інших.
У процесі досліджень ідентифіковано 41 сорт капусти броколі за 11 морфологічними ознаками. Сформована модель включала 17 тренувальних та 9 контрольних об’єктів (сортів). Для останніх за допомогою комп’ютерного моделювання утворено кластери, в граничних межах яких найпростіше шукати відмітні за однією чи групою ознак сорти.
Результати частотного аналізу прояву морфологічних ознак капусти броколі подано на рисунку 2. Модель подібних сортів капусти броколі, сформовану методом найближчих сусідів, подано на інтерактивній діаграмі простору показників «Predictor Space» (рис. 3).
Кожна вісь координат моделі відображає один із показників у ній [«рослина: за висотою (за збиральної стиглості)», «листкова пластинка: хвилястість краю», «листок: положення (на початку формування головки)»].
Статистичним методом на діаграмі встановлено такі фокусні сорти: ‘Green Magic’, ‘Parthenon’, ‘Marathon’, ‘Cazzy’, ‘Belstar F1’, ‘Cusco’, ‘Orantes’, ‘Besty’, ‘Monrello’, ‘Batory’, ‘Corato’, ‘Stromboli’, ‘Steel’, ‘Baro Star’, ‘Cigno’, ‘Babilon’, ‘Titanium’. Також визначено, що сорт ‘Babilon’ є унікальним за ознакою «черешок: за довжиною» (дуже короткий), а ‘Bay Meadows Cemes F1’ – за характеристикою «рослина: за висотою» (дуже коротка). Антоціанове забарвлення головки відсутнє в сортів ‘Agassi F1’, ‘Apolena’, ‘Besty’, ‘Corato’, ‘Larsson’, ‘Naxos’, ‘Quinta F1’, ‘Samoa’, ‘Stromboli’, ‘Lednitska’, ‘Milady F1’, ‘Moycan’, ‘Cusco’, ‘Monaco F1’; наявне – в ‘Reggi’, ‘Baro Star’, ‘Batory’, ‘Cazzy F1’, ‘Monrello’, ‘Muline’, ‘Orantes’, ‘Rumba’, ‘Steel’, ‘Stirling’, ‘SV1002BL’, ‘Titanium’, ‘TM-04/FL’, ‘Babilon’, ‘Batavia F1’, ‘Beaumont F1’, ‘Belstar F1’, ‘Cezar’, ‘Green Magic’, ‘Ironman F1’, ‘Koros’, ‘Limba’, ‘Marathon’, ‘Parthenon’, ‘Trubadur’, ‘Cigno’, ‘Bay Meadows Cemes F1’.
Короткими під час збиральної стиглості є сорти ‘Agassi F1’, ‘Apolena’, ‘Baro Star’, ‘Batory’, ‘Besty’, ‘Cazzy F1’, ‘Corato’, ‘Larsson’, ‘Monrello’, ‘Muline’, ‘Naxos’, ‘Orantes’, ‘Quinta F1’, ‘Rumba’, ‘Samoa’, ‘Steel’, ‘Stirling’, ‘Stromboli’, ‘SV1002BL’, ‘Titanium TM-04/FL’; високими – ‘Babilon’, ‘Batavia F1’, ‘Beaumont F1’, ‘Belstar F1’, ‘Cezar’, ‘Green Magic’, ‘Ironman F1’, ‘Koros’, ‘Lednitska’, ‘Limba’, ‘Marathon’, ‘Milady F1’, ‘Moycan’, ‘Parthenon’, ‘Trubadur’, ‘Cigno’, ‘Cusco’, ‘Monaco F1’, ‘Reggi’.
Положення листка на початку формування головки є горизонтальним у ‘Naxos’, ‘Stromboli’, ‘Rumba’, ‘Stirling’, ‘TM-04/FL’, ‘Babilon’, ‘Koros’; напівпрямим – в ‘Agassi F1’, ‘Apolena’, ‘Besty’, ‘Larsson’, ‘Quinta F1’, ‘Samoa’, ‘Lednitska’, ‘Milady F1’, ‘Moycan’, ‘Cusco’, ‘Monaco F1’, ‘Reggi’, ‘Baro Star’, ‘Batory’, ‘Cazzy F1’, ‘Monrello’, ‘Muline’, ‘Orantes’, ‘Steel’, ‘SV1002BL’, ‘Titanium’, ‘Belstar F1’, ‘Ironman F1’, ‘Limba’, ‘Trubadur’, ‘Cigno’; напівпохилим – у ‘Corato’, ‘Batavia F1’, ‘Beaumont F1’, ‘Cezar’, ‘Green Magic’, ‘Marathon’, ‘Parthenon’, ‘Bay Meadows Cemes F1’.
Хвилястість краю листкової пластинки відсутня або дуже слабка у сортів ‘Batavia F1’, ‘Beaumont F1’, ‘Cezar’, ‘Parthenon’, ‘Bay Meadows’, ‘Cemes F1’, ‘TM-04/FL’, ‘Belstar F1’; помірна – в ‘Batavia F1’, ‘Beaumont F1’, ‘Cezar’, ‘Parthenon’, ‘Bay Meadows Cemes F1’, ‘TM-04/FL’, ‘Belstar F1’; сильна – в ‘Koros’, ‘Steel’, ‘SV1002BL’, ‘Titanium’; дуже сильна – в ‘Green Magic’, ‘Marathon’, ‘Stromboli’, ‘Besty’, ‘Larsson’, ‘Samoa’, ‘Moycan’, ‘Cusco’, ‘Monaco F1’, ‘Baro Star’, ‘Cazzy F1’, ‘Muline’, ‘Ironman F1’, ‘Trubadur’. У сортів ‘Bay Meadows Cemes F1’, ‘TM-04/FL’, ‘Naxos’, ‘Reggi’, ‘Baro Star’ пухирчастість листкової пластинки відсутня або слабка.
Черешок у ‘Bay Meadows Cemes F1’, ‘TM-04/FL’, ‘Reggi’, ‘Cezar’, ‘Stirling’, ‘Agassi F1’, ‘Apolena’, ‘Lednitska’, ‘Bator’, ‘Monrello’, ‘Marathon’, ‘Moycan’, ‘Ironman F1’, ‘SV1002BL’, ‘Titanium’, ‘Batavia F1’, ‘Belstar F1’, ‘Corato’, ‘Rumba’, ‘Quinta F1’, ‘Orantes’, ‘Limba’, ‘Cigno’, ‘Koros’, ‘Green Magic’, ‘Stromboli’, ‘Larsson’, ‘Monaco F1’, ‘Cazzy F1’, ‘Muline’, ‘Trubadur’ середньої довжини, а в ‘Naxos’, ‘Baro Star’, ‘Parthenon’, ‘Milady F1’, ‘Steel’, ‘Beaumont F1’, ‘Besty’, ‘Samoa’, ‘Cusco’, ‘Babilon’ – довгий.
Відстань між сортами ‘Agassi F1’ та ‘Аpolena’, ‘Batavia F1’ та ‘Green Magic’, ‘Beaumont F1’ та ‘Parthenon’, ‘Besty’ та ‘Larsson’, ‘Cigno’ та ‘Reggi’, ‘Green Magic’ та ‘Marathon’, ‘Larsson’ та ‘Besty’, ‘Parthenon’ та ‘Beaumont F1’, ‘Cezar’ та ‘Batavia F1’ становила 1,414; між ‘Muline’ та ‘Larsson’, ‘Quinta F1’ та ‘Agassi F1’, ‘Rumba’ та ‘Stirling’, ‘Babilon’ та ‘Koros’, ‘Baro Star’ та ‘Steel’, ‘Belstar F1’ та ‘Beaumont F1’, ‘Cazzy F1’ та ‘Trubadur’, ‘Corato’ та ‘Orantes’, ‘Cusco’ та ‘Cigno’, ‘Ironman F1’ та ‘Agassi F1’, ‘Koros’ та ‘Babilon’, ‘Limba‘ та ‘Cigno’, ‘Orantes’ та ‘Corato’, ‘Samoa’, Stromboli, Steel Baro Star, Stirling Apolena, Stromboli Samoa, Trubadur Green Magic, Lednitska Milady F1, Moycan Ironman F1, Bay Meadows Cemes F1 Parthenon, Monaco F1 Cusc, Tm-04/Fl Cazzy F1, Milady F1 Trubadur, Naxos Stromboli’ – більше ніж 2.
Як параметри моделі використовували два типи змінних: цільова – ознака «головка: антоціанове забарвлення», фокусна – «головка: забарвлення». За допомогою комп’ютерного моделювання було сформовано кластери 17 подібних сортів, ідентифікація яких передбачала 11 морфологічних ознак.
Кластер для 33 контрольних сортів капусти броколі має таку структуру:
Отже, загальновідомі сорти капусти броколі, внесені до Державного Реєстру сортів рослин, придатних для поширення в Україні, є переважно середніми за довжиною (вимірювання проводили під час збиральної стиглості) – 51,2%, чисельність коротких становить 36,6%, дуже коротких – 2,4%, довгих – 9,8%. Частка ознак, за статистичними даними яких характеризуються сорти, є такою: 19,5% сортів мають наполовину пряме положення листка на початку формування головки, 63,4% – горизонтальне, 17,1% – поникле. Хвилястість краю листкової пластинки у 51% слабка, а у 12% – відсутня. Пухирчастість листкової пластинки слабка у 51% сортів, середня – у 31%, відсутня – у 12%, сильна – в 5%. 75% сортів мають середню довжину черешка; 46% властивий зелений колір головки, 7% – фіолетовий. Для 63% характерне антоціанове забарвлення, а інтенсивність жовтого кольору середня у 53%.
Висновки
Проведення тесту на відмінність сортів капусти броколі через морфологічний опис ознак – це трудомісткий процес, що потребує автоматизованого опрацювання результатів статистичним методом кластерного аналізу масиву даних.
За допомогою кластерного аналізу вдалося зменшити розмірність вихідних даних для пошуку відмітних ознак між сортами. Водночас за подібними ознаками сформовано групи, об’єкти в яких схожі між собою та відрізняються від об’єктів з інших.
Завдяки ідентифікації 41 сорту капусти броколі за 32 морфологічними характеристиками виокремлено 2 пари подібних сортів за 11 ознаками. Саме кластерний аналіз забезпечив оперативність, об’єктивність і вірогідність отриманих результатів (кодів прояву ознак) для групування ознак за тесту на відмінність.
Сформована за групами кластеризації колекція загальновідомих сортів капусти броколі характеризується такими статистичними даними: 19,5% сортів мають наполовину пряме положення листка на початку формування головки, 63,4% – горизонтальне, 17,1% – поникле. Хвилястість краю листкової пластинки у 51% слабка, а у 12% – відсутня. Пухирчастість листкової пластинки слабка у 51% сортів, середня – у 31%, відсутня – у 12%, сильна – в 5%. 75% сортів мають середню довжину черешка; 46% властивий зелений колір головки, 7% – фіолетовий. Для 63% характерне антоціанове забарвлення, а інтенсивність жовтого кольору середня у 53% сортів.
Використана література
References
Таблиця 2
Групування подібних сортів капусти броколі за відстанню до найближчих сусідів
(k – Nearest Neighbor and Distance)
Focal Record |
Nearest Neighbors |
Nearest Distances |
||||
1 |
2 |
3 |
1 |
2 |
3 |
|
Agassi F1 |
Apolena |
Stirling |
Batory |
1,414 |
2,000 |
2,000 |
Apolena |
Agassi F1 |
Stirling |
Steel |
1,414 |
2,000 |
2,000 |
Babilon |
Koros |
Limba |
Cigno |
2,000 |
2,449 |
2,449 |
Baro Star |
Steel |
Apolena |
Samoa |
2,000 |
2,449 |
2,449 |
Batavia F1 |
Green Magic |
Beaumont F1 |
Marathon |
1,414 |
2,000 |
2,000 |
Batory |
Monrello |
Orantes |
Corato |
0,000 |
2,000 |
2,000 |
Bay Meadows Cemes F1 |
Parthenon |
Beaumont F1 |
Batavia F1 |
2,449 |
2,449 |
2,449 |
Beaumont F1 |
Parthenon |
Batavia F1 |
Belstar F1 |
1,414 |
2,000 |
2,000 |
Belstar F1 |
Beaumont F1 |
Batavia F1 |
Trubadur |
2,000 |
2,000 |
2,449 |
Besty |
Larsson |
Samoa |
Cusco |
1,414 |
2,000 |
2,000 |
Cazzy F1 |
Trubadur |
Green Magic |
Larsson |
2,000 |
2,000 |
2,449 |
Cigno |
Reggi |
Cusco |
Limba |
1,414 |
2,000 |
2,000 |
Corato |
Orantes |
Batory |
Monrello |
2,000 |
2,000 |
2,000 |
Cusco |
Cigno |
Besty |
Monaco F1 |
2,000 |
2,000 |
2,449 |
Green Magic |
Marathon |
Batavia F1 |
Trubadur |
1,414 |
1,414 |
2,000 |
Ironman F1 |
Agassi F1 |
Limba |
Monaco F1 |
2,000 |
2,449 |
2,449 |
Koros |
Babilon |
Limba |
Cigno |
2,000 |
2,449 |
2,449 |
Larsson |
Besty |
Orantes |
Corato |
1,414 |
2,000 |
2,000 |
Limba |
Cigno |
Apolena |
Ironman F1 |
2,000 |
2,000 |
2,449 |
Marathon |
Green Magic |
Batavia F1 |
Parthenon |
1,414 |
2,000 |
2,449 |
Milady F1 |
Trubadur |
Ironman F1 |
Marathon |
2,828 |
3,162 |
3,162 |
Monaco F1 |
Cusco |
Cigno |
Ironman F1 |
2,449 |
2,449 |
2,449 |
Orantes |
Corato |
Batory |
Monrello |
2,000 |
2,000 |
2,000 |
Parthenon |
Beaumont F1 |
Bay Meadows Cemes F1 |
Batavia F1 |
1,414 |
2,449 |
2,449 |
Reggi |
Cigno |
Cusco |
Limba |
1,414 |
2,449 |
2,449 |
Samoa |
Stromboli |
Besty |
Larsson |
2,000 |
2,000 |
2,449 |
Steel |
Baro Star |
Apolena |
Sv1002bl |
2,000 |
2,000 |
2,449 |
Stirling |
Apolena |
Agassi F1 |
Batory |
2,000 |
2,000 |
2,000 |
Stromboli |
Samoa |
Larsson |
Orantes |
2,000 |
2,449 |
2,449 |
|
Sv1002bl |
Steel |
Apolena |
0,000 |
2,449 |
2,449 |
Trubadur |
Green Magic |
Cazzy F1 |
Belstar F1 |
2,000 |
2,000 |
2,449 |
Cezar |
Batavia F1 |
Marathon |
Parthenon |
1,414 |
1,414 |
2,000 |
Lednitska |
Milady F1 |
Trubadur |
Marathon |
2,000 |
2,000 |
2,449 |
Moycan |
Ironman F1 |
Monaco F1 |
Limba |
2,000 |
2,449 |
2,828 |
Muline |
Larsson |
Besty |
Cazzy F1 |
1,414 |
2,000 |
2,000 |
Naxos |
Stromboli |
Samoa |
Baro Star |
3,162 |
3,162 |
3,162 |
Quinta F1 |
Agassi F1 |
Apolena |
Cigno |
1,414 |
2,000 |
2,000 |
Rumba |
Stirling |
Corato |
Babilon |
1,414 |
2,000 |
2,000 |
Tm-04/Fl |
Cazzy F1 |
Bay Meadows Cemes F1 |
Batavia F1 |
2,449 |
2,449 |
2,449 |
‘Bay Meadows Cemes F1’ |
00000005010005000209500700000000 |
11148003 |
‘Batavia F1’ |
03000000010305000309500500000000 |
11148001 |
‘Cezar’ |
03000000010505000509500500000000 |
03148001 |
‘Marathon’ |
03000000030505000509300500000000 |
08148003 |
‘Parthenon’ |
03000003010507000309500700000000 |
08148004 |
‘Green Magic’ |
03000003030305000309500500000000 |
08148001 |
‘Beaumont F1’ |
03000005010307000509500700000000 |
08148005 |
‘Belstar F1’ |
03300000010305000309500700000000 |
11148002 |
‘TM04/FL’ |
05500000010105000309300500000000 |
05148001 |
‘Limba’ |
13353535153315552359355719525551 |
15136001 |
‘Ironman F1’ |
13355325133515552259555719525550 |
05148003 |
‘Milady F1’ |
13355513153517533251155591313550 |
82148001 |
‘Trubadur’ |
13355535933395552259055591010370 |
06148001 |
‘Moycan’ |
13355537133515371371073719323579 |
16136001 |
‘Lednitska’ |
13355715155515552251555591010550 |
04148001 |
‘Koros’ |
13535517975395373379555719725339 |
13136003 |
‘Babilon’ |
13535523955393352339753719525579 |
19136001 |
‘Corato’ |
15055535153315352451055519325559 |
15136003 |
‘Larsson’ |
15355325133315552451055509325779 |
18136004 |
‘Vicario’ |
15355325153315353351053519325559 |
21136003 |
‘Muline’ |
15355523933315353259133599325550 |
07148001 |
‘Quinta F1’ |
15355525153315351251055719325770 |
06148003 |
‘Orantes’ |
15355525153315352359153509323579 |
15136002 |
‘Titanium’ |
15355525175715352459153799325579 |
20136002 |
‘Steel’ |
15355727173517551379355799325971 |
16136003 |
‘Batory’ |
15355735155515552379353511025779 |
16136006 |
‘Samoa’ |
15357527133317373451035511023351 |
20136001 |
‘Agassi F1’ |
15370325953515571351135711025570 |
06148002 |
‘Apolena’ |
15375725153515352351035719525551 |
14136001 |
‘SV1002BL’ |
15375737175715352379355799325779 |
16136002 |
‘Besty’ |
15377525133317353351035511025579 |
15136005 |
‘Monrello’ |
15377525155515552359353511025779 |
16136005 |
‘Stromboli’ |
15553335133315353451035599323351 |
17136001 |
‘Rumba’ |
15555525955395371459353711025559 |
13136002 |
‘Stirling’ |
15555535155515352479355711025779 |
19136002 |
‘Naxos’ |
15577337153117531451055519310551 |
12028009 |
‘Monaco F1’ |
17335527133315351351155711323770 |
05148002 |
‘Reggi’ |
17355535155115352251155711525559 |
13136001 |
‘Cigno’ |
17355535955315373479553711325539 |
18136003 |
‘Cusco’ |
17375335133317352451075719525559 |
20136003 |
‘Cazzy F1’ |
25355313133315334259153519300500 |
09148001 |
‘Baro Star’ |
25375327133117551379135799525331 |
18136001 |
UDC 635.35:519.2
Dydiv, O. Y.1, Khareba, V. V.2, Khareba, O. V., Leshchuk, N. V.3*, Orlenko, N. S.3 & Orlenko, O. B.3 (2023). Application of cluster analysis for grouping Brassica oleracea var. italica varieties for the difference test. Plant Varieties Studying and Protection, 19(4), 00–00. https://doi.org/10.21498/25181017.19.4.2023.291221.
1Lviv National Environmental University, 1 Volodymyra Velykoho St., Dubliany, Lviv district, Lviv region, 80381, Ukraine
2National Academy of Agrarian Sciences of Ukraine, 9 OmelianovychaPavlenka St., Kyiv, 01010, Ukraine
3Ukrainian Institute of Plant Varieties Examination, 15 Henerala Rodymtseva St., Kyiv, 03041, Ukraine, *email: nadiya1511@ukr.net
Purpose. To use cluster analysis of morphological characters to simplify the identification of Brassica oleracea var. italica and form groups of similar varieties for the test of difference. Methods. Analytical, mathematical and statistical methods were used in the work. As input information for the statistical processing of the obtained results, information on the results of the examination for distinctness, uniformity and stability (DUS) from the database of the Automated Information System of the Ukrainian Institute for Plant Varieties Examination was used. Cluster modelling was carried out using the IBM SPSS Statistics “Statistical Package for the Social Sciences”. Results. A morphological description of broccoli varieties was carried out on the basis of 32 characteristics for the examination of distinctness, uniformity and stability. The morphological code formulae of the latter, composed of the corresponding codes for the manifestation of identifying characteristics of vegetative and generative organs of plants, served as a source of initial data. Out of 41 varieties described by 32 morphological characteristics, only two groups were found to be similar in terms of the identifying characteristics of the varieties. Two types of variables were used as parameters of the model: target – characteristic “Head: anthocyanin colour”, focal – “Head: colour”. The full list of characteristics was as follows “plant: by height (at harvest maturity)”, “leaf: position (at beginning of head formation)”, “leaf blade: wavy edge”, “leaf blade: blistering”, “petiole: by length”, “head: colour”, “head: anthocyanin colour”, “head: by density”, “flower: colour”, “flower: intensity of yellow colour”, “male sterility”. Using computer modelling, clusters of 17 similar broccoli varieties and 9 control objects (varieties) were formed, the identification of which involved eleven morphological characteristics. Conclusions. In order to search for distinguishing characteristics in the process of testing the difference of cabbage varieties, broccoli was grouped into clusters according to such morphological characteristics as the position of the leaf at the beginning of the formation of the head; waviness of the edge of the leaf blade; blistering of the leaf plate; petiole length; head colour; presence of anthocyanin and intensity of yellow colour.
Keywords: broccoli; statistical analysis; classification; variety; code; difference; cluster; sign; collection.
Надійшла / Received 13.09.2023
Погоджено до друку / Accepted 25.10.2023