В. Ф. Ахмедли, С. Ю. Бакоев, Д. Р. Матюков, О. Н. Луконина, Л. В. Гетманцева
Всероссийский научно-исследовательский институт племенного дела, п. Лесные Поляны, Московская область, Россия
E-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Том 25 № 10
Дата поступления статьи: 13.08.2025, дата рецензирования: 04.09.2025, дата принятия: 15.09.2025
Опубликовано: 31.10.2025 г.
Аннотация. Качество и достоверность данных являются краеугольным камнем при принятии эффективных управленческих, селекционных и научных решений в животноводстве. Неточные данные могут приводить к значительным экономическим потерям и ошибочным научным выводам. Целью исследования было систематизировать и проанализировать многоуровневый арсенал методов, разработанных для верификации и очистки данных, прослеживая их эффективность от простых детерминированных правил до сложных интеллектуальных систем. Методы исследований. Рассматриваются традиционные подходы, включая проверку диапазонов, логические и контекстные проверки, которые служат базовым фильтром грубых ошибок. Далее анализируются статистические методы, такие как Z-оценки и межквартильный размах (IQR), выявляющие статистические выбросы, но ограниченные в основном одномерным анализом. В качестве решения этой проблемы в обзоре подробно освещаются методы машинного обучения. Анализируется применение метода главных компонент (PCA) для выявления многомерных аномалий в фенотипических и продуктивных профилях. Рассматриваются методы кластеризации, такие как k-means для идентификации нетипичных прототипов и DBSCAN для фильтрации шума в данных. В качестве наиболее продвинутого подхода представлены деревья решений и их ансамбли (Isolation Forest), а также нейросетевые архитектуры, в частности автоэнкодеры, способные в режиме обучения без учителя выявлять сложные нелинейные закономерности и скрытые аномалии. Результаты исследования демонстрируют, что комбинация этих многоуровневых подходов позволяет перейти от исправления ошибок к проактивной стратегии обеспечения целостности данных. Научная новизна заключается в том, что впервые систематизированы и сопоставлены методы верификации данных – от классических до современных (машинное обучение) – с акцентом на их применимость в животноводстве, что имеет решающее значение для развития современного животноводства, минимизации экономических потерь и улучшения селекционных решений.
Ключевые слова: контроль качества данных, животноводство, машинное обучение, PCA, кластеризация, автоэнкодеры, аномалии, статистические методы, биологические нормы, интеллектуальный анализ Благодарности. Работа выполнена в соответствии с Государственным заданием № 082-00240-25-00 на 2025 год. Соглашение № 082-03-20254-011.
Для цитирования: Ахмедли В. Ф., Бакоев С. Ю., Матюков Д. Р., Луконина О. Н., Гетманцева Л. В. Контроль качества данных в животноводстве на основе биологических норм и интеллектуального анализа // Аграрный вестник Урала. 2025. Т. 25, № 10. С. 1589‒1598. https://doi.org/10.32417/1997-4868-2025-25-10-1589-1598










