28.01.2025

Для определения породной принадлежности животных применили машинное обучение

Публикуем новость по статье А. Д. Солошенкова, Э. А. Солошенковой и др., которая по результатам конкурса статей сотрудников ИОГен в журналах "Генетика" и "Успехи современной биологии", заняла первое место.

 

Статья группы специалистов лаборатории сравнительной генетики животных Института общей генетики (ИОГен) РАН, вышедшая в журнале «Генетика» и его англоязычной версии Russian Journal of Genetics, посвящена использованию искусственного интеллекта в популяционной генетике животных в сравнении с классическими методами.

 

В последнее время в области генетики и селекции наблюдается переход от традиционных методов к современным технологиям, таким как машинное обучение и глубокое обучение. Этот сдвиг обусловлен необходимостью обработки больших объемов данных, с которыми сегодня работают специалисты. Современная селекционная работа требует анализа разнообразных массивов информации: от хозяйственно полезных признаков животных, включая их экстерьер и интерьер, до количественных и качественных показателей продуктивности. Важными компонентами этого процесса также являются генетические маркеры и данные о секвенировании геномов. Внедрение новых технологий в практику животноводства позволяет не только ускорить процесс анализа, но и значительно повысить его точность.

 

Машинное обучение и нейросети играют ключевую роль в автоматизации обработки и анализа больших данных, позволяя находить закономерности и взаимосвязи, которые могут быть неочевидны при традиционном подходе. Эти технологии делают процесс селекции более эффективным и открывают новые возможности для развития животноводства. Развитие цифровых технологий позволяет ввести анализ больших данных в современную генетику и селекцию. Обучение искусственного интеллекта позволяет отойти от классических стандартов применения математических моделей.

 

Одна из насущных проблем в генетике животных — это идентификация породной принадлежности, которую не всегда можно определить по фенотипу. Сотрудники лаборатории сравнительной генетики животных ИОГен РАН оценили возможности использования моделей машинного обучения для определения классификации пород и популяций животных по данным анализа микросателлитных локусов. Основным объектом для классификации пород послужила лошадь (Equus caballus), в исследовании применяли стандартную панель из 17 микросателлитных локусов.

 

Эти данные были использованы для машинного обучения. В качестве обучаемой модели была выбрана модель CatBoostClassifier из библиотеки CatBoost от Yandex.Обучение проводилось по данным 14 отечественных и зарубежных пород. Полученная модель идентифицирует со 100% точностью следующие породы: одичавшие лошади острова Водный (на озере Маныч-Гудило, Ростовская обл.), ахалтекинская, русская тяжеловозная, фризская, фьордская, нью форест, андалузская, донская и арабская.В остальном, по выборке точность определения породы варьируется в диапазоне от 73 до 100%. При идентификации советской тяжеловозной породы модель не совершала ошибок при сравнении с другими упряжными и тяжеловозными лошадьми, поэтому может использоваться для оценки уровня межпородной гибридизации.

 

В целом обучение модели можно считать успешным, средневзвешенная метрика Accuracy составляет 0.96, заключают авторы.Ученые подчеркивают, что методы машинного обучения в генетике и селекции в ближайшем будущем станут основой для решения разнообразных научных и практических задач, таких как оценка племенной и генофондной ценности животных, адаптивности, жизнеспособности, психотипа, генетического потенциала, меж- и внутрипородное скрещивание и создание новых пород.

 

Источник:

А. Д. Солошенков, Э. А. Солошенкова, М. Т. Семина, Н. Н. Спасская, В. Н. Воронкова, Ю. А. Столповский. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И КЛАССИЧЕСКИЕ МЕТОДЫ В ГЕНЕТИКЕ И СЕЛЕКЦИИ ЖИВОТНЫХ // ГЕНЕТИКА, 2024, том 60, № 7, с. 3–16 DOI: 10.31857/S0016675824070017