Математика в помощь селекционерам

Методы анализа и обработки данных ускоряют инновации, одновременно сберегая ресурсы.

Математические методы обработки и анализа данных для молекулярного моделирования способствуют ускорению инноваций в области селекции растений.

Фани Чавали возглавляет команду аналитиков по селекции растений в компании Bayer, где он работает вот уже шесть лет. Имея степень доктора философии по электротехнике, Фани специализируется на передовых статистических исследованиях, методах обработки сигналов и машинном обучении и обожает решать задачи. 

Чем же он занимается в области селекции растений?

«По сути, селекция – просто игра чисел, которая усложняется по мере увеличения числа переменных», – считает Чавали.

Это обусловлено тем, что генетические признаки передаются по законам вероятности. Чавали убежден, что использование методов обработки и анализа данных в растениеводстве поможет формированию новой эры прецизионной селекции, где неопределенность процесса будет сведена к минимуму.

Высокая стоимость и невероятность успеха

В современном сельском хозяйстве селекция растений является движущей силой инноваций. Более высокий урожай, устойчивость к болезням, мощность развития растений, засухоустойчивость – все эти признаки являются продуктом законов вероятности Менделя.

До того как в селекции начали использовать законы высшей математики, методы анализа и обработки данных, селекционерам приходилось проводить крупномасштабные эксперименты по выращиванию и наблюдать за результатом генетических скрещиваний. Для достижения желаемых показателей требовалось вырастить не одно поколение растений, действовать методом проб и ошибок. На это уходило не только много времени, использовались и значительные земельные, водные, энергетические и другие ценные природные ресурсы.

«Раньше мы проводили большой эксперимент, надеясь на лучший результат, а затем уже селекцию, исходя из того, что видели на поле. Чтобы проверить результат, нам нужно было оценить множество сортов в поле», – рассказывает Чавали.

Для успешного завершения выполнялись сбор данных и наблюдение за тысячами родительских линий, на что уходило очень много времени. Затем потенциальные решения необходимо было приспособить к конкретным потребностям сельскохозяйственных производителей, что требовало еще больше времени для испытаний в полях. 

Искусственный интеллект и облачные вычисления

Достижения в области вычислительных мощностей и машинного обучения помогают селекционерам экономить время и ресурсы.

Появляется облако и меняет все

За последние пять лет в технологиях, поддерживающих анализ данных и искусственный интеллект, произошли революционные изменения, что существенно повлияло на работу в области селекции.

Главной среди таких инструментов является технология облачного вычисления, которая сегодня стала гораздо доступнее. Это значит, что ошеломляющие объемы данных можно хранить, очищать, организовывать и изучать с относительной легкостью. Потрясающая новость для Чавали и его команды в Bayer, а также для университетских исследователей и независимых ученых-растениеводов во всем мире.

В то же время еще одна прорывная технология – искусственная нейронная сеть – приблизилась в своем развитии к такой точке, где она могла бы обеспечить подлинную ценность. Эти уровни взаимосвязанных вычислительных систем обеспечивают основу для расширенного анализа данных. Они жизненно важны для машинного обучения, одного из видов искусственного интеллекта. В сочетании с существенными прорывом в развитии вычислительных мощностей это значительно повышает эффективность прогнозного моделирования.

Даже при использовании самых точных и содержательных программ по селекции может потребоваться много попыток для получения желаемых свойств. Это обусловлено сложностью многих свойств, т.е. их взаимосвязью с несколькими генами в геноме растения. Кроме того, каждое растение необходимо испытать в различных условиях выращивания, чтобы гарантировать фермерам решения, которые подойдут именно к их специфическому сочетанию климата, типа почвы и агрономическим методам. Но теперь, благодаря прогнозной аналитике и машинному обучению, желаемые результаты могут быть с большей вероятностью достигнуты в разумные сроки и при меньших ресурсных затратах.

Настоящие преимущества искусственного интеллекта

Селекционеры используют алгоритмы прогнозного моделирования, поддерживаемые машинным обучением, чтобы получить преимущества для своей работы. Это стало возможным благодаря огромному множеству количественных данных о свойствах растений, собранных за прошедшие годы.

«По мере того как мы расширяли усилия в области селекции и полевых исследований и начали собирать данные по целому ряду показателей, человеку стало практически невозможно отсортировать информацию для принятия обоснованных решений», – говорит Чавали.

Математика помогает сократить количество попыток, необходимых для «решения» задачи по селекции, и создать растение с желаемой комбинацией признаков, адаптированных к уникальным условиям выращивания у конкретного фермера.

Для решения этой задачи в компании Bayer создали виртуального цифрового помощника с элементами искусственного интеллекта, который помогает селекционерам выбирать правильных кандидатов в программе разведения. Работа такого помощника опирается на облачные алгоритмы, построенные на основе примерно 1,7 триллиона вычислений. Это значительно расширяет масштабы и ускоряет процесс разведения.

Например, селекционеры знают, в какой части генома находятся гены, отвечающие за определенные свойства растения. А также понимают вероятность появления этих генов в любом конкретном поколении. В результате передовые математические модели и модели анализа данных и процессов помогают выявить растения, необходимые для получения определенного набора признаков.

В одной из таких моделей используется алгоритм ветвей и границ. Компьютер предсказывает потенциал нескольких линий (ветвей) скрещивания, что позволяет селекционерам не тратить усилия на те из них, которые способны обеспечить желаемый результат лишь с малой долей вероятности. Модель создает график размножения для оставшейся линии, а также рассчитывает минимально необходимое количество растений для получения желаемого признака.

Благодаря прорыву в технологии нейронных сетей эти модели буквально учатся в ходе всего процесса. Говоря иначе, модели данных предоставляют селекционерам план развития. И с каждым поколением он становится все более точным и эффективным.

Нет ничего более естественного, чем математика

Вполне разумно использовать математику для лучшего понимания природных процессов, таких как размножение и наследственность. В конце концов, математика в природе встречается буквально повсеместно. Ракушки, снежинки и подсолнухи – вот лишь некоторые примеры схем и комбинаций, которые подчинены математическим правилам.

Следуя примеру природы, наши селекционеры-новаторы используют математику для создания желаемых сельскохозяйственных культур. В ходе процесса они совершают удивительные вещи.

Каждому растению нужны свет, земля, вода, почва или другая среда для роста, а также питательные вещества. Методы обработки и анализа данных сокращают количество растений, необходимых для получения нужного свойства, экономя не только время и деньги, но и жизненно важные природные ресурсы и энергию.

Использование машинного обучения, методов анализа и обработки данных позволяет значительно сократить использование ресурсов по сравнению со стандартным процессом селекции. Другими словами, будет требоваться меньше воды, энергии, земли и питательных веществ.

Что это значит для фермеров? Большее количество данных, собранных о каждом продукте, помогает предоставлять фермерам более точные рекомендации, адаптированные к их уникальным условиям, с учетом глубокого анализа поведения растений при разнообразных сценариях.

А для потребителей? Они могут выбирать из множества питательных и экологически чистых продуктов на рынках во всем мире.

Выше точность. Меньшее количество ресурсов. Меньше времени Невероятная экономия энергии. Достаточное количество продовольствия, чтобы удовлетворить потребности растущего населения. Это стало возможным благодаря сочетанию многовековых знаний в селекции растений с современными формами технологического интеллекта. Высшая математика и наука о данных уже доказали свою ценность для сельского хозяйства, и результат заметен всем жителям планеты. Вот так математика помогает не переживать по поводу серьезных изменений в жизни.

Источник: Оригинал статьи опубликован дивизионом Crop Science АО «Байер» в журнале Farming’s Future 1/2019