Сбор и обработка больших объемов данных

Ник Боддикер, Доктор наук, генетик Genesus Inc.


Сбор и обработка данных – это важнейшая составляющая программ племенной работы по улучшению генетики свиней. Без этих сведений невозможно осуществлять генетический прогресс. По мере развития технологий растет возможность сбора новых данных в большем объеме и нацеленная на успех генетическая компания, занимающаяся племенным свиноводством, будет использовать эти современные технологии. Более того, одновременно с развитием технологий снижается и их стоимость. Например, цена одного гигабайта памяти в 1980 году была примерно на уровне $500 000 USD. Сегодня один гигабайт памяти стоит менее $0,03 USD. Это огромная экономия средств, поскольку в настоящее время идет сбор и обработка огромных массивов информации.


В генетике свиней сбор данных идет волнообразно. Базовые данные включают в себя вес, общее число рожденных и число живорожденных поросят в помете, количество отнятых поросят, число дней сервис-периода, подсчет функционирующих сосков и так далее. При сборе данных по этим признакам не требуется сложных технологий. Появление такой технологии, как ультразвуковые исследования позволило проводить ультразвуковые промеры толщины хребтового шпика, глубины мышцы и внутримышечного жира.


На протяжении многих лет ведутся работы по повышению качества свиных туш и мяса, в этом направлении активно используется оборудование для выполнения объективных измерений уровня pH, мраморности, насыщенности по цвету и нежности свинины. Все эти показатели крайне важны для пищевого качества мяса. База данных компании Genesus имеет более 820 000 измерений показателей качества туш и мяса, производимых с 1998 года, более того, это число постоянно растет.


Еще одним крупным генератором данных в отрасли свиноводства является сбор информации по индивидуальному потреблению корма и режиму его приема. Существует целый ряд доступных систем, которые будут фиксировать каждый прием корма в период от выращивания и до финальной стадии откорма. Genesus имеет более 43 миллионов индивидуальных записей потребления корма во период откорма. Более того, была разработана технология для измерения потребления корма супоросными и лактирующими свиноматками. Genesus собирает данные по потреблению корма свиноматками на опросе в качестве составляющего признака эффективности лактации и в настоящее время располагает более 21 миллионом записей о потреблении корма свиноматками в период лактации.


Новейший и крупнейший генератор данных – это информация о генотипе, которая используется при проведении геномной селекции. Каждый генотип животного получает около 55 000 единиц информации. Если каждую неделю генотипировать по 500 животных, то еженедельно база данных будет пополняться 27 миллионами единиц информации, то есть, более 1.4 миллиардов в год. Файлы с таким объемом информации не могут быть открыты или обработаны при помощи обычного программного обеспечения на компьютере и, следовательно, для целевого использования данной информации генетической компанией должна быть разработана специальная программа.


Сбор и обработка данных всегда были неотъемлемой частью программы племенной работы по улучшению генетики, а объем фиксируемой информации продолжает расти в геометрической прогрессии. Пир все более стремительном развитии технологий и росте их доступности можно с уверенностью сказать, что в скором времени будут вводиться новые измерения и проводиться сбор новых данных. Также есть несколько областей, которые будут развиваться в будущем и также генерировать большие объемы данных, например, это эпигенетика (динамика развития и исследования экспрессии наследственных генов), протеомика (наука по изучению белкового состава биологических объектов, модификаций и структурно-функциональных свойств белковых молекул) и крупномасштабное генотипирование. Примером крупномасштабной программы генотипирования может стать установка небольшого ушного импланта, который будет собирать данные по температуре тела свиньи в течение дня. Эти данные могут помочь определить состояние здоровья свиньи, или предоставлять информацию по расходу и потреблению энергии, или идентифицировать момент наступления половой охоты для своевременного проведения вязки. Еще одним примером может стать ведение видеозаписей в станках, где содержатся свиньи для мониторинга их активности и режима приема корма, что затем можно будет соотнести с расходом энергии и производительностью. Большинство из нас знает, какой объем памяти хранит одноминутный видеоклип на наших смартфонах. А теперь представьте объем, полученный при круглосуточной видеосъемке нескольких систем мониторинга на нескольких фермах.


Успешная генетическая компания будет играть активную роль в поддержании и дальнейшем развитии технологий и их использовании в своих программах племенной работы. Genesus всегда действует очень решительно, активно внедряя самые новые и усовершенствованные технологии для достижения генетического прогресса. В конечном итоге эти инвестиции идут на пользу и приносят прибыль производителям, использующим генетику Genesus.

Назад в раздел