Промени размера
Аа Аа Аа Аа Аа

Терминът "геномни" заменя "астрономически" по мащаби

08 юли 2015, 11:02 часа • 8006 прочитания

Най-динамичният и бързо растящ сегмент от глобалната мрежа в близките 10-15 години няма да са порносайтовете, видеохостингите или социалните мрежи, а банките с геномни данни и свързаните с тях портали, твърдят учени в статия, публикувана в PLoS One.

"С подобрението на технологиите за анализ на ДНК и намаляването на цената на тази процедура очакваме истински взрив и разпространение на технологиите за секвениране във всекидневния живот и свързания с това информационен "потоп". Единствената възможност да го преживеем е да подобрим компютърната инфраструктура, отговаряща за обработката на геномните данни", казва Джин Робинсън от университета на Илинойс в Урбана (САЩ).

Робинсън, генетик по професия, и няколко математици и програмисти решили да оценят мащабите на този взрив, като сравнят как са се развивали няколко от най-динамичните сегменти на глобалната мрежа в последните години – социалните мрежи, видеохостингите и разпределените системи за обработка на научна информация.

В качеството на първите две влезли познатите на всички Twitter и YouТube, а в ролята на третия влезли редица проекти в астрономията, физиката на елементарните частици и молекулярната биология.

Въпреки очакванията на учените най-много за последните години са нараснали обемите обработвана, предавана и съхранявана информация не в социалните мрежи и видеохостингите, а в геномните банки данни.

За сравнение първите изработват по около 10-100 петабайта (милиона гигабайта) "оригинално съдържание" всяка година, което може да изглежда много голяма цифра. Геномните бази данни се попълват по съпоставим начин, но скоростта на техния ръст е в пъти повече – на всеки седем-осем месеца обемите нови генетични данни се удвояват.

Благодарение на това буквално след десет години интернет банките с геномна информация ще нараснат до няколко екзабайта (хиляди петабайта) годишно, което ще породи огромно количество проблеми със съхранението и обработката на подобни масиви данни. Голяма част от тях ще бъде подсилена от това, че биолозите, за разлика от физиците и астрономите, още не са изработили единни стандарти за обработка, свиване и архивиране на геномната информация.

Както обясняват авторите на статията, генетиците не са създали алгоритъм, който би им позволил да "изхвърлят" общите и незначими фрагменти от човешката ДНК. Поради това съхраняването на геномите дори на членовете на "златния милиард" ще изисква капацитет от няколко екзабайта, което е голям проблем днес и ще бъде затруднено и след 10 години.

"Много дълго време хората използваха прилагателното "астрономически" за описание на нещата, които притежават наистина гигантски мащаби, обеми или размери. Разкривайки невероятната скорост на прираст на геномните данни, аз и колегите ми сега предлагаме да наричаме подобни неща не "астрономически", а "геномни", заключава Майкъл Шатц от Лабораторията в Колд Спринг Харбър (САЩ).

 

Антония Михайлова
Антония Михайлова Отговорен редактор
Новините днес