Bioinformatika - na půl cestě mezi algoritmy a životem

Do bioinformatiky bývá dnes zařazováno leccos, toto slovo je dnes docela populární mj. i mezi investory a zakladateli start-upových firem. Snad tahle popularita souvisí se zvýšeným zájmem o interdisciplinární vědní obory, současně ale často dochází k určitým zmatkům. V následujícím textu se tyto zmatky pokusíme trochu projasnit v rozhovoru s Fatimou Cvrčkovou, která na Přírodovědecké fakultě Univerzity Karlovy přednáší mj. právě úvod do bioinformatiky.

Bioinformatika - na půl cestě mezi algoritmy a životem


Do bioinformatiky bývá dnes zařazováno leccos, toto slovo je dnes docela populární mj. i mezi investory a zakladateli start-upových firem. Snad tahle popularita souvisí se zvýšeným zájmem o interdisciplinární vědní obory, současně ale často dochází k určitým zmatkům. V následujícím textu se tyto zmatky pokusíme trochu projasnit v rozhovoru s Fatimou Cvrčkovou, která na Přírodovědecké fakultě Univerzity Karlovy přednáší mj. právě úvod do bioinformatiky.

Jako bioinformatiku chápete vy sama, respektive v jaké podobě se jí zabýváte a co v rámci tohoto předmětu vyučujete?

Napadlo mne onehdy najít si českou definici bioinformatiky na Googlu. Na jednom z prvních míst na mě vyběhl příspěvek z elektronické konference Záhady, podrubrika Psychotronika, podle kterého je bioinformatika obor, který se zabývá jevy, jako je hypnóza, telepatie, dálkové vnímání... Jak vidno, s definicí bioinformatiky to zjevně není tak úplně jednoduché.
Mně se líbí dosti rozšířené pojetí, podle něhož je bioinformatika oblast na pomezí biologie a informatiky, která se zabývá zpracováním, prohledáváním a analýzou dat o sekvenci, struktuře a popřípadě i funkci biologických makromolekul, tedy hlavně DNA a proteinů.
V literatuře se ale dá najít i vymezení širší – totiž že do bioinformatiky patří jakékoli využití počítačů k hledání odpovědí na biologické otázky. Pak by tam spadlo také statistické zpracování fyziologických, lékařských a dokonce i ekologických dat. Nemyslím ale, že by toto širší vymezení (odpovídající zhruba anglickému termínu "computational biology") bylo k něčemu dobré. To jsou jiná témata, dělají to obvykle jiní lidé a jinými metodami, nanejvýš někdy na stejném hardwaru. Možná se taková definice může hodit třeba k vymezení struktury pracoviště či ke zdůvodnění žádosti o peníze, když se zrovna nosí mezioborovost, ale jinak sotva.

Možná drobné upřesnění: Bioinformatika je vymezena spíše oborem svého zájmu, nebo používanými metodami?

Záměrně jsem bioinformatiku označila za oblast, nikoli obor. Obor je určen tématem a kladenými otázkami. Má-li bioinformatika být obor, pak opravdovým bioinformatikem je jen ten, kdo třeba vyvíjí software pro automatizované zpracování a analýzu dat, nebo aspoň spravuje vlastní databázi. Ale kolem bioinformatiky se pohybuje řada lidí, pro které jsou bioinformatické postupy prostě pouze jedním z nástrojů pro řešení biologických otázek - a bioinformatika je pro ně tedy spíš metoda než obor. Sama se počítám do téhle skupiny, protože to, čím se doopravdy zabývám, když zrovna neučím nebo – bohužel – neúřaduji, je buněčná biologie. Pro mne tou nejzajímavější otázkou je, jak je možné, že velká část z úžasné rozmanitosti živých tvorů, kterou kolem sebe vidíme, je „postavena“ z velmi malé sady téměř typizovaných molekulárních součástek. Bioinformatický přístup mi umožňuje tyto součástky nacházet, porovnávat, hledat shody a rozdíly, vyvozovat hypotézy o jejich evoluční minulosti – nebo o současné funkci, která se pak dá zkoumat i experimentálně.
Hranice mezi tím, kdo ještě je bioinformatik, a kdo pouhý uživatel bioinformatických nástrojů, není úplně ostrá. My „poučení uživatelé“, kteří se zabýváme analýzou veřejně dostupných dat veřejně dostupnými nástroji, jsme zjevně v jiné kategorii než ti, kdo si sami vyvíjejí databáze a software, sekvenují genomy, udržují servery a vůbec provozují to, čemu bychom mohli říkat „vysoká bioinformatika“. Neovládáme rafinované matematické teorie a třeba ani neumíme programovat, ale zase něco víme o džungli molekul a regulačních drah, které nezajímají tvůrce algoritmů a autory impozantních analýz celých genomů.

Když používáme slovo bioinformatika, je možná na místě následující otázka - liší se nějak zásadně zpracování informace v živých systémech od toho, co rozumíme "normální" informatikou? Respektive - používáme snad slovo informace v obou případech ve stejném významu?

Tak, jak jsme si bioinformatiku vymezili – především jako nauku o sekvencích, tedy o digitálních řetězcích písmenek, která označují jednotlivé báze v DNA nebo aminokyseliny v proteinech a v posledku jsou převoditelné na posloupnost nul a jedniček – by na tom měla být podobně jako „normální“ informatika. Alespoň tak, jak si informatiku představuje bioložka nedotčená informatickým vzděláním.
Současně ale z vlastní zkušenosti i z pozorování jistého vzorku bioinformatiků v mém okolí shledávám, že praktické provozování bioinformatiky se kupodivu může obejít vůbec bez pojmu informace ve smyslu, jak ji definoval Shannon. Tedy té informace, která se měří na bity a bajty a na jejímž obsahu přitom nezáleží. Totéž by ale nejspíš řekl i informatik, který se věnuje třeba modelování populací autonomních agentů nebo umělé inteligenci.
Na druhé straně má ale bioinformatika skrze své sepětí s biologií blízko k tradičnímu chápání pojmu informace, které dávno předcházelo počítačovému věku a matematickým definicím. Slovo „informace“ není nové; odedávna, už od středověku, se jakožto „in-formatio“ označovalo to, co „udílí či určuje formu“ našemu tělesnému světu. Třeba Boží vnuknutí, školní učivo, náležitě pochopené zprávy (zprávy, nikoli nezpracovaná data), dnes třeba také to, co se dovídáme v informační kanceláři na nádraží. Sem dobře zapadá i sekvence nukleotidů, která určuje sekvenci aminokyselin, skrze ni tvar a vlastnosti proteinu a posléze i těla. A současně to, co bioinformatik dělá, není mnohdy nic jiného než dolování srozumitelných informací z hromady nesetříděných surových dat (tedy data mining, jak se tyhle postupy obvykle označují ve světě IT).

Jak vlastně v oblasti bioinformatiky funguje dnešní byznys? Co se prodává, co se kupuje a co bývá zveřejňováno volně? Napadají mě patentovaná léčiva, genetické testy na náchylnost k chorobám, ale třeba i vlastní přečtené sekvence... Čím se zabývají spíše firmy, co je naopak doménou akademických výzkumných týmů?

Můj pohled je asi dost zatížený tím, se pohybuji v univerzitním prostředí. Většina institucí, které mám spojené s bioinformatikou, je financována převážně či výhradně z veřejných zdrojů. Jsou to často státní či mezinárodní ústavy (třeba americký NIH, Národní ústav zdraví, který je pro bioinformatiku a genomiku tím, čím pro kosmonautiku NASA), univerzity, ústavy vědeckých společností typu německé Max-Planck-Gesselschaft nebo naší Akademie věd. Komerční firmy mě napadají vlastně jen tři: Syngenta a Monsanto, což jsou šlechtitelské společnosti, které se věnují vývoji nových odrůd zemědělských plodin, a Affymetrix, dnes jedna z nejvýznamnějších firem produkujících DNA čipy a související hardware a software. Instituce typu univerzit či akademických ústavů výsledky samozřejmě zveřejňují, a i třeba Monsanto a Syngenta povolily nekomerčním pracovištím přístup k datům na základě smlouvy, která firmám zajišťovala spoluúčast na případných budoucích patentech.
Zajímavý případ představuje TIGR (The Institute of Genomic Research), což je soukromá firma, u jejíhož zrodu stál Craig Venter, dnes asi nejvýraznější postava toho, co by se dalo nazvat komerční genomikou. TIGR má za sebou celou řadu sekvenovaných genomů, mimo jiné i ten vůbec první – bakterii Haemophilus influenzae, jejíž dědičná informace byla přečtena už v roce 1995. TIGR je také firmou, která před pár lety velikému mezinárodnímu konzorciu téměř vyfoukla prioritu v sekvenování lidského genomu (nakonec se oba konkurenční týmy dohodly a výsledky zveřejnily společně). Velká část genomových projektů společnosti TIGR je ale financována z veřejných peněz formou grantů. Výsledky jdou přímo do špičkových vědeckých časopisů, což mj. znamená, že sekvence hotových genomů musejí být uloženy ve veřejně přístupné databázi. Zveřejněny musí být i metody – aspoň princip, i když třeba zdrojový kód softwaru nikoli.
Já sama čerpám informace právě z odborných časopisů a databází, a tak o nepublikovaných záležitostech vím jen z doslechu a z druhé ruky. Ale dovedu si docela dobře představit, že leckterá farmaceutická firma si v tichosti dělá slušnou sbírku genetických profilů nádorových linií či virových izolátů, na kterých sleduje účinnost léků a pak si patentuje sérii diagnostických testů pro předpovídání účinnosti možných variant postupu léčby. Třeba u některých typů nádoru prsu už je dnes možné předem odhadnout, zda budou reagovat na hormony. Velké semenářské podniky (nejen Syngenta) nejspíš také používají molekulárně charakterizované genetické znaky jako vodítko při šlechtění. S tím se ostatně začíná i u nás, třeba u firmy Agritec v Šumperku. Farmaceutické firmy nejspíš také navrhují struktury nových léčiv na základě teoretického modelování tvaru molekul Mám ale přesto tak trochu pochybnosti, do jaké míry je oprávněné mluvit přímo o „podnikání v oblasti bioinformatiky“. Pokud si mám vzpomenout na nějaké konkrétní komerční aktivity spojené s bioinformatikou, obvykle v nich hlavní roli hraje „mokrá“ biochemie či chemie. Bylo by asi na místě hovořit spíš o podnikání v oblasti molekulární biologie či biotechnologie, protože bioinformatika vystupuje jen jako jeden z nástrojů, až snad na několik výhradně softwarových firem.

Dr. Fatima Cvrčková se na katedře fyziologie rostlin Přírodovědecké Fakulty UK zabývá studiem molekulárních mechanismů zodpovědných za tvar rostlinné buňky. Kromě toho přednáší také úvod do bioinformatiky. Na stejné téma jí na začátku tohoto roku vychází také vysokoškolská učebnice v nakladatelství Academia.








Komentáře