Od kvality dat k Nobelově ceně: Jak ověřená vědecká data proměňují molekulární biologii

04. 11. 2024

Datum konání akce:
04. 11. 2024 | 11:10 - 11:10

Letošní Nobelova cena za fyziku, která oceňuje průlomové řešení jednoho z nejtrvalejších vědeckých problémů – skládání proteinů, je uznáním síly výpočetní biologie. Tento úspěch, umožněný inovativním spojením bioinformatiky a umělé inteligence, ukazuje, jak ověřená, strojově čitelná data pohánějí moderní vědecké objevy.

"Jsme svědky sbližování tradiční fyziky s nejmodernějšími výpočetními metodami," říká prof. Bohdan Schneider, ředitel Biotechnologického ústavu Akademie věd ČR (BTÚ). "Tento průlom ukazuje, jak kvalitní data a inovativní přístupy mohou vyřešit problémy, které byly kdysi považovány za nepřekonatelné."

Základ objevů: kvalitní data

Jádrem této vědecké revoluce je Protein Data Bank (PDB) a veřejné sekvenční databáze jako GeneBank. Tyto databáze se vyznačují dvěma klíčovými vlastnostmi: odbornou kurátorskou činností a úplnou strojovou čitelností. Na rozdíl od běžných datových úložišť procházejí informace v PDB důkladným ověřováním odbornými kurátory, což zajišťuje spolehlivost jak pro výzkumníky, tak pro systémy umělé inteligence.

Tento dvojí přístup – lidská odbornost a strojová přístupnost – sahá až k průkopnickým vědcům ze 70. let. Jednou z těchto vizionářek byla prof. Helen Bermanová, která prosazovala zásadní význam kvality a standardizace dat. Pochopila, že sdílení dat nestačí – musela být jak ověřená, tak výpočetně přístupná, a tato předvídavost se ukázala jako klíčová pro dnešní objevy založené na umělé inteligenci.

V nedávném rozhovoru pro Nature Bermanová zdůraznila význam těchto zdrojů: "Na datech PDB byly důležité dvě věci: jsou kontrolována a ověřována odbornými kurátory. A také jsou kompletně strojově čitelná."

Za hranicemi tradiční fyziky

Průlom oceněný Nobelovou cenou představuje paradigmatický posun v řešení problému skládání proteinů. Zatímco tradiční fyzikální přístupy poskytly důležité poznatky, mohly problém skládání proteinů řešit pouze částečně. Řešení, které nyní všem nabízí AlphaFold, vzniklo spojením bioinformatické expertízy s umělou inteligencí. Hybridní přístup AlphaFoldu, učící se z kurátorovaných databází, dosáhl toho, co nedokázala ani kvantová mechanika, ani silová pole: přesnou predikci proteinových struktur v bezprecedentní rychlosti a měřítku.

nobel2024previewphysics

Role kontroly kvality

Když se systémy umělé inteligence učí z našich databází, přesnost jejich předpovědí přímo závisí na kvalitě našich dat. BTÚ proto prosazuje vynikající kvalitu kontroly dat, otevřenost a interoperabilitu, nyní shrnutou pod pojmem FAIRness. Jak říká ředitel BTÚ Schneider: "Kontrola kvality dat ve strukturní biologii není jen dobrou praxí – je zásadní pro inovace."

K nízkému objemu a omezené kvalitě dat o sekvencích a strukturách RNA dodává: "Další hranicí strukturní biologie je předpověď struktur RNA. Aktivně vyvíjíme nové metody k řešení této výzvy."

Pohled do budoucnosti

Při oslavě těchto nobelovských úspěchů si připomínáme, že budoucnost molekulární biologie spočívá na dvou pilířích: kvalitě dat a jejich dostupnosti. Prostřednictvím pokračující spolupráce s průkopníky v oboru zajišťují výzkumníci BTÚ, že další generace objevů bude stavět na základech spolehlivých a dostupných informací.

Cesta od raného vývoje databází k dnešním objevům poháněným umělou inteligencí ukazuje, jak pečlivá pozornost věnovaná validaci dat v kombinaci s výpočetními inovacemi vytváří nové možnosti ve vědě.