Nová databáze pro design proteinů umělou inteligencí

S rostoucím výkonem superpočítačů proniká umělá inteligence do stále více oblastí vědeckého života a pomáhá řešit problém, se kterými si vědecké špičky lámaly hlavy desítky let. Nezbytným předpokladem úspěšného nalezení řešení je dostupnost dostatečného množství kvalitních zdrojových dat, na jejichž základě algoritmus problém analyzuje. Bez dat je nalezení správného řešení značně ztíženo nebo není vůbec možné. Řada vědeckých komunit se historicky systematickým sběrem a správou dat nezabývala a jejich nynější získání z tisíců publikovaných studií je časově velmi náročné a pracné.

Jednou z atraktivních oblastí pro aplikaci umělé inteligence je analýza vlivu mutací na teplotní stabilitu proteinu, neboť tento mechanismus není dostatečně dobře pochopen. I tato oblast trpí nedostatkem kvalitních dat, a proto se datoví analytici a programátoři z Loschmidtových laboratoří PřF MU a Mezinárodního centra klinického výzkumu Fakultní nemocnice u sv. Anny v Brně (FNUSA-ICRC) pod vedením molekulárního biologa Mgr. Davida Bednáře Ph.D. a matematika Stanislava Mazurenka Ph.D. z výzkumného týmu Proteinové inženýrství FNUSA-ICRC rozhodli vytvořit novou databázi FireProtDB, která by tato data dlouhodobě systematicky shromažďovala a udržovala.

„Databáze aktuálně obsahuje 16 tisíc experimentálních hodnot získaných z vlastních měření, dostupné vědecké literatury a již neudržovaných databází, které byly důkladně profiltrovány a ověřeny.“ sdělil Mgr. Jan Štourač, který je jedním z tvůrců databáze. Pro přístup k datům nabízí uživatelům jednoduché webové rozhraní, které od publikování v říjnu 2020 navštívilo více než 500 vědců z celého světa. Data byla rovněž poskytnuta do celosvětové databáze PDBe-KB, která slouží jako globální úložiště informací pro biologický a biomedicínský výzkum a je spravována Evropským bioinformatickým ústavem. Databáze FireProtDB byla publikována v prestižním vědeckém časopise Nucleic Acids Research.

Odkaz na databázi zde.