Dr. Marinka Žitnik je docentka na Harvard Medical School, kjer na oddelku za biomedicinsko informatiko vodi svoj laboratorij za umetno inteligenco v medicini in znanosti. Foto: Radio Slovenija/Nina Slaček
Dr. Marinka Žitnik je docentka na Harvard Medical School, kjer na oddelku za biomedicinsko informatiko vodi svoj laboratorij za umetno inteligenco v medicini in znanosti. Foto: Radio Slovenija/Nina Slaček

Delovanje vsem dobro znanega ChatGpt-ja je lahko preverila že mesece prej, preden je zanj prvič slišala širša javnost. Tudi njo so presenetili njegovi odgovori. A razvoj novih, še mnogo zmogljivejših modelov je v polnem razmahu in z njimi se v temelju spreminjajo tako znanost in raziskovanje kot tudi številne druge človeške dejavnosti.

Kako danes poteka razvoj modelov generativne umetne inteligence, kje jih že uvajajo, kako je z varnostjo podatkov in raznovrstnimi tveganji ter kako bodo v prihodnje načrtovali nova zdravila in najboljše možnosti zdravljenja, je le nekaj vidikov, ki jih prinaša intervju.


Vrsto let že aktivno delujete na področju umetne inteligence. Vseeno pa domnevam, da je bilo zadnje leto še prav posebej intenzivno. Umetna inteligenca je z letošnjim letom nekako postala resnično vroča tema. Veliki jezikovni modeli, kot so vsem dobro poznani ChatGpt pa tudi drugi, še bolj izpopolnjeni veliki jezikovni modeli, so zelo nazorno in v vsem razumljivem naravnem jeziku pokazali, česa so ta orodja zmožna. Pravzaprav so temeljito presenetili tudi številne poznavalce področja. Kakšen je bil vaš odziv, prva srečanja s temi novimi orodji? Konec koncev to tehnologijo poznate in spremljate njen razvoj.
Ja, v zadnjem letu smo bili priča precejšnjemu preskoku v zmogljivostih algoritmov umetne inteligence. Sama umetna inteligenca in strojno učenje s poudarkom na globokem učenju je bilo v zadnjem desetletju zelo propulzivno, veliko uspešnih primerov uporabe smo zasledili na področju biologije, medicine, znanosti in na drugih področjih človekovega delovanja. V zadnjem letu, letu in pol pa je določena skupina modelov umetne inteligence res zelo napredovala v svojih zmogljivostih in dosegla stopnjo, ko postajajo ti modeli zelo zanimivi in uporabni za nadvse raznovrstne naloge: od izdelave klepetalnikov, s katerimi se lahko vsak pogovarja v naravnem jeziku o različnih temah, ki niso vnaprej predpisane, do možnosti avtonomnega ali vsaj semi-avtonomnega odločanja, gradnje modelov, priprave napovedi, kar so ti algoritmi zdaj zmožni.

Ko se je vse to začelo odvijati, sem bila zelo navdušena in zelo vesela. Tudi v moji raziskovalni skupini veliko delamo s tovrstnimi modeli, razvijamo nove modele, razmišljamo o tem, kakšne probleme nam lahko pomagajo rešiti, še zlasti v biologiji in medicini. In zdi se, da so se res odprle nove možnosti in priložnosti, pa tudi nekaj tveganj in izzivov, o katerih moramo razmisliti. Ampak v splošnem zelo pozitivno gledam na ta novi razred modelov in na to, kar nam še prinaša prihodnost, ko bodo ti modeli postali le še bolj zmogljivi.

Je bil kakšen konkreten trenutek, ko vas je odgovor teh novih modelov še prav posebej presenetil; nekaj, kar je morda bilo onkraj tega, kar bi pričakovali?
Ja, pravzaprav res. V tistem tednu, ko je bil model ChatGpt tudi uradno oznanjen, in tudi že nekaj mesecev pred tem je moja raziskovalna skupina sodelovala s skupino iz podjetja OpenAI, ki ta model razvija. ChatGpt smo testirali na problemih iz medicine za diagnostiko ljudi. Res me je zelo presenetilo, kako je model, ki ni nikoli bil naučen, natreniran na podatkih s področja medicinske diagnostike, uganil pravilno diagnozo, ko smo mu predstavili nekega pacienta. Ta je bil sicer izmišljen, šlo je za sintetične podatke, smo pa ChatGpt vprašali, kakšna bi bila diagnoza. Ko smo mu dali seznam simptomov, ki naj bi jih ta pacient imel, ter rezultate laboratorijskih raziskav, je model v bistvu uganil pravilno. Sicer potem, ko smo dali nekaj več primerov in teh navideznih, umetnih, virtualnih pacientov, se je kdaj tudi zmotil, ampak vendar je bilo takrat takoj začutiti, da so se zmožnosti, o katerih smo bolj abstraktno pisali v znanstvenih člankih že kar nekaj let pred ChatGpt, zdaj res uresničile na način, ki nam omogoča, da naposled začnemo bolj konkretno razmišljati o vsakdanji uporabi umetne inteligence v biologiji in medicini.

Jezikovni modeli so si sposobni zapomniti vprašanja in vnose, ki jih uporabnik poda. Predstavljajte si, da je nekdo zaposlen v nekem velikem podjetju in uporablja splošni jezikovni model, ki ga je izdelalo neko drugo podjetje, da bi si pomagal pri vsakdanjem delu. S tem pa lahko nevede razkrije določene poslovne skrivnosti

Marinka Žitnik

Tukaj torej govorite o ChatGpt, zdaj poznamo že mnogo zmogljivejši Gpt4, pa tudi druge modele. Poleti se je podjetje Google pohvalilo s svojim, specifično za medicino razvitim modelom Med-PaLM 2, ki je dosegel 92,6 % točnost v odgovorih s področja medicine in torej tako rekoč samo za malenkost zaostajal za zdravniki. Zdi se, da smo res prestopili na neko novo področje, kjer se je kljub določenim pomanjkljivostim in pastem zgodil pomemben preskok. Kakšen je vaš pogled?
Naj nekoliko podrobneje razložim kontekst. Chatgpt je le eden izmed modelov; mogoče je najbolj popularen v splošni javnosti - predvsem zato, ker je tudi njegova uporaba, razširjenost zelo hitro rasla.

In prosto je dostopen.
Tako je. Obstaja pa še veliko drugih modelov. Google ima model Bard in potem različico tega modela za medicinske probleme, ki se imenuje Med-PaLM. Pred nekaj tedni so naznanili še multimodalni Med-PaLM, ki v bistvu omogoča, da se posameznik lahko v naravnem jeziku pogovarja s tem modelom, lahko pa z njim tudi deli slike, fotografije, posnetke, različne vrste podatkov, ki jih je model sposoben analizirati sočasno, da je odgovor čim bolj točen. To, česar ste se dotaknili, je vprašanje, kako oceniti zmogljivost teh modelov, in tukaj smo še v zelo začetni fazi razvoja.

Eden izmed pomembnih pristopov za ocenjevanje teh modelov na področju medicine v Ameriki je bil tak: raziskovalci so vzeli kar seznam izpitnih vprašanj, na katera morajo zdravniki odgovarjati v okviru svojega študija, in potem tudi inačice vprašanj za različne specializacije, ki so v bistvu del strokovnega izpita, ki ga morajo opraviti ljudje, da postanejo zdravniki, da lahko opravljajo zdravniško delo. Raziskovalci so vzeli ta vprašanja in v bistvu rekli: kaj pa če ta vprašanja uporabimo kar za model in model Med-PaLM vprašamo, če lahko odgovori na ta vprašanja, na katera bi zdravniki tudi morali znati odgovoriti. In res je ta točnost presenetljivo visoka; več kot 90 % je točnost odgovorov, ki jih vrnejo ti jezikovni modeli na vprašanja, ki so del strokovnih izpitov za področje medicine. To pa kljub temu še ne pomeni, da so ti modeli vselej tako dobri kot zdravniki in tu se zastavlja veliko dodatnih vprašanj.

Kje so torej ključne razlike med zdravnikom in računalniškim modelom?
Ključna težava je v tem, da trenutni modeli v splošnem nimajo, kako bi rekla, zdrave pameti oziroma nekega splošnega razumevanja situacije. So zelo dobri specialisti. Zelo dobro in globoko lahko poznajo neko ozko področje delovanja, neka splošna razgledanost in splošna zdrava pamet pa je za te modele težka. To je eno izmed takih težavnih področij, kjer se izkaže, da je v bistvu zelo težko model umetne inteligence naučiti tisto, kar se zdi ljudem skoraj samoumevno. Ker smo ljudje v realnem svetu v stiku z drugimi ljudmi, z napravami, z orodji in imamo občutek, kako v bistvu neka taka naivna fizika deluje. Že pogled na človeka nam, denimo, lahko razkrije veliko o zdravju tega človeka in in te zdrave pameti modeli nimajo.

Druga velika težava teh modelov so t. i. halucinacije. Halucinacija je izraz, ki se uporablja za primere, ko jezikovni model vrne odgovor, ki je na videz zelo prepričljiv, videti je zelo kredibilno, vendar je popolnoma napačen. To je trenutno eden izmed ključnih razlogov, zakaj je jezikovne modele težko direktno oziroma zelo hitro uporabljati v rutinski praksi. Ker zelo pogosto vrnejo odgovor, za katerega potem celo strokovnjaki na področju včasih težko prepoznajo, da ta odgovor pravzaprav sploh ni mogoč. Recimo: jezikovni model halucinira določene znanstvene raziskave in jih navaja, kot da obstajajo. To počne na zelo kredibilen, prepričljiv način, ko pa človek pogleda te znanstvene raziskave, jih pravzaprav sploh ni, ker je model to 'haluciniral'. Veliko se dela na raziskavah, kako velike jezikovne modele prepričati, da bodo manj halucinirali, tako da jih bolje uvedemo in jim vgradimo znanje, ki je trenutno že dostopno v biologiji, medicini, da se ne bodo pogosto izmišljevali oziroma halucinirali.

Lahko ponudim še en primer, zakaj ti modeli še vedno ne morejo nadomestiti zdravnika. Pred kratkim sem govorila s kolegom, ki mi je dal zanimivo analogijo. Recimo, da se želimo naučiti se voziti avto. Torej se vpišemo na kakšen tečaj, preberemo kakšno knjigo, gradivo in potem gremo na test, na katerem dobimo cel kup vprašanj, na katera je seveda treba znati odgovoriti. Zdaj, ko vozimo, vozi posameznik in vozi avto. Avto je orodje, ki nam pomaga, da se pripeljemo iz točke A v B. Da se avto sploh lahko vozi po cesti, je tudi šel čez kup varnostnih testov, ki so bili povsem drugačni od testov, ki jih je opravil človeški voznik. Prestavimo zdaj to situacijo v medicino. Testi, ki se uporabljajo za ocenjevanje človeških zdravnikov, verjetno niso najboljši testi za ocenjevanje zmogljivosti jezikovnih modelov, tako kot testi, ki se uporabljajo za ocenjevanje človeških voznikov avtomobila, niso primerni za ocenjevanje tega, ali je avtomobil varen, da lahko vozi po cesti in zadovoljuje vse regulacijske omejitve, ki jih neka država postavlja. Velik del raziskovalne skupnosti se zdaj ukvarja z razvojem tehnik in testov, s katerimi bi lahko bolje razumeli, v katerih situacijah ti modeli dobro delujejo in so zaupanja vredni, in v katerih še niso dovolj zmogljivi ali pa v bistvu njihova uporaba ni zaželena. Trenutne raziskave kažejo, da gremo bolj v smer sodelovanja med umetno inteligenco in človeškimi strokovnjaki. Vsaj na začetku, v tej zgodnji fazi se predvideva, da se bodo jezikovni modeli uporabljali predvsem za operativne logistične naloge in vprašanja v medicini.

Generativni modeli, ki smo jim priča v zadnjem letu in pol, so modeli, ki so zares sposobni generirati kompleksne objekte: celotno sliko ali pa mogoče celo filmček. Zelo pomembna je uporaba teh modelov na področju odkrivanja novih zdravil, s čimer se tudi moja skupina veliko ukvarja, kjer ne generiramo slike, ampak generiramo molekulo, za katero je bolj verjetno, da postane zdravilo ali pa ima določene pomembne učinke.

Marinka Žitnik

Kot na primer?
Recimo za pripravo urnikov za naročanje pacientov glede na čas, ko se operacija lahko izvede, ali pa avtomatično knjiženje, beleženje pogovorov med zdravnikom in pacientom, zato da se prihrani čas zdravniku, ali pa da se pomaga pri izpolnjevanju določenih obrazcev oziroma formularjev medicinskim sestram, ali pa da se skrbi, da je ves material, oprema za določen medicinski poseg primerno očiščena, pripravljena, naročena za danega pacienta. To so tako imenovana logistično operativna vprašanja, ki so težka, ampak niso nujno povezana s tem, da bo odločitev modela nujno vplivala na življenje ali smrt posameznika. Vprašanja diagnoze, vprašanja priporočanja terapij in zdravljenja pa so vprašanja, kjer napoved modela, če je direktno sprejeta in se gre v neko akcijo, lahko pač bistveno vplivajo tudi na življenje posameznika, življenje pacienta. Zato moramo biti tam res prepričani, da so v takih primerih napovedi modelov, odgovori, ki jih generirajo, točni in jim lahko zaupamo.

Se za tovrstne rabe ti modeli že uporabljajo tudi v praksi, recimo v bolnišnicah v ZDA in drugod po svetu?
Ja, v ZDA trenutno poteka ogromno število pilotnih projektov, kjer se ta rutinska uporaba prav zdaj uveljavlja. Poglejte, na primer, podjetje Epic. Epic je v Ameriki največji ponudnik elektronskih zdravstvenih kartonov. To podjetje je že desetletja pokrivalo približno 30 % vseh bolnišnic in zdravstvenih ustanov v ZDA ter nudilo digitalizacijo zdravstvenih kartonov in druge storitve, ki sodijo zraven. Ker so že vključeni, ker so že del zdravstvenih sistemov, je za njih bistveno lažje, da kot dodatno zmogljivost, dodatno aplikacijo ponudijo jezikovne modele, in to so že začeli ponujati v kar nekaj bolnišnicah, ki so povezane s Harvardom. Trenutno potekajo aktivni piloti ocenjevanja teh zmogljivosti. Kaj zdaj to pomeni – aktivni pilot? Aktivni pilot pomeni, da imate dve čim bolj podobni ambulanti, podobni v smislu števila in vrste pacientov, ki jih sprejmejo, pri čemer ena ambulanta posluje na klasičen način, druga ambulanta pa uporablja zdravstveni karton z dodano zmogljivostjo jezikovnega modela. Pri tem se beleži, kako učinkovito je delo zdravnika, ali lahko morda zdravnik z uporabo jezikovnega modela več časa posveti pacientu, ali so določene odločitve boljše sprejete, kot če tega modela ne bi bilo? Eksperiment teče nekaj tednov in nato se primerjajo rezultati obeh ambulant glede zadovoljstva zaposlenih, zadovoljstva pacientov s storitvami in tudi končnega zdravstvenega učinka pri teh pacientih. Trenutno so ti piloti vsaj na Harvadu precej pogosti, kjer se razne primere uporabe jezikovnih modelov zdaj že resno ocenjuje, uvaja v vsakdanjo medicinsko prakso.

Torej bi se moglo v prvi fazi odstraniti t. i. nadležno birokracijo, ki vsem samo krade čas – tako nekako?
To je prvi cilj, prva stopnja, da bi nekako poskušali čim bolj razbremeniti in sprostiti zdravstveno osebje, da se lahko bolj posveti pacientom in zapravi manj časa z birokracijo. Tako je.

Izpostavili ste že t. i. halucinacije, izmišljije, ki jih znajo ti veliki jezikovni modeli dobro in prepričljivo tvoriti, da jih je celo strokovnjakom težko zaznati. Vendar pa bi glede na sorazmerno visoko zanesljivost teh odgovorov pomislili, da bi nekega dne takšni modeli le utegnili biti alternativa danes uveljavljenemu brskanju po spletu za razlagami raznih simptomov, ki nas skrbijo. Tam navsezadnje tudi lahko naletimo na zelo problematične odgovore in recepte.
Ja, to je super vprašanje. V mojih raziskavah - in tudi širše - se zdaj ukvarjamo tudi s problemom, kako bi lahko jezikovne modele uporabili tudi za preventivno medicino in pa za t. i. obrnjeno kliniko. Trenutno poteka obravnava tako, da ljudje, ki imajo neke nezaželene simptome oziroma se slabo počutijo, gredo v zdravstveni sistem, na kliniko ali v bolnišnico. Obrnjen sistem bi bil tak, da je človek pač doma oziroma v svojem naravnem okolju in potem lahko prek množice različnih senzorjev ali pa aplikacij hitreje prepozna, da se morda zdravje obrača v nezaželeno smer. Potem bi lahko posameznika opozorili, mu predlagali, naj gre k določenemu specialistu, ali pa mu predlagali, naj spremeni način življenja ali prehrambne navade, vključi vadbo in druge vidike. Bi rekla, da je tukaj veliko priložnosti za jezikovne modele v tej splošni uporabi, kjer končni uporabnik jezikovnega modela ni nujno zdravnik, ni nujno zdravstveni sistem, ampak posameznik, človek v svojem »naravnem« okolju. To je zelo zanimiv vidik, kjer je uporabnik v bistvu potrošnik. Že zdaj obstaja množica aplikacij, ki so povezane z zdravjem, z dobrim, boljšim življenjem, z boljšo kakovostjo življenja, ki lahko posamezniku neposredno pomagajo, ne da se vplete zdravstveni sistem. Se mi zdi, da je to zelo obetaven primer uporabe predvsem za preventivno medicino in pa za splošno kvaliteto življenja, tako da se veliko tudi o tem razmišlja.

Testi, ki se uporabljajo za ocenjevanje človeških zdravnikov, verjetno niso najboljši za ocenjevanje zmogljivosti jezikovnih modelov, tako kot testi, ki se uporabljajo za ocenjevanje človeških voznikov avtomobila, niso primerni za ocenjevanje tega, ali je avtomobil varen, da lahko vozi po cesti.

Marinka Žitnik

Tu se zastavi vprašanje, kako je z varnostjo teh podatkov, kaj se modeli lahko potencialno lahko naučijo na teh podatkih? Vidiki, kot je naše zdravstveno stanje, lahko vplivajo na cel spekter dejavnikov: kako uspešni bomo, na primer, pri iskanju nove službe ali kakšna bo višina zavarovalne vsote, sploh v ZDA, pa tudi sicer. Skratka, veliko je prednosti, vsekakor pa se odpirajo tudi možne težave.
Ja, veliko sva že rekli o priložnostih, ki jih ti jezikovni modeli odpirajo. Ti jezikovni modeli sodijo na področje generativne umetne inteligence in ta tip umetne inteligence prinaša svoje izzive in tveganja. Določeni izzivi in tveganja so prisotni že vrsto let, vse odkar kar se uporablja umetna inteligenca. Pojavili pa so se tudi dodatni izzivi in tveganja. Halucinacije oziroma izmišljotine so eden izmed primerov, ki danes omejujejo splošno, rutinsko uporabo jezikovnih modelov na nekih ključnih področjih, kot sta denimo biologija in medicina.

Drug pomemben vidik, ki se neposredno dotika ne le medicine, ampak tudi uporabe jezikovnih modelov v drugih poljih, v poslu in industriji na primer, je zagotovo zasebnost in varnost podatkov. Ti jezikovni modeli so si namreč sposobni zapomniti vprašanja in vnose, ki jih uporabnik poda. Predstavljajte si, da je nekdo zaposlen v nekem velikem podjetju in uporablja splošni jezikovni model, ki ga je izdelalo neko drugo podjetje, da bi si pomagal pri vsakdanjem delu. S tem pa lahko nevede razkrije določene poslovne skrivnosti, kar seveda predstavlja veliko težavo. Na področju medicine bi lahko zdravnik ali zdravstveno osebje nehote razkrilo osebne informacije pacientov s tem, ko bi se zanašali na jezikovni model, ki ga je razvil nekdo drug zunaj tega zdravstvenega sistema. Zasebnost, varnost podatkov je veliko vprašanje in je eden izmed razlogov, zakaj se za kritična področja uporabe razvijajo posebne specializacije jezikovnih modelov. Na primer na področju financ je Bloomberg v Ameriki razvil svojo vrsto Gpt modela, ki mu reče Bloomberg Gpt. Veliko zdravstvenih sistemov tudi razvija svoje inačice jezikovnih modelov, ki potem delujejo le znotraj tega zdravstvenega sistema, saj na ta način omejujejo oziroma preprečujejo, da bi se informacije zasebne narave pacientov nehote razkrile. To vprašanje zasebnosti in varnostnih podatkov je bolj kritično v primeru velikih jezikovnih modelov kot pri drugi, standardni umetni inteligenci, predvsem ker si ti modeli lahko zapomnijo povsem neposredno, kaj so bili vprašani, kaj so odgovorili in potem lahko kasneje nekdo te podatke prebere oziroma izlušči iz jezikovnega modela. To pa seveda lahko potegne za seboj veliko nezaželenih posledic.

Še en tak primer, trenutno precej pomemben problem se nanaša na avtorske pravice. Vprašanje avtorskih pravic je mogoče manj kritično za področje medicine, je pa izredno pomembno za področje kreativnih znanosti oziroma kreativnih ved. Gre pa za vprašanje, kako jezikovne modele sploh razvijamo. Veliko sva govorili o uporabi, ampak kako jih sploh zgradimo? Zgradimo jih tako, da se mora zbrati ogromno, ogromno količino podatkov, čim bolj kakovostnih, na katerih se ti modeli učijo. Učijo se tako, da vidijo neko zaporedje besed in potem poskušajo uganiti, katera je naslednja beseda, ki bo temu zaporedju besed sledila, t. i. autocomplete. Da se to lahko naučijo, je dobro imeti zelo veliko kakovostnega besedila. Trenutno v Ameriki poteka nekaj 10 velikih tožb, v katerih umetniki, pisatelji, kulturniki in njihova združenja tožijo večja podjetja, ki razvijajo velike jezikovne modele, ker so se za učenje modelov uporabila literarna besedila, katerih avtorji tem podjetjem za kaj takega sploh niso dali dovoljenja. To je problem avtorskih pravic, ki je v okviru trenutne zakonodaje težko rešljiv.

Potem pa so tukaj še vprašanja, ko lahko ti generativni modeli generirajo slike, posnetke ali pa glasovne posnetke, ki so ponaredki, t. i. deep fakes. Model lahko generira sliko, ki je videti kot slika v slogu nekega znanega umetnika, ta umetnik pa seveda ni neposredno sodeloval pri ustvarjanju slike oziroma dela, ki ga je generiral veliki jezikovni model. Spet se zastavlja vprašanje, kdo je lastnik tega dela, kako je možno, da se je nek slog umetnika prenesel na jezikovni model, če se umetnik s tem ne strinja. Vprašanje avtorskih pravic je vsekakor zelo pomembno, trenutno še ni rešeno, je pa res, da številni zelo podrobno spremljamo, kaj se dogaja s tožbami in kakšen bo rezultat teh tožb v naslednjih nekaj mesecih. Odločitve sodnikov bi namreč lahko imele pomembne posledice za uporabo velikih modelov na področjih umetnosti, oblikovanja besedil, oblikovanja slik, fotografij, glasovnih posnetkov, videoposnetkov in takih reči.

Ta generativni vidik se pogosto pokaže v prav osupljivih stvaritvah; kadar zastavimo kakšno zelo kompleksno vprašanje s specifičnega področja ali pa si zaželimo neko fotografijo, ki je lahko izredno realistična, so rezultati lahko zelo presenetljivi. Seveda je treba z umetno inteligenco sodelovati in ji dajati prava navodila, prave pozive, ampak vendarle. Kako gledate na to, pogojno rečeno, kreativnost velikih jezikovnih modelov, da, čeprav pač naučeni na podatkih in posnemajoč "zgolj" videne vzorce, lahko navsezadnje vendarle zelo kreativno zapolnijo praznino – in včasih si tudi kaj zelo prepričljivo izmislijo? Zdi se, da smo se tukaj srečali z nekakšnim preskokom, saj smo še nedavno domnevali, da smo česa takega zmožni samo ljudje, zdaj pa se zdi, da so stvari drugačne.
Ja, veliko je vprašanj in pa diskusij na temo Turingovih testov oziroma različic Turingovega testa. Turingov test naj bi opravil algoritem umetne inteligence, če človek ne more razločiti, kdo je sogovornik na drugi strani: človek ali algoritem. Zagotovo je res, tako kot ste rekli, da je ta preskok v zmogljivosti modelov res impresiven. To deloma izhaja iz generativne umetne inteligence. Kaj s tem mislim? V zadnjih 10 letih smo se v raziskavah predvsem ukvarjali z graditvijo napovednih modelov. To pomeni, da smo zgradili model, ki je kot izhod, kot rezultat vrnil samo eno napoved, običajno neko številko med nič in ena, kjer je večja številka pomenila, da je model bolj prepričan v svojo napoved. To so, skratka, t. i. napovedni modeli oziroma modeli nadzorovanega učenja, ki ne generirajo novih objektov, novih molekul, novih slik ali besedil, ampak samo gradijo enostavno napoved. Generativni modeli, ki smo jim priča v zadnjem letu in pol, pa so modeli, ki so zares sposobni generirati kompleksne objekte: celotno sliko ali pa mogoče celo filmček. Zelo pomembna je uporaba teh modelov na področju odkrivanja novih zdravil, s čimer se tudi moja skupina veliko ukvarja, kjer ne generiramo slike, ampak generiramo molekulo, za katero je bolj verjetno, da postane zdravilo ali pa ima določene pomembne učinke. To kar nenadoma pomeni, da je izhod teh modelov zelo kompleksen.

Zakaj so ti modeli tega zmožni? Treba je zgraditi izredno, izredno velike modele. Kaj to pomeni? Modeli, s katerimi trenutno delamo, so modeli, ki imajo po več deset milijard parametrov. Lahko si predstavljate vsak parameter kot neke vrste ventil, ki ga lahko uravnavamo. Ti veliki modeli imajo na desetine milijard parametrov, ki jih je treba med procesom učenja modela pravilno nastaviti. To je ogromno število parametrov v primerjavi z modeli, ki smo jih uporabljali v zadnjem desetletju, kjer so modeli imeli običajno tisoč, milijon, nekaj milijonov, nekaj 10 milijonov ali celo nekaj 100 milijonov parametrov, no, zdaj imamo pa kar nenadoma nekaj 10 milijard parametrov, ki jih ti modeli imajo. In imajo ogromno možnosti, da si zapomnijo stvari in potem te vzorce na nelinearen, nepredvidljiv način kombinirajo. Tako da se mi zdi, da se zdaj tudi oživlja področje med nevroznanostjo in umetno inteligenco in zastavljajo se zanimiva vprašanja: kako velike modele bomo morali dejansko zgraditi v prihodnosti, da bodo ti jezikovni modeli še bolj zmogljivi; kaj lahko pričakujemo od njih, ko bodo rasli še prek nadaljnjih meja, ko bodo postali še večji, kot so modeli Gpt, ki jih imamo danes. Veliko neznanega je tukaj, ampak to so zelo zanimiva vprašanja.

Foto: Radio Slovenija/Nina Slaček
Foto: Radio Slovenija/Nina Slaček

Kot ste pravzaprav že dobro nakazali med pogovorom, je pomembno vprašanje na vašem področju danes, kako zgraditi modele, ki bi dejansko imeli pravo znanje in ga znali na dober način uporabiti tam, kjer ga potrebujemo. Ti modeli, ki jih zdaj najbolj poznamo, so pravzaprav naučeni iz vsega, kar je bilo dostopno njihovim ustvarjalcem na spletu. Nekaj drugega pa je, ko recimo želite imeti model, ki resnično obvlada medicino, pozna vse bolezni, vsa možna zdravila. Kako zahtevno je takšno prelivanje konkretnega znanja? Kako integrirati vse znanje, ki obstaja o vseh možnih molekulah, njihovih interakcijah, znanih bioloških mehanizmih v model, ki bi res lahko generiral nova spoznanja glede tega, kaj so najučinkovitejša nova zdravila, kaj se pravzaprav v telesu dogaja pri tej ali oni bolezni, zlasti ko gre za bolezni, ki jih še ne poznamo dobro?
Ja, res, v moji skupini nas še posebej zanima graditev jezikovnih modelov za probleme s področja razvoja novih zdravil, s področja medicine in v ta namen moramo modele naučiti ne le s podatki, ki jih najdemo na spletu, ampak tudi z znanstvenimi podatki, s podatki, ki jih je področje znanosti zbiralo desetletja ali pa stoletja in so nam na voljo v digitalni obliki. Prvi pomemben korak k razvoju modelov za ta področja znanosti in medicine je, da moramo zbrati velike količine podatkov v računalniku razumljivi obliki. To pomeni, da smo veliko dela opravili v skupini in tudi širši raziskovalni skupnosti, da smo zbrali podatke o vseh trenutnih zdravilih, ki so odobrena na ameriškem in evropskem trgu, o vseh kemikalijah, ki še niso zdravila, ampak so v katerikoli fazi predkliničnih ali kliničnih raziskav, in tudi o sto tisočih molekul, ki so jih kemiki in biokemiki sposobni sintetizirati v laboratoriju in za katere še ni jasno, če morda imajo kakšno zanimivo uporabo bodisi kot zdravilo, bodisi kot novi materiali, bodisi za agrikulturo in tako naprej.

Zdaj, ko imamo zbrano to veliko množico podatkov, moramo razmisliti, kako lahko z njimi učimo jezikovne modele. In kaj je tu bistveni problem? Veliki jezikovni modeli so bili, kot razkriva samo ime, prvotno razviti za jezik, za naravni jezik, prvotno za angleščino, čeprav ti modeli zdaj podpirajo na stotine jezikov. In dobro delujejo, kadar imamo podatke, ki so zaporedja nekih besed oziroma žetonov. Te besede so bile prvotno besede naravnega jezika. Podatki o znanosti, medicini niso nujno taki.

Eno izmed ključnih spoznanj je, da lahko tudi na področju biologije na zaporedja nukleotidov ali pa aminokislin na genomu, aminokislin v proteinih gledamo kot na neke vrste besedilo. Le da tu jezik ni podan s slovarjem angleških ali slovenskih besed, ampak je jezik zaporedje teh osnovnih elementov življenja, aminokislin ali pa nukleotidov. Pravzaprav gradimo velike jezikovne modele, ki pa ne temeljijo na naravnem jeziku, ampak na jeziku biologije, na jeziku življenja. In to je zelo zanimivo zato, ker ko take modele zgradimo, lahko kar nenadoma vprašamo model, ali nam lahko zgradi neko zaporedje aminokislin, ki bi predstavljalo peptid oziroma protein, ki bi imel določene lastnosti, ki si jih želimo, da se pozdravi bolezen. Model generira take sekvence, taka zaporedja aminokislin, ki se potem lahko direktno prevedejo v laboratorijske raziskave.

Testi, ki se uporabljajo za ocenjevanje človeških zdravnikov, verjetno niso najboljši za ocenjevanje zmogljivosti jezikovnih modelov, tako kot testi, ki se uporabljajo za ocenjevanje človeških voznikov avtomobila, niso primerni za ocenjevanje tega, ali je avtomobil varen, da lahko vozi po cesti.

Marinka Žitnik

V enem izmed projektov, ki jih imam trenutno v svojem laboratoriju, skupaj s sodelavci, kemiki z MIT, delamo na tako imenovanem avtonomnem laboratoriju oziroma popolnoma avtomatiziranem laboratoriju, kjer moja skupina razvija jezikovne modele, ki so naučeni na zaporedju aminokislin za približno 200 tisoč proteinov. Potem pa lahko modelu, ko je ta naučen, naročimo, da generira nova zaporedja aminokislin. Sodelavci, ki so biokemiki, so zgradili tak printer kemikalij, tako da lahko ta zaporedja, ki jih generativna umetna inteligenca tukaj proizvede, takoj prevedejo v svoj printer, kjer dejansko kemikalijo natisnejo oziroma jo proizvedejo v fizični obliki. Tako nenadoma nimamo več opravka samo z nekakšnim virtualnim zapisom oziroma izhodom jezikovnega modela, ampak je pred nami dejansko kemikalija. To je zelo zanimivo, saj tak pristop omogoča, da določene procese v znanosti bistveno pospešimo, jih naredimo bolj rutinske, tako da se potem človeški znanstveniki bolj ukvarjajo z vprašanjem upravljanja algoritmov umetne inteligence, pozivanja algoritmov umetne inteligence, gradnje teh algoritmov in pa z integracijo s fizično laboratorijsko opremo, z znanstveno opremo. Na tak način se lahko bistveno hitreje gradijo hipoteze, se testirajo te hipoteze v obliki kemikalij, da se najdejo tiste, ki imajo najbolj želene, dobre učinke za nadaljnje delo, če je to proizvodnja novega zdravila na primer.

Se pravi, bodo ti konkretni modeli neposredno spremenili tudi pomemben del znanstvenega dela, postopkov, načinov? Zanimiva mi je tudi poanta o razumevanju zaporedja aminokislin, zgradbe DNK kot neke vrste jezika. Saj pogosto rečemo, da gre za kodo življenja in tako naprej, ampak da se dejansko spojine pojmuje kot jezik, kot nekaj, kar lahko tvori, v narekovajih rečeno, svoje biološke stavke. Zdi se mi, da gre za zelo zanimiv vpliv neke nove tehnologije na to, kako razumemo nekaj, kar pravzaprav v biologiji, medicini poznamo že dolgo, zdaj pa nenadoma gledamo na aminokisline kot na besede, ki imajo lahko v različnih stavkih popolnoma različno funkcijo, pomen, implikacije.
Točno tako, imate popolnoma prav. Eno izmed zares izredno zanimivih področij uporabe velikih jezikovnih modelov je njihova uporaba na podatkih ali pa na problemih, ki niso nujno problemi naravnega jezika. V biologiji je izredno zanimiv ta problem oziroma priložnost uporabe jezikovnih modelov na kodi življenja, na zaporedju aminokislin, na zaporedju nukleotidov, če delamo v genomu. Prvi rezultati kažejo, da je možno na povsem nenadzorovan način, ne da bi algoritmu povedali vnaprej, kakšne so lastnosti posameznih kemikalij ali pa vzorci, ki nakazujejo določeno bolezensko stanje ali ki nakazujejo določen biološki proces, da algoritem najde vzorce povsem sam, če se uči na ogromni količini podatkov. Zdi se mi, da je tu veliko stvari sovpadlo. Na eni strani je znanost, predvsem ameriška znanost, v zadnjih dveh desetletjih investirala ogromne količine denarja v generiranje bioloških sekvenc; pomislite samo na projekt Človeški genom leta 2003. V zadnjih 20 letih se je ustvarila ogromna količina podatkov v obliki bioloških zaporedij nukleotidov in ti podatki so dostopni raziskovalcem, imamo torej ogromne količine podatkov v digitalni obliki. Na drugi strani so algoritmi umetne inteligence napredovali do nivoja, ko lahko človek, ki dela na tem področju, prepozna, da se lahko idejo jezika interpretira na različne načine, da to ni nujno le naravni jezik, in to odpira ogromno novih priložnosti, ki so posledica te algoritmične zmogljivosti. In tretji primer je tudi na področju strojne opreme, zlasti grafičnih kartic. Strojna oprema je napredovala do te mere, da je te velike modele mogoče naučiti na ogromnih podatkih razmeroma hitro.

Tako da smo res v nekem takem trenutku, ki je za znanost precej pomemben, ker je prišlo do razvoja tehnologije, ki ima prelomno vrednost za znanost. Zakaj je to pomembno? Moja skupina vodi mednarodni konzorcij za študij umetne inteligence za področje znanosti, kjer se ukvarjamo z vprašanji, kako lahko nove tehnologije bistveno spremenijo način delovanja znanosti. Kaj s tem mislim? Že od 17. stoletja znanost usmerja znanstvena metoda, ki vodi vse znanstvene discipline; gre za oblikovanje hipoteze, testiranja hipoteze z eksperimenti v laboratoriju, z zbiranjem podatkov na terenu in potem, ko se hipoteza testira, lahko nekdo opravi eksperimente in izlušči ugotovitve ter potem ponovi ta proces znanstvene metode. Čeprav so biologija, kemija, fizika, matematika zelo različne vede, je ta osnovni princip znanstvene metode, ki izhaja iz 17. stoletja, še vedno temeljni princip oziroma vodilo, kako prakticirati znanost. Zdi se mi, da lahko na umetno inteligenco gledamo kot na novo tehnologijo, ki lahko spremeni, pospeši, izboljša vidike te znanstvene metode.

To ni nekaj, kar se je zgodilo prvič. V zgodovini smo bili že priča tovrstnim znanstveno-tehnološkim preskokom, ko je bil, denimo, izumljen mikroskop, ali pa v 60. letih, ko se je razširila uporaba kliničnih raziskav. To so bile nove tehnologije, ki so jih potem uvedli v znanost in so jo spremenile. Tako zdaj v tem konzorciju, ki ga vodim, sodelujemo s filozofi znanosti oziroma z raziskovalci, ki študirajo zgodovino znanosti, in razmišljamo o tem, kako lahko zdaj umetna inteligenca kot nova tehnologija današnje dobe v splošnem spremeni, pospeši, izboljša znanstveno metodo. Ta vprašanja pa ne zadevajo le enega področja, na primer biologije ali medicine, ampak vse vede, ki znanstveno metodo uporabljajo. Zelo zanimivo je, kako o podobnih problemih, o podobnih algoritmih razmišljajo biolog, kemik, fizik, čeprav se ukvarjajo s povsem različnimi vprašanji. Prav zato, ker so algoritmi umetne inteligence razviti splošno in niso vnaprej omejeni na nek konkreten primer uporabe, se lahko uporabijo v različnih vedah. Tudi problemi, ki iz njih izhajajo, in izzivi so potem taki, da ko jih rešimo, lahko v bistvu rešimo veliko problemov na zelo različnih področjih. Zdi se mi, da smo v nekem takem posebnem trenutku za znanost, za znanstvene raziskave v splošnem, kjer lahko zdaj nova orodja, ki jih imamo, znanost naredijo, upamo, še bolj učinkovito. Ta orodja nam odpirajo priložnosti, ki prej niso bile mogoče, za študij procesov, ki se odvijajo na tako majhni časovni skali, da jih ne bi mogli meriti ali opazovati na klasičen način, s klasičnimi, tradicionalnimi znanstvenimi metodami. Zdaj pa to z umetno inteligenco lahko počnemo. Veliko zanimivih vprašanj je tukaj za naslednja leta.

Znanost, znanstvene metode so tudi ključni način, kako od 17. stoletja naprej skušamo racionalno, znanstveno razumeti svet, ga pojasniti in na teh osnovah graditi cel spekter stvari, ki tvorijo našo civilizacijo. Zdi se, da se tukaj na nek način tudi nekaj bolj temeljnega spreminja v načinu, kaj sploh zmoremo razumeti in kaj so naše temeljne predpostavke, če pač upoštevamo to zmožnost modelov, da v nekem kontekstu, kjer nimamo konkretnih eksperimentalnih podatkov, vendarle pridejo do rezultatov, ki so lahko osupljivo uporabni in točni. Zdi se mi, skratka, da se veliko stvari spreminja v osnovnem načinu, kako bomo v prihodnje spoznavali svet, človeka, delovanje marsičesa ...
Ja, vsekakor. Veliko je priložnosti tukaj, od uporabe generativne umetne inteligence za izdelavo tako imenovanih digitalnih dvojčkov, ki bi omogočali, da lahko z modeli izvajamo določene simulacije, ki so bistveno hitrejše kot pa eksperimenti v laboratoriju. Pri razvoju zdravil, na primer, pa lahko z algoritmi umetne inteligence bistveno hitreje najdemo, katere so tiste hipoteze, ki so najbolj obetavne. Da ponazorim: število kemikalij, tako imenovanih majhnih molekul, ki lahko obstajajo v vesolju, je 10 na 60, predstavljajte si 1 in 60 ničel. To je tako gromozansko astronomska številka, da je nemogoče, da bi lahko kadarkoli šli od ene do druge spojine in vsako testirali v laboratoriju, preverili, ali se dobro obnese oziroma ima določene lastnosti, zaradi katerih bi bila obetavna za zdravilo, za nov material, mogoče za kakšno drugo uporabo. To enostavno ni mogoče. Algoritmi umetne inteligence pa so sposobni ta velik prostor hipotez preiskati hitreje in najti tiste žepe oziroma regije, področja teh hipotez oziroma množice kemikalij, za katere je bolj verjetno, da imajo določene zaželene lastnosti. V tem smislu vodijo, usmerjajo delo raziskovalcev, lahko pa tudi vodijo, usmerjajo določene eksperimente.

Naslednji pomemben primer uporabe, ki ga vidim v prihodnosti, je ideja neke vrste kopilota. Ko znanstvenik dela v laboratoriju in razmišlja o problemu, ki ga rešuje, jezikovni model oziroma nek algoritem umetne inteligence deluje kot njegov kopilot. Pomaga mu pri graditvi idej, pomaga mu s tem, da predlaga ideje, ki izhajajo iz objavljene literature. Žal ni nobenega človeškega znanstvenika, ki bi lahko prebral vso znanstveno literaturo z vseh področij od začetka naših časov, medtem ko ti algoritmi lahko preberejo in si zapomnijo vso znanstveno literaturo, ki je bila kadarkoli objavljena na katerem koli področju. Predstavljajte si, da imate potem takega, zelo močnega kopilota, pomočnika, ki lahko z znanstvenikom kreše ideje, ki lahko mogoče, ko znanstvenik postavi neko hipotezo, najde, katere so obstoječe raziskave, ki kažejo, da ta hipoteza najbrž ne bo uspešna ali pa, ravno nasprotno, da bo zelo uspešna. Taki pomočniki bi lahko pomagali pri razvoju novih hipotez, novih idej, predvsem ko gre za ideje, ki so nepredvidljive, ki jih človek nemara ne bi našel na enostaven način, ki mogoče zahtevajo poznavanje več disciplin hkrati. Tukaj smo danes zagotovo omejeni, ker pač kratko malo ni mogoče, da bi nekdo bil vrhunski strokovnjak na več področjih ali znanostih, medtem ko ti algoritmi lahko vsaj poznajo literaturo z več področij znanosti. Tako da je veliko priložnosti, se mi zdi, za znanost na vseh segmentih, v vseh korakih znanstvene metode, o katerih sva prej govorili. Na ta način se lahko znanost kot temelj razvoja človeštva v nekem smislu še pospeši in to lahko prinese veliko dobrega.

Razvijamo algoritme umetne inteligence, ki lahko priporočajo terapije, zdravljenje za področje, ki obsega vse do zdaj znane človeške bolezni, vključno z redkimi boleznimi, ki jih je več kot 7 tisoč.

Marinka Žitnik

Bomo ljudje sploh še kos tem modelom, ki bodo imeli znanja z vseh področij in jih bodo nekega dne nemara znali plodno integrirati v hipoteze, v možno pot raziskav? Kje, skratka, človek v tem novem kontekstu najde svoje mesto za kreativno, ustvarjalno življenje, ki ga nujno potrebujemo?
Trenutni modeli so taki, da so zmogljivi na način, ki ne ogroža znanstvenikov, predvsem so lahko izredno dobri pomočniki pri njihovem znanstvenem delu. Mogoče na dolgi rok, se mi zdi, da bodo ti pomočniki postali vse bolj zmogljivi, kar je odlično, da se rutinska dela v znanosti, pri laboratorijskih raziskavah lahko delno avtomatizira, tako da se znanstveniki lahko bolj osredotočijo na vprašanja, ki so pomembna za družbo, za človeštvo. Da se lahko bolj osredotočijo na upravljanje umetne inteligence, njeno nadzorovanje, na graditev pravih pozivov za te kopilote in pomočnike, ki lahko potem opravljajo določeno rutinsko delo. V temelju pa ostaja še vedno tisto vprašanje prebliskov, ki vodijo znanost, ki znanost potiskajo naprej, in ti prebliski, ko nekdo spozna, da lahko nek problem reši z neko metodo, z nekim pristopom, nekim algoritmom ali z neko napravo, so še vedno v domeni človeka in verjetno bo tako še kar nekaj časa.

Ampak tudi na drugih področjih človekovega delovanja - midve sva se osredotočili predvsem na medicino in znanost - trenutno govorimo predvsem o izboljšanju učinkovitosti. O izboljšanju partnerstva med človekom in umetno inteligenco v smislu, da lahko rutinska dela prevzamejo določeni algoritmi, ko so primerno povezani z robotiko, kjer je treba rešiti še veliko vprašanj in težav. To je tisti del, ki se meni zdi najbolj obetaven za naslednjih nekaj let.

Vsekakor se marsikaj zanimivega odpira, ampak vedno, kadar smo se kot družba srečali z neko prebojno novo tehnologijo, je ta prinesla s seboj tudi zelo daljnosežne družbene posledice. In tukaj se zdi, da je resnično ključno, kako tako močno tehnologijo pripeljati v naša življenja na nek pameten način. Sicer se zdi, da ni nujno, da bo dobro sprejeta in tudi posledice na področju delovnih mest, načina dela bodo občutne. Glede na vse, kar ste povedali, se zdi, da se bomo morali vsi več posvečati umetni inteligenci kot v preteklosti, če bomo želeli približno razumeti parametre dela in družbe.
Ja, vsekakor je tako. Pravzaprav smo že zdaj priča določenim spremembam v širši skupnosti. Kaj to pomeni na področju znanosti? V ZDA na primer uvajajo veliko novih področij študija, ki se nanašajo na uporabo umetne inteligence v določenih disciplinah. Povsem običajno je zdaj, da so predmeti s področja umetne inteligence, napredne podatkovne analize del predmetnikov za študijske programe izven področja računalništva, in to je zelo pomembno. Treba je vzgojiti nove generacije vrhunskih strokovnjakov, ki bodo sposobni načelno razumeti, kako umetna inteligenca kot tehnologija deluje in jo uporabljati na produktiven način. Poleg teh sprememb v izobraževanju so seveda pomembne tudi druge spremembe, na primer v zaposlovanju, ter spremembe, ki se nanašajo na partnerstva med univerzami, industrijo in gospodarstvom, kjer se določeni veliki jezikovni modeli razvijajo. To pomeni, da je treba veliko razmišljati o povezovanju med visokošolskimi ustanovami, univerzami, industrijo in pa drugimi deležniki ter tudi vlado na vseh nivojih, od lokalne do državne oziroma zvezne vlade. Ta nova partnerstva in spremenjeni izobraževalni sistemi pravzaprav kažejo, kako se lahko znanost kot en vidik družbe pravzaprav spreminja in zdi se mi, da bo do podobnih sprememb najverjetneje prišlo in že prihaja tudi na drugih področjih človekovega delovanja; na področju novinarstva, na področju oblikovanja besedil in pa grafičnega oblikovanja.

Zelo pomembno je, se mi zdi, da so strokovnjaki s teh področij dejavno vključeni v razvoj in uporabo naprednih tehnik umetne inteligence na svojem področju. To je bistvenega pomena. V ta namen se v ZDA oblikujejo različna združenja oziroma skupine, ki razmišljajo o tem, kako se lahko na varen način uvede ali uporablja umetno inteligenco na nekem področju, na primer v novinarstvu, na področju grafičnega oblikovanja ali na področju snemanja filmov in filmske industrije. Zdi se mi, da bi bilo dobro o takšnih ne nujno regulacijah, ampak bolj primerih dobre prakse, o priložnostih in izzivih za dano področje razmišljati tudi v Sloveniji, in to na različnih področjih.

Kajti ključno je upoštevati, da so algoritmi umetne inteligence razviti na način, da so splošno uporabni, in če so splošno uporabni, so torej uporabni na vsakem področju, kjer imamo dejansko zbrane digitalne podatke. Trenutna generacija algoritmov se namreč razvija na način, da potrebujejo za svoj razvoj in obstoj veliko količino zbranih podatkov. Če torej delujete na področjih, kjer taki podatki obstajajo, potem je velika verjetnost, da bo slej ko prej umetna inteligenca dosegla vaše področje. Zato je dobro razmisliti, kaj so priložnosti, kako se lahko umetna inteligenca na varen, primeren način uvede v vzgojo novih strokovnjakov z danega področja. Razmišljati bo treba o primerni izobrazbi, tako da bodo ljudje sposobni uporabljati umetno inteligenco v dobro svojega dela, in v končni fazi, da so pač strokovnjaki s tega ali onega danega področja vključeni v vpeljavo umetne inteligence. Da torej ne gre samo za neko zunanjo, tretjo osebo ali neko profitno podjetje, ki bo na svoj način, po svojih kriterijih poskušalo uvesti, implementirati neko tehnologijo, ampak da so v te pogovore vključeni strokovnjaki z danega področja. Ti namreč najbolje vedo, katere so trenutne priložnosti, kje bi lahko delna pomoč umetne inteligence bila zaželena, dobra in koristna, in kateri so primeri uporabe, kjer uporaba ni zanimiva, ali so trenutno pretežki ali pa so kakšni drugi razlogi, zakaj umetne inteligence tam ni mogoče uporabljati.

Eno izmed ključnih spoznanj je, da lahko tudi na področju biologije na zaporedja nukleotidov ali pa aminokislin na genomu, aminokislin v proteinih gledamo kot na neke vrste besedilo. Le da tu jezik ni podan s slovarjem angleških ali slovenskih besed, ampak je jezik zaporedje teh osnovnih elementov življenja, aminokislin ali pa nukleotidov. Pravzaprav gradimo velike jezikovne modele, ki pa ne temeljijo na (človeškem) naravnem jeziku, ampak na jeziku biologije, na jeziku življenja.

Marinka Žitnik

Kaj vas čaka ob vrnitvi v Združene države Amerike, na Harvard? Česa se jeseni najbolj veselite? Je kakšen nov projekt, ki vam je morda malenkost ljubši od drugih?
Ja, veselim se že, da bomo v polnem zamahu začeli z novim študijskim letom z novimi predmeti in nadaljevali raziskave, na katerih smo delali v preteklih mesecih. Veliko projektov je takih, ki se mi zdijo izredno zanimivi, nad katerimi sem izredno navdušena.

Med zelo pomembnimi projekti za mojo skupino so tisti, povezani z bolj učinkovitim odkrivanjem novih terapij zdravljenja. Tukaj vzpostavljamo večje partnerstvo z Markom Zuckerbergom in njegovo fundacijo. V tem okviru razvijamo algoritme umetne inteligence, ki lahko priporočajo terapije, zdravljenje za področje, ki obsega vse do zdaj znane človeške bolezni, vključno z redkimi boleznimi, ki jih je več kot 7 tisoč. To so bolezni, ki posamično prizadenejo razmeroma majhno število pacientov, ampak teh bolezni je izjemno veliko, tako da letno od 300 do 400 milijonov ljudi trpi zaradi takih bolezni. Ker gre za majhne populacije pacientov, je interes farmacevtske industrije, da bi razvijala učinkovita zdravila za te bolezni razmeroma majhen. Tako si prizadevamo zgraditi velike modele, ki nam bodo omogočala graditev napovedi in priporočala zdravila, ki bi jih lahko repozicionirali, ki bi bila potencialno učinkovita za več kot 17 000 klinično prepoznanih bolezni. Potem pa imamo sodelavce biologe in pa klinične raziskovalce, ki bodo paralelno izvajali več kliničnih raziskav hkrati, da bi ocenili vrednost teh napovedi, ki jih bodo naši algoritmi proizvedli. To se mi zdi en super zanimiv projekt, ki predstavlja cel kup izzivov povsem tehnične, algoritmične narave, zato sem zelo vesela, da delam s super študenti s področja računalništva, matematike. Tu so še izzivi, ki izhajajo iz biologije in kemije, od koder tudi imam študente, ki pomagajo in vodijo te raziskave.

Imamo pa tudi take zelo odbite projekte, bi rekla. Trenutno sodelujem z Naso na projektu, kjer nas zanima, kako dolgotrajni človeški poleti v vesolju vplivajo na človeško telo. To vprašanje je pomembno, ker je bilo zelo malo vesoljskih poletov takih, z izjemo poletov na Luno in še nekaj drugih, kjer je človeška posadka šla izven nizke zemeljske orbite, ki sega tam do 400 km, in je človeška posadka tam ostala dalj časa. Pravzaprav ne vemo, kako mikrogravitacija in sevanje vplivata na naše telo, če človek ostane v vesolju zelo dolgo. To pa je nekaj, kar je treba vedeti in razumeti veliko bolje, če hočete poslati misije na Mars ali celo še globlje v vesolje. Z Naso moja skupina sodeluje tako, da so naši sodelavci z Nase poslali množico majhnih opic na Mednarodno vesoljsko postajo in tam spremljali njihovo življenje, gibanje in fiziološke podatke s pomočjo kupa senzorjev in kamer in te podatke potem prenesli k nam z namenom razumevanja, kako se stanje, zdravstveno stanje teh primatov spreminja v času, ko so na Mednarodni vesoljski postaji. Potem to primerjamo z opicami, ki so ostale v Kennedjevem vesoljskem centru na Zemlji, tako da lahko vidimo, katere so razlike, ki kažejo na vesoljske stresorje, na mikrogravitacijo, ki potem spreminja obnašanje molekul v človeškem telesu. Tudi take projekte, ki so meni izredno zanimivi, imamo. Nikdar nisem pričakovala, da se bom ukvarjala s področjem vesoljske biologije, ampak se mi zdi, da so tudi taki projekti zelo zanimivi, da se na eni strani motivira študente in da tudi razmišljamo o primerih uporabe umetne inteligence na področjih, kjer si je še pred kratkim nismo niti predstavljali.

Marinka Žitnik, Harvard: Veliki jezikovni modeli spreminjajo razumevanje biologije, medicine