Ph.d.-forsvar af Katrine Hommelhoff Jensen – Københavns Universitet

Ph.d.-forsvar af Katrine Hommelhoff Jensen

Titel

Statistical Methods for Single-Particle Electron Cryomicroscopy

Kort abstract

Tomografisk 3D-rekonstruktion af proteiner fra elektronmikroskopiske projektionsbilleder, hvor vinklen er ukendt og skal estimeres som en del af rekonstruktionsproblemet. Afhandlingen fokuserer på statistiske metoder til at forbedre forskellige dele af rekonstruktionsalgoritmen. En stor del af projektet har fokus på en algoritme som kan forbedre rekonstruktionen af membranproteiner, hvis signal overskygges af en vesikelmembran.

Det fulde abstract

Kryo-elektronmikroskopi (cryo-EM) er en form for Transmissionselektronmikroskopi (TEM), som har det formål at rekonstruere 3Dstrukturen af et biologisk makromolekylært kompleks fra en stor mængde 2D-projektionsbilleder, da de udviser et meget lavt signal-til-støj-forhold. I enkelt-partikel rekonstruktionsproblemet (SPR) bliver mange identiske kopier af det samme protein afbildet i tilfældige orienteringer, således at hvert billede repræsenterer en bestemt, men ukendt, vinkel af strukturen. Dette medfører to beregningsmæssigt centrale problemer: (1) at bestemme vinkelforholdet mellem de individuelle projektionsbilleder, d.v.s. hvilken vinkel hvert billede repræsenterer, samt (2) at løse det tomografiske ‘ill-posed’ rekonstruktionsproblem. I begge problemer skal høj beregningskompleksitet håndteres uden at tilsidesætte nøjagtighed. Dette er helt essentielt, da det ultimative mål for cryo-EM er at estimere den mest korrekte 3D-struktur i højest mulig opløsning, givet de støjfyldte og tilfældigt orienterede projektionsbilleder.

Man har i tidens løb foreslået mange statistiske metoder til SPR. Grundet den høje beregningskompleksitet, baserer de sig typisk på tilnærmelser af ‘maximum likelihood’ (ML) eller ‘maximum a posteriori’ (MAP) estimat af strukturen. Samtlige metoder præsenteret i denne afhandling søger at løse en specifik del af rekonstruktionsproblemet på en statistisk forsvarlig måde.

I første del af arbejdet foreslår vi to metoder til at løse problemerne (1) og (2). Disse metoder kan ultimativt udvides og kombineres til en statistisk forsvarlig løsning på det komplette SPR problem. Vi anvender Bayesiansk statistisk inversion for optimalt at håndtere det høje støjniveau, samt at kunne inkorporere eksisterende information for at opnå mere troværdige estimater. I det første problem udforsker vi den statistiske genskabelse af geometrien mellem projektionsbilleder. Mere specifikt viser vi ækvivalensen mellem to billeders affine projektionsgeometri og deres ukalibrerede ‘common line’-geometri, og estimerer dem uden brug af punkt-korrespondencer. Den resulterende algoritme for billedpar kan naturligt udvides til at beregne vinkelforholdet mellem alle projektionsbillederne. I det andet problem foreslår vi MAP-tilgangen til at estimere proteinstrukturen. Den resulterende metode er statisk optimal under antagelsen af den uniforme prior i rummet af rotationer. Den marginale posterior konstrueres ved at integrere over billedorienteringerne og maksimeres med expectation-maximisation (EM) algoritmen. Vi benytter Monte Carlo integration for at reducere beregningskompleksiteten.

I den anden del af arbejdet præsenterer vi en statistisk metode til at fjerne vesikelmembran-strukturer fra projektionsbillederne, med det formål at forbedre kvaliteten af 3D-rekonstruktionen af membranproteinerne. Vesikelstrukturerne er indlært og fjernet ved hjælp af en nyskabende 2D statistisk model af vesikelstrukturer, baseret på ‘higher-order singular value decomposition’ (HOSVD). Vesikelstrukturerne bliver fjernet ved at projektere mikrograferne på det ortogonale komplement af det estimerede vesikelunderrum. Metoden demonstreres på ægte membranproteiner rekonstitueret i veksikelmembraner. Den resulterende 3D-struktur er den første rekonstruktion af det demonstrerede protein ved hjælp af SPR. Underrumsmetoden er generel og har potentiale for at blive integreret i SPR algoritmen for at opnå et endnu mere pålideligt resultat.

Download ph.d.-afhandlingen her

Vejleder

  • Lektor Sami Sebastian Brandt, The Image Section, DIKU

Bedømmelsesudvalget

  • Lektor Søren Ingvor Olsen, The Image Section, DIKU
  • Professor Rasmus Larsen, DTU Compute
  • Docent Martin Lindahl, Dept. of Molecular Biophysics, Lund University