|
Her er de antatte innleggene til det 15 Norske
kjemometrisymposium, Ål 17-19 mars, 2003
Rekkefølgen følger
ikke programmet.
Opplev dette i levende
live!
Kjemometri ved NTNU
Kjemometrigruppen ved NTNU
Bjørn K. Alsberg
The NTNU Chemometrics Group (NCG) har to hovedsatsingsområder
hvor både utvikling og bruk av kjemometriske metoder står
sentralt:
- funksjonell genomforskning (FUGE)
- struktur-aktivitets relasjoner og drug design
Innenfor FUGE jobber vi spesielt mot to instrumentelle
teknikker: Mikromatriser og proteomikk geler. Mikromatriser brukes
for å se i hvilken grad ulike gener er slått på
eller av i en organsime under ulike forhold. En typisk problemstilling
for våre samarbeidspartnere er å kunne finne en sammenheng
mellom mikromatrisemønstre og kreft. Men mikromatriseteknologien
er svært ny og den har flere problemer. Spesielt gjelder dette
støy, ulinære effekter og manglende data. Vi jobber
mot slike problemer og har prosjekter igang som spesifikt relateres
til variabelseleksjon, estimering eller håndtering av manglende
data og instrumentsimulering. For variabelseleksjon arbeider vi
bl.a. med dobbel jack knife PLS og GOLPE. For manglende data ser
vi på muligheten av å bruke en maksimum entropi basert
metode.
Innenfor proteomikk har vi konsentrert oss i hovedsak
om ett sentralt problem: Å finne sammenliknbare protein-punkter
mellom ulike geler. Til dette bruker vi scale space teori hvor bifurkasjonsmønsteret
over skala danner basis for sammenlikning.
Innenfor struktur-aktivitet og drug
design fokuseres det spesielt på hvordan 3-D strukturen av
molekyler best kan representeres. Det er spesielt utfordrende å
finne en god representasjon av den 3-D elektroniske struktur og
for dette har vi laget en metode (structure representation using
quantum topology, StruQT) som baserer seg på Richard Baders
Atoms in Molecules teori. Fra denne teorien danner de kritiske punktene,
dvs. punktene i rommet der gradient vektorene blir null i det skalare
feltet (f.eks. elektrontettheten), utgangspunkt for en strukturerepresentasjon.
Et annet viktig problem tilknyttet dette fagfeltet er å finne
sammenliknbare strukturerer mellom ulike molekyler. Som en løsning
på dette problemet arbeides det bl.a. med å gjøre
bruk av en kunstig intelligens metode som kalles inductive logic
programming (ILP).
Zherlock: Et dataanalyseverktøy
for kjemometri
Bjørn K. Alsberg
Zherlock er en open source programpakke for dataanalyse
og kjemometri. Hensikten med programmet er å gi det akademiske
miljøet et verktøy som gjør det enkelt og raskt
å implementere nye kjemometriske metoder, er intuitivt å
bruke og som benytter avansert 2-D og 3-D grafikk. Svært lite
av dataanalysen foregår inne i selve Zherlock programmet.
Istedet kaller det på eksterne programmer som utfører
beregningene og returnerer resultatene til Zherlock. Typiske eksempler
på slike eksterne programmer er Octave/Matlab, SciLab eller
R/S-PLUS. Grunnen til dette er at slike programmer bruker høynivåspråk
som gjør det enkelt og raskt å utvikle nye algoritmer.
Men Zherlock vil også tillate kopling til enkeltstående
programmer skrevet i mer tradisjonelle dataspåk som C/C++,
Fortran og Java. Av spesiell interesse for oss er å kople
Matlab klonen Octave til Zherlock. Men det arbeides også med
å få en kopling mot R som har stor utbredelse innen
statistikkmiljøet. Ved å kople Zherlock til slike høynivåspråk
kan man enkelt gjøre seg nytte av et stort antall eksisterende
metoder. Den brukervennlige presentasjonen og interaksjonen tar
selve Zherlock programmet seg av. Av sentral betydning i denne sammenheng
er et visuelt programmeringsmiljø som er gitt navnet "Doodler".
I Doodleren kan brukeren lage programmer på et høyt
nivå ved å tegne grafer der noder representerer ulike
metoder og lenker representerer overføring av data mellom
metodene. Andre programmer som bygger på samme prinsipp er
SIMULINK i Matlab, Cantata i Khoros eller Viper.
Octave: Et alternativ til Matlab?
Bjørn K. Alsberg
Matlab har blitt en standard innen kjemometrimiljøet.
Dette programmet er uten tvil et meget kraftig og nyttig verktøy
for fagfeltet der kompliserte algoritmer på en rask måte
kan utvikles og testes ut. Men det er en skyggeside til Matlab:
Den baserer seg på et kommersielt dataspråk der brukerne
har dannet seg et meget sterkt avhengighetsforhold til ett enkelt
firma, MathWorks. Å velge seg vekk fra Matlab blir svært
vanskelig for brukeren som har investert mye tid og penger på
å utvikle programmer i dette språket. Brukerene har
derfor lite kontroll over egen teknologi og dette er en uheldig
situasjon for et akademisk miljø. Spørsmålet
blir derfor om det finnes et open source alternativ der en Matlab
brukere uten problemer kan kjøre sine gamle m-filer? Det
beste alternativet pr. idag er Octave (www.octave.org) som er laget
av Dr. John W. Eaton ved University of Wisconsin-Madison. Men dessverre
har dette programmet en funksjonalitet som ikke er den samme som
Matlab. Octave mangler bl.a. Handle Graphics, multidimensjonale
tabeller og objektorientering. For å kunne rette på
denne situasjonen arbeider vår gruppe med å hjelpe til
med Octave utviklingen. Av spesiell interesse er å gjøre
plottingen i Octave mye bedre. Som løsning vurderes Visual
Toolkit (VTK) og det norske Coin som bibliotekter for 3-D grafikk.
Her vil det være mulig å kunne utvide funksjonaliteten
i 3-D interaksjonen sammenliknet med hva som finnes tilgjengelig
idag i versjon 6 av Matlab. I Matlab er sanntids rotasjon og manipulering
av avanserte 3-D modeller ikke tilgjengelig, men for både
VTK, Coin og OpenInventor er dette mulig uten problemer. For 2-D
grafikk og grafisk brukergrensesnitt er det norske Trolltechs Qt
bibliotek svært relevant. Qt blir brukt i vårt dataanalyseprogram
Zherlock og er også fundamentet for vindusystemet KDE under
Linux.
- Signal/kurvetilpassing
Dekonvolusjon av spektre ved bruk av maksimum entropi
Bård Buttingsrud og Bjørn K.
Alsberg
Overlapping av ulike topper i et
spektrum er et velkjent problem innenfor den analytiske kjemien.
Siden dette kan medføre regioner i et spektrum med brede,
overlappende topper der det ikke er mulig å fortolke hver
enkel topp, blir kvaliteten på måledataene forverret.
Dette skyldes at hver enkel topp blir konvolvert, og nærliggende
topper kan dermed overlappe hverandre. Flere ulike dekonvolusjonsmetoder
har blitt utviklet i literaturen, men de har ofte problemer ved
heteroskedastisk støy.
En alternativ metode har blitt utviklet basert på prinsippet
om maksimering av entropien til dataene. Metoden kan anvendes på
problemer der det er flere løsninger konsistente med dataene.
Dekonvolusjon av spektre oppfyller ofte dette kravet grunnet moderate
eller større mengder støy i spektrene.
Maksimum entropi metoden fungerer konsepsjonelt anderledes enn andre
metoder for dekonvolusjon. I stedet for å bruke de observerte
dataene direkte til å gjøre slutninger om et underliggende
spektrum, dannes det mange kandidatspektre. Deretter benyttes kunnskap
om konvolusjonsfunksjonen til å rekonstruere dataene, og en
sammenlikning mellom observerte og rekonstruerte data utføres.
Mange underliggende spektre vil kunne forklare datene innenfor et
angitt støynivå, og løsninger som tillegger
dataene minst struktur vil bli valgt. Denne metoden tillater en
implisitt håndtering av støy som behandler heteroskedastisk
støy på lik måte som homoskedastisk støy.
Ingen preprosesseringsmetode for å transformere heteroskedastisk
støy til homoskedastisk støy er nødvendig.
En maksimum entropi algoritme som opprinnelig ble utviklet for å
bedre kvaliteten på bilder, har blitt implementert og modifisert
for å utføre dekonvolusjonen.
Ny "Funnel" metode for å estimere funksjonsparametre
i ulineær kurvetilpasning av spektra
Morten Beck Rye Veil.
B. K. Alsberg
Spektra blir ofte representert som absorbanser ved
ulike bølgelengder. En alternativ måte å representere
spektra på er å bruke en ulineær kurvetilpasning
av dataene, istedenfor de individuelle datapunkter ("Sampling Point
Representation", SPR). Den nye representasjonen er basert på
estimering av Gaussiske og Lorentzianske kurveparametre, og er en
såkalt "Peak Parameter Representation", PPR.
Den viktigste fordelen med PPR, er at den kan håndtere fenomen
som skift i spektra, som ellers er et stort problem i multivariat
modellering. Problemet med PPR er hvordan man skal estimere disse
parametrene, og hvor mange topper man skal inkludere i dataprofilen.
De estimerte parametrene ofte er ustabile, og sensitive til eksempelvis
fenomen av typen skift.
Vi foreslår her en ny "Funnel" metode for bruk til denne type
parameter-estimering. Målet er at denne metoden skal øke
robustheten til disse parametrene, og dermed skape mer stabile modeller.
Funnel metoden baserer seg på såkalt "Scale-Space" teori
hentet fra billedanalyse. Tanken bak "Scale-Space" er at den ulineære
kurvetilpasningen foregår over ulike skalaer. Ved den høyeste
skalaen (lavest detaljnivå) har vi en kurve med kun en topp.
Ettersom skalaen minker (høyere detaljnivå) vil antall
tilpassede topper øke. Ved hver skala estimeres kurveparametrene.
En slik parameter kan for eksempel være posisjonen til en
topp. Funnel-metoden vil prøve å finne parametre som
er stabile over flere skalaer, og slik øke robustheten av
estimatene. Det er vanlig å visualisere Scale-Space med bifurkasjonstrær.
Ved å sammenligne strukturen i slike trær, er det mulig
å finne sammenlignabare områder som er mindre sensitive
til skift og lignende forstyrrelser enn en normal SPR.
- Validering
og variabelseleksjon
Validering av modeller og variabelseleksjon
Endre Anderssen, Knut Dyrstad, Harald Martens
Innen områder som QSAR, bildeanalyse, funksjonell
genomforskning og andre grener av kjemometri, har en ofte X matriser
med mange variable og samtidig få prøver tilgjengelig.
Både for å forenkle tolkning og for å forbedre
prediksjon ønsker en ofte å fjerne unyttige variable
fra modelleringen. Denne formen for modell utvikling innebærer
dessverre en betydelig mulighet for overtilpassning av modellen.
Overtilpassning har vært velkjent mye diskutert i forbindelse
med bruk av for mange komponenter o.l., men problemene rundt modellutvikling
har ikke vært diskutert like mye. En metode basert på
dobbel kryssvalidering blir presentert som kan gi ‘sikker’ validering
av optimaliserte modeller samtidig med modellutvikling uten å
bruke et eksternt test sett.
Kjemometriske metoder for variabelseleksjon
på mikromatrisedata
Lars Gidskehaug* og
Bjørn Kåre Alsberg
Norges teknisk-naturvitenskapelige universitet,
Institutt for Kjemi, N-7491 TRONDHEIM, Norway
Funksjonell genomforskning tar for seg kartlegging
av arvemassen til organismer, og sammenligning av DNA-sekvenser
gjør det mulig å studere genetisk variasjon både
innen arter og på tvers av artsgrenser. Kvantitativ analyse
av genuttrykk (gene expressions) gjør det mulig å finne
gener involvert i spesifikke fysiologiske prosesser. F.eks. kan
gener involvert i komplekse sykdommer identifiseres ved hjelp av
sammenligninger mellom sykt vev og normalvev hos mennesket.
DNA mikromatrise-teknologi kan benyttes til å
finne ekspresjonsmønsteret til et stort antall gener samtidig.
Et anslag for celleprøvers genuttrykk finnes ved å
hybridisere prøvene til kjente gener, og måle aktiviteten
til de forskjellige genene. Det vil alltid være et stort antall
gener som ikke er uttrykt, og det ligger en utfordring i å
finne effektive og pålitelige metoder for å eliminere
uinteressante gener (variable) fra den påfølgende analysen.
Kjemometriske metoder er velegnet for denne type
variabelseleksjon. Et godt utgangspunkt for analysen kan være
Diskriminant PLS (DPLS)(1), hvor et utvalg av celleprøver
kan klassifiseres med hensyn på f.eks. vevstype. Nye valideringsmetoder
tas i bruk for å identifisere og fjerne inaktive gener, da
disse introduserer støy i modellene. Som eksempel på
egnede valideringsmetoder kan nevnes cross-model validation (CMV)
og double jack-knifing (DJR)(2). Forskjellige metoder
er testet for klassifisering av krefttyper ved bruk av et allment
tilgjengelig datasett(3).
Referanser:
- Martens, H. og Martens, M.; Multivariate Analysis
of quality: An introduction. Wiley, Chichester, UK, 2001
- Anderssen, E., Dyrstad, K. og Marens, H.; Reducing
over-optimism in variable selection by double jack-knifing. Submitted
to J. Chemometrics
- Ross, D.T. et al; Systematic variation
in gene expression patterns in human cancer cell lines (2000).
Nat. Genetics, 24, 227-235
- Bioinformatikk
Design av selektive inhibitorer for proteiner
Kristin Tøndel a , Endre
Anderssen b og Finn Drabløs b
aInstitutt for kjemi, Norges
teknisk naturvitenskapelige universitet, Sem Sælands v.
14, N-7491 Trondheim
bSINTEF Unimed MR-senter, N-7465
Trondheim
Vi har utviklet metoder som kan utnyttes i design
av selektive inhibitorer for proteiner. Disse metodene benytter
en kombinasjon av beregningskjemi og kjemometri. For å oppnå
selektivitet, må man identifisere egenskaper som skiller
forskjellige proteiner fra hverandre. Dette gjøres ved
å kartlegge egenskapene til proteinenes aktive seter. Ved
kjemometrisk analyse av disse dataene kan vi predikere egenskaper
for et molekyl som binder selektivt til et gitt protein. Vi har
anvendt disse metodene i design av selektive inhibitorer for protein
kinaser. Protein kinaser bidrar til regulering og koordinering
av f.eks. metabolisme, gen-ekspresjon, celle-vekst og celle-deling.
Disse proteinene er også viktige for vekst og spredning
av kreft-celler. Det er derfor viktig å kunne designe inhibitorer
som er selektive for de protein kinasene som inngår i patologiske
tilstander, slik at de normale biologiske prosessene påvirkes
minst mulig ved en medisinering.
AUTOMATISK KONSTRUKSJON AV POTENSIELLE
TRANSISJONSANALOGER
Torbjørn Lindahl og Bjørn
K. Alsberg
Transisjonsanaloger (TA)
er forbindelser som har en struktur som er lik
transisjonstilstanden (TS) for en gitt reaksjon. Slike forbindelser
blir ofte brukt som enzyminhibitorer og har stor viktighet
innenfor farmasøytisk industri. TS strukturen kan beregnes
ved bruk av kvantekjemiske metoder,
men problemet er å generere stabile
strukturer som likner. I denne studien blir genetiske algoritmer
brukt på SMILES (Simplified Molecular Input Line Entry Specification)
representasjoner av molekylers strukturer. SMILES gjør
bruk av en strengbasert representasjon
av molekylers struktur og er derfor
ypperlig egnet for genetiske algoritmer. For hvert molekyl (individ)
i en populasjon beregnes en stabil struktur ved hjelp av molekylmekanikk.
Strukturene kan også underkastes semi-empiriske metoder
som AM1, PM3, MNDO eller ab inito metoder, men dette vil begrenses
av tilgjengelig datakraft. Skikkethetsverdien (fitness value)
for et individ (molekyl) beregnes ut fra hvor likt det er TS strukturen.
GA vil finne molekyler som har en optimal "fitness value" og
disse vil være gode TA kandidater.
Ny kunnskap fra simulering av mikromatrise data
Arnar Flatberg *, Bjørn
K. Alsberg*
* Norges teknisk naturvitenskapelige universitet,
NTNU, Institutt for kjemi, seksjon for fysikalsk kjemi, Sem Sælands
veg 14, Trondheim
DNA mikromatrise (microarray) er en metode som
gir oss muligheten til en helhetlig forståelse av biologiske
prosesser i levende organismer ved parallell avlesning av genutrykksdata
for titusener av gener. Gener med samme funksjon synes å
gi like uttrykksmønstre, men biologisk tolkning av 30 000
– 50 000 gener krever multivariate data-analyse.
Det vitenskapelige fokus for mikromatriser er ofte på multivariate
klassifiserings teknikker og kilder til variasjon i mikromatrise-data.
Simuleringer kan gi verdiful informasjon om data variasjon som
er vanskelig tilgjengelig pga. dyre eksperimenter og ukjente sanne
relajoner.
Vi foreslår her instrument simulering som et viktig verktøy
til analyse og pre- prosessering av data i funksjonell genomikk.
Simuleringene vil være basert på både mekanistiske
såvel som stokastiske modeller for det gjeldende instrumentet.
Det er lagt hovedvekt på analysemetodene mikromatriser og
to-dimensjonal eletroforese, gjennom et tett samarbeid med lokal
operatør ekspertise fra biomedisinsk teknisk senter ved
NTNU.
Gjennom dette prosjektet håper vi å
få:
- Lage realistiske mikromatrise data, som
kan brukes til å teste nye algoritmer innen signal analyse
og kjemometri.
- Lage detaljerte matematiske modeller som kan hjelpe
til forsåelse av underliggende signal/støy fenomen.
- Kalibrere og/eller utvikle ny apparatur og lab-protokoller.
- Bruke simulerings data som a priori informasjon
i pre-prosessering s- og billed analyse-metoder.
- Lage et verktøy som kan underbygge undervisningen
ved universitetet.
Kjemometriske modelleringsplattformer
Web-basert dataekstraksjon
og modellering
av Terje V. Karstang og
Rune Mathisen, Borealis
For å forenkle tilgangen
til historiske data, sanntidsdata, modeller og modelleringsverktøy
har det ved Borealis blitt utviklet en web-basert modelleringsplatform.
Platformen er basert på fri
programvare (Apache, PHP, mySQL og Borland C++) og kjører
på Windows og Unix maskiner. Historiske data hentes og sammenkobles
fra forskjellige databaser og rådatafiler. Disse dataene sammenstilles
slik at modelleringen kan startes direkte på filer generert
fra søkeresultatene. Alle modeller blir også gjort
tilgjengelige. Det er også interface mot flere fabrikkdatabaser
som gjør det enkelt å teste ut nye modeller mot fabrikkdata
så snart en modell er etablert.
Platformen inneholder programmer
for de aller fleste kjente kjemometriske forbehandlinger, dekomponeringsmetoder,
optimaliseringer og plot. Det er også implementert metoder
for forsøkplanlegging og identifisering av dynamiske systemer.
I tillegg inneholder platformen harde modeller som er spesifike
for polyolefiner. Platformen vil bli utvidet til å håndtere
modeller fra andre modelleringsverktøy (Excel, Aspen....)
i tillegg skal modellene linkes slik at utganger fra en modell kan
benyttes som innganger i neste modell.
Kjemometriske metoder
Kryssvalidert MSEP: Myter eller fakta?
Bjørn-Helge Mevik,
MATFORSK
MSEP (Mean Squared Error
of Prediction) brukes ofte som mål på hvor god en regresjon
er. Den brukes også til å velge det optimale antall
komponenter i PCR (Principal Component Regression) og PLSR (Partial
Least Squares Regression). Når man ikke har nok data til å
sette av et (stort nok) testsett, må man estimere MSEP fra
treningsdataene. Full kryssvalidering (leave-one-out cross-validation)
er kanskje det mest brukte interne estimatet. Det er nærmest
forventingsrett, og er lett å implementere og forstå.
Det har imidlertid blitt kritisert for å være variabelt,
og derfor ikke konsistent til variabelselekson. Alternative estimater,
oftest basert på k-veis kryssvalidering (k-fold cross-validation)
eller bootstrap, har blitt fremsatt for å redusere denne variabiliteten.
De fleste teoretiske resultater om disse estimatene er utledet under
antagelsen at det er få variabler sammenlignet med antall
prøver. Det samme gjelder de fleste empiriske undersøkelsene.
Er disse resultatene gyldige for regresjoner som PLSR og PCR? I
dette foredraget vil jeg presentere resultater fra simuleringer
på reelle, spektroskopiske data, hvor flere ulike MSEP-estimater
sammenlignes: full kryssvalidering, k-veis og justert k-veis kryssvalidering,
samt en del bootstrap-estimater. Jeg vil også argumentere
for at «sannheten» om at k-veis kryssvalidering er mindre variabel
enn full kryssvalidering ikke nødvendigvis er sann for PLSR
og PCR. Resultatene tyder på at noen av alternativene, f.eks.
«0.632» bootstrap-estimatet, kan ha mindre varians enn full kryssvalidering,
uten å bli nevneverdig forventnigsskjeve. Den justerte k-veis
kryssvalideringen kan også være en god kandidat, fordi
den krever så få beregninger sammenlignet med de andre
estimatene.
Andre ordens kalibrering
Åsmund Rinnan, KVL
Andre ordens kalibrering er interessant
fordi det gir nye muligheter for å lage kalibrerings-modeller
selv når man ikke har adgang til kalibreringsprøver
som ikke direkte representerer de nye prøvene man ønsker
å predikere.
Dagens utvikling av instrumenter fører til at det er mulig
å oppta kompleks informasjon, som bedre kan forklare den multivariate
virkeligheten som undersøkes. I de siste årene har
data fra analytiske instrumenter endret seg fra univariate signaler
(et enkelt tall for en enkelt måling, for eksempel en pH måling;
en vektor for et sett med prøver), til to-veis data (en vektor
for en enkelt prøve, for eksempel NIR spektra; en matrise
for et sett med prøver), og videre til multi-veis data (en
matrise for en enkelt prøve, for eksempel fluoressens emisjons-eksitasjons
landskap; en tre-veis matrise for et sett med prøver).
I denne sammenheng har interessen for andre ordens kalibrering og
bruken av den såkalte andre ordens fordelen økt. OLS
(Ordinary Least Squares) eller MLR (Multivariate Linear Regression)
på skårene fra PARAFAC (PARallel FACtor analysis) er
en metode som tar i bruk denne fordelen. Under dette foredraget
vil det bli forklart hva den andre ordens fordelen er, hvordan den
fungerer, og vise hva forskjellen i prediksjonen blir ved bruk av
PARAFAC kontra PCR, PLS eller N-PLS.
Separasjon av fysikk og kjemi i diffus spektroskopiHarald
Martens1,2,3,4,
Jesper Pram Nielsen1, Michael Bom Frøst1,
Morten Beck Rye2,
Xuxin Lai3 and Achim Kohler4
1. KVL/MLI, DK-1958
Frederiksberg, Danmark,
2.NTNU/Kjemisk inst., 7034
Trondheim
3.DTU/Biocentrum, DK-2800
Lyngby, Danmark.
4.Matforsk, 1432 Ås
Harald.Martens@mail.tele.dk
Spektrale variasjoner i NIR osv
som skyldes fysikk, og ikke kjemi, f.eks. fra variasjoner i lysspredning,
prøvetykkelse, instrument geometri, temperatur osv, kan forårsake
selektivitetsproblemer i kvantitativ kjemisk analyse.
Takket være dagens teknikker for
spektral pre-prosessering og multivariat kalibrering, kan disse
fysiske selektivitetsproblemene vanligvis bli redusert, om enn ikke
helt eliminert. Men det er økonomisk belastende, og intellektuelt
utilfredsstillende, å skulle måtte bruke massevis av
empiriske data for å separere fysiske og kjemiske effekter
i de målte spektrene, spesielt hvis man ikke lærer et
dugg av det selv. Hvis man kunne utvikle en mer vellykket fysikalsk
pre-prosesseringsteknikk for denne type data, skulle man kunne forvente
forbedret selektivitet og en høyere akademisk aksept av diffus
spektroskopi (f.eks. NIR).
Foredraget vil forklare og demonstrere
teknikken Extended Multiplicative Signal Correction (EMSC) og dens
inverse (EISC), for model-basert pre-prosessering av vis. og NIR
transmittans- and reflektans-spektra. Disse generelle metodene,
slik de er implementert i Matlab, tillater brukeren å anvende
kvalitative og kvantitative for-kunnskaper av fysisk og kjemisk
natur, til å modellere og derved korrigere for forskjellige
interferens-typer.
Forsøksdesign
Effekt av fôrsammensetning og fôringsregime på
vekst, fôrutnyttelse og næringsmiddelretensjon i Torsk
(Gadus Morhua).
Grethe Rosenlund 3, Kristoffer
Tveit 3, Ørjan Karlsen 2 og Gro-Ingunn
Hemre 1
1 Fiskeridirektoratets ernæringsinstituttet,
Bergen
2 Austevoll havbruksstasjon, Austevoll
3 Nutreco Aquaculture Research Centre, Stavanger
Torsk ble fôret 11 ulike dietter
over en periode på 28 uker. Det ble brukt et mixture design
med fôrsammentning som variable. Fôrets innhold av protein,
fett og stivelse varierte mellom 36-66%, 8-28% og 8-18%. I tillegg
ble det brukt to ulike fôringsregimer; fôring til metthet
hver dag eller hver annen dag. Forsøket ble gjennomført
i sirkulære kar (1700L) med sjøvann på 8°C. Alle
hadde fôrspilloppsamlere for registrering av mengde fôr
spist. Fisken ble veiet 5 ganger, ca hver 6. uke, og fisk ble tatt
ut til analyse ved start, etter 12 uker og ved slutten av forsøket.
Målet med forsøket var å bestemme effekten av
fôrsammensetning på vekst, fôrutnyttelse og retensjon
av næringstoffer og energi i torsk. Det ble spesielt lagt
vekt på å bestemme eventuell sammenheng mellom fôrsammensetning
og fiskens lever indeks. I tidligere forsøk er det rapportert
om en positiv effekt på fôrutnyttelse og lever indeks
i torsk ved redusere fôringshyppighet. Derfor ble også
fôringsregime tatt med som en ekstra variabel i foreliggende
forsøksoppsett.
Fisken vokste fra en gjennomsnittlig vekt på 192g til 820g
i løpet av forsøksperioden. Fôringsregime hadde
ingen effekt hverken på vekst, fôrutnyttelse eller leverindeks.
Det ble funnet relativt små forskjeller i vekst, men det laveste
nivået av protein dekket ikke behovet til vekst og resulterte
også i forhøyete nivå av blodsukker. Spesifikk
vekstrate, fôrutnyttelse og leverindeks var alle påvirket
av fôrsammensetning.
UTVIKLING AV PRODUKSJONSPROSESS FOR PEPTIDBASERT RADIOFARMASØYTISK
PRODUKT
Solveig Pedersen, Kathrin Bjerknes, Carina
Wickmann, Knut Dyrstad
Amersham Health AS, Oslo, Norge
Kjemisk ustabilitet er en utfordring
ved framstilling av peptidbaserte legemidler. Et målstyrende
radiofarmasøytisk legemiddel kan bestå av en peptid-
og en chelatorenhet. Valg av riktig produksjonsprosess er ønskelig
for å stabilisere de fysikalsk-kjemiske egenskapene.
Formålet med studiet var å kartlegge den kjemiske stabiliteten
til et peptidbasert radiofarmasøytisk legemiddel i vandig
løsning, for dermed kunne definere akseptable prosess- og
produksjonsbetingelser med tanke på oppskalering av produktet.
Prosesstemperatur, produksjonstid og pH ble ansett som kritiske
faktorer for stabiliteten av det peptidbaserte legemiddelet i vandig
løsning. Effekten av pH (8,4 – 9,8) og temperatur (5, 15
og 25ºC) ble undersøkt ved hjelp av et flernivåers,
fullt faktorielt design. Prøver ble analysert ved jevne mellomrom
i perioden 0-26 timer etter tilberedning. Responser var endring
i pH og degradering av det peptidbaserte legemiddelet målt
ved HPLC.
En regresjonsmodell ble benyttet til å predikere grad av degradering
ved ulike betingelser innenfor rammen av modellen og dermed angi
valg av produksjonsbetingelser.
Metodeutvikling i PLS-modellering
Kompresjon til to-komponent PLS-faktoriseringer
– med applikasjoner
av
Rolf Ergon
Høgskolen i Telemark
Inspirert av artikler om OSC (orthogonal
signal correction) har jeg nylig vist at alle PLS-prediktorer for
en skalar respons (PLS1 med én y-variabel) helt uavhengig
av antall komponenter kan komprimeres til bare to komponenter [1].
Poenget med OSC er egentlig å fjerne y-ortogonale variasjoner
i X-matrisa før en foretar en regresjon mot responsvektoren
y, men det mest vesentlige resultatet ser likevel ut til
å være reduksjonen av antall komponenter. De ulike OSC-algoritmene
er noe innfløkte, og de gir litt ulike resultater [2], til
dels ulike prediktorer. Min nye komprimering til to komponenter
er til gjengjeld direkte og meget enkel, og den gir en helt uforandret
prediktor. Poenget er altså å forenkle modellen slik
at fortolkningen blir enklere. Med bare to komponenter er det nok
å se på ett skårplott og ett ladningsplott, eventuelt
samlet i et biplott. To-komponent-løsningen er også
mer y-relevant, fordi mer av den strukturerte men y-ortogonale
variasjonen i X blir fanget i residualene.
Utgangspunktet for to-komponent-algoritmen kan altså være
en PLS-løsning med mange komponenter. Men det kan også
være en PCR-løsning eller resultatet av en ridge-regresjon,
eller tom. en minste-kvadrat-løsning. Alle prediktorer for
en skalar respons kan altså uttrykkes som en to-komponent
PLS-løsning, med de greie grafiske fortolkningsmulighetene
som det gir.
Til tross for at algoritmen er svært enkel, er det ikke så
greit å vise at dette stemmer rent teoretisk (det er lett
å vise ved å bruke for eksempel Matlab på ulike
datasett). Den teoretiske siden av dette ar altså noe teknisk,
og den egner seg ikke for en muntlig presentasjon (de interesserte
får se i [1] når den forhåpentligvis kommer på
trykk). Isteden vil jeg bruke grafiske fremstillinger både
for å begrunne og beskrive algoritmen, og for å beskrive
den grunnleggende to-komponent-løsningen og et par nyttige
transformasjoner av denne.
Jeg vil også vise noen resultater mht. estimering av spektra
[1] og prosessovervåking vha. korrespondanse mellom skår-
og ladningsplott (biplott) [3].
[1] R. Ergon, Compression into two-component
PLS factorizations, submitted to Journal of Chemometrics, 2002
[2] O. Svensson, T. Kourti and J.F. MacGregor,
An investigation of orthogonal signal correction algorithms and
their characteristics, J Chemometrics 2002, 16: 176-188
[3] R. Ergon, Informative PLS score-loading
plots for process monitoring, submitted to Journal of Process
Control, 2002.
Tittel: Ulineær PLS.
Foredragsholder: Per Anker
Hassel, Borealis PO R&T, avd. for Modellering og Simulering
Presentasjonen er del av
doktorgradsarbeid utført ved University of Newcastle upon
Tyne
Sammendrag:
I prosessindustrien kommer vi ofte
over ulineære sammenhenger.Vanligvis kan enkle transformasjoner
linearisere dataene slik at PLS og andre lineære metoder kan
brukes direkte. Men noen ganger er ikke sammenhengene opplagte og
vi må ty til andre metoder. Et slikt tilfelle førte
til en undersøkelse av ulineære PLS metoder.Siden eksisterende
metoder hadde mangler og ikke viste seg å være effektive
for å løse problemet ble to nye ulineære PLS
modeller utviklet. Den ene ble presentert på SSC 7, den andre
ønsker jeg å presentere her i dag. Målsetningen
var å finne en generell ulineær PLS som kan brukes for
situasjoner med varierende korrelasjon mellom variablene og for
alle matrise dimensjoner. I ulineær PLS erstattes den lineære
sammenhengen mellom de latente variablene t og u, med en ulineær
funksjon. Det viser seg at vi ikke kan konstruere en ulineær
PLS direkte fra lineær PLS. Dette fordi at det å tilpasse
en ulineær funksjon er vanskeligere og kan gi store feil.
Denne feilen vil følge med når neste par av latente
variable skal tilpasses og vil normalt ikke være mulig å
modellere. På bakgrunn av disse betraktningene ble en ny ulineær
PLS modell utviklet: Nested PLS. Her blir hvert par av latente variable,
t og u, oppdatert i en iterative optimalisering basert på
en første ordens Taylor approksimasjon. Denne løses
ved bruk av en indre lineær PLS hvor antall latente variable
er bestemt ved hjelp av kryssvalidering. Det gjør at den
underliggende struktur blir bedre representert av de latente variablene
og reduserer dermed feilen når den ulineær funksjonen
blir tilpasset. Faren er muligheten for overtilpasning.
Per Anker Hassel
Modelling & Simulation Group Borealis AS
e-mail: per.hassel@borealisgroup.com
phone: int.: (216) 8055
ext.: (+47) 3557 8055
fax: ext.: (+47) 3557 7055
web: http://www.borealisgroup.com/
Quidquid latine dictum
sit, altum sonatur
Flervariabel metodologi
og strategiske valg
Development
of Organic syntheses, processes and reactions by means of multivariate
methodology pdf
Hans-René Bjørsvik, Kjemisk institutt, Universitetet
i Bergen
Anskaffelse av analyseverktøy
for styring av produktkvalitet -
Kundens krav til leverandør
Knut Iversen, Borealis
Innlegget
bygger på erfaringer fra et reellt case fra Borealis - hvor
følgende hovedpunkter vektlegges:
- Valg av anskaffelsesprosess
- Hvilke elementer bør
man ha vurdert før man går inn i anskaffelsesprosessen?
- Finnes det standardløsninger
eller må man skreddersy prosessen for det enkelte tilfellet
?
- Viktigheten av en klar
behovsbeskrivelse
- Hvordan beholde behovsbeskrivelsen
som et levende dokument gjennom prosessen?
- Anskaffelsesstrategi
- Hva er en anskaffelsesstrategi?
- Hvilke elementer bør
inngå (bør man ha tatt hensyn til) i en anskaffelsesstrategi?
- Fordeler og ulemper med
partnerskap i anskaffelsesprosessen
- Hva bør man være
klar over?
- "Hva ville vi gjort
annerledes hvis vi startet idag ?"
- Erfaringsdeling hvor
viktige punkter vektlegges.
Kjemometriske anvendelser
Prinsipal komponent analyse av HR MAS MR spekter
fra hjerne autopsier
Tone F. Bathen, Beathe Sitter,
Anna-Maija Häkkinen, Ingrid S. Gribbestad
Neuronal ceroid-fuscinose (NCL) er
en gruppe hjernesykdommer som rammer barn, og leder til psykomotoriske
forstyrrelser, epilepsi og tidlig død. Infantil NCL (INLC)
er en raskt progressiv sykdom med nesten fullstendig tap av nevroner
og forventet levealder på ca. 10 år mens juvenil NCL
(JNCL) forbindes med et moderat tap av nevroner og forventet levealder
på ca. 35 år. I dette studiet ble hjerneautopsier analysert
ved HR MAS 1H MRS og PCA for å undersøke
om dette kunne avsløre ukjente metabolske abnormiteter i
NCL. Autopsier fra pasienter med INCL (n=9), JNCL (n=6) og kontroller
(n=9) uten påviste nevrologiske skader ble oppbevart ved -80°
C inntil MR analyse. HR MAS MR spekter av representative prøver
fra en kontroll og en INCL-pasient er vist i Figur 1. PC1 og PC2
beskriver til sammen 68% av den totale variasjonen, og som vist
i Figur 2 er INCL prøvene lineært separert fra JNCL
og kontroll-prøvene. Ladningsprofilen av PC1 viser at autopsiene
fra INCL pasientene har økte inositol og glycerophosphocholin-konsentrasjoner,
i tillegg til lavere mengder kreatin, glutamin, glutamat, GABA,
NAA og acetat i forhold til JNCL og kontroll-prøver. PCA
viste også at INCL har lavere fettsyre-metylen/metyl-ratio,
noe som indikerer at fettsyrer i disse autopsiene har kortere kjedelengde
eller høyere grad av umettethet. Konklusjon: PCA førte
til klassifisering av INCL basert på HR MAS MR spektra av
autopsier, og bidrar til å beskrive de ulike metabolske profilene.
Resultatene kan være nyttig for fremtidig diagnostikk med
bruk av in vivo spektroskopi.
Bestemmelse av pH i kvernet laks og sei ved bruk av nærinfrarød
spektroskopi
Berit Nordvi, TINE BA, Postboks 7 Kalbakken, 0902
Oslo
Bjørg Narum Nilsen, MATFORSK, 1430 Ås
Erik Slinde, Havforskningsinstituttet, Postboks 1870 Nordnes,
5817 Bergen
Nøkkelord: Nær infrarød spektroskopi,
fisk, pH, MCS, "jack-knifing"
Fisk er Norges nest viktigste eksportprodukt på
over 30 milliarder kroner i 2001. Det vil bli mer og mer viktig
at både kvalitet og kvantitet bestemmelser i fisk og fiskeprodukter
skal kunne dokumenteres bedre. Derfor er det viktig å utvikle
enkle, raske og eksakte analysemetoder for bruk i fiskeindustrien.
Nær infrarød reflektans spektroskopi (NIR) har blitt
en akseptert metode for måling av kjemisk sammensetning (fett,
protein og vann) i fisk, og denne metoden begynner så vidt
å bli implementert i noen få norske fiskebedrifter.
I forbindelse med måling av kvalitet på fisk er måling
av pH en viktig kvalitetsparameter. I fisk er det en relativ stor
variasjon i normal pH (ca. 0,4 pH-enheter) ved at melkesyre akkumuleres
og hydrolyse av adenosin trifosfat (ATP) skjer i fiskemuskelen i
både levende og i slaktet fisk. Etter slakting kan pH i fisken
synke opp til en 14-dagers periode ved lagring på is. I fordervet
fisk kan pH øke pga produksjon av for eksempel ulike løselige
nitrogenforbindelser og dannelse av flyktige aminer. Det er derfor
ønskelig å kunne måle pH direkte i fisken på
en enkel og mest hygienisk måte.
Ved framstiling av ulike fermenterte fiskeprodukter (som f.eks.
gravlaks og rakfisk) er måling av pH en viktig kvalitetsparameter.
Det var derfor ønskelig å gjøre en lite innledende
studie på måling av pH i kvernet fisk ved bruk av NIR,
og det ble valgt å måle den i sei (Pollachius virens)
og laks (Salmo salar). Seien innholder lite fett (0,3 %),
men har mye av både lys og mørk muskeltyper og er derfor
grå til gråhvit i fargen. Laksen har et høyt
fettinnhold (8-20%) og er rødfarget pga av et høyt
innhold av karatenoider (astaxantin). Fiskeprøver ble kvernet
opp og pH ble justert ved tilsetning av 1M HCl eller NaOH. Det ble
vist at pH i denne kvernende fiskemassen kunne bli bestemt ved en
RMSEP på 0,4 og en korrelasjon koeffisient på 0,90 ved
å bruke NIRSystems 6500. Ved å bruke sju forskjellige
bølgelengder under 1900 nm og Unscrambler (Camo ASA, Norge)
med MSC ("Multiplcative Scatter Correction") and "jack-knifing"
ble RMSEP for pH lavere enn 0,1 og korrelasjons koeffisienten ble
forbedret til 0.99. Noen av de utvalgte bølgelengdene var
i det synelige delen av spekteret (i 600-området).
"Utvikling av modell for online prediksjon av reologi til ett
PEL-produkt v/Borealis AS"
Marit Kleven,Cathrin Pedersen Bråthen, Sven
Ingard Johansen, Høgskolen i Telemark
I forbindelse med produksjon av polymerproduktet
CA8200 ved PEL-fabrikken, Borealis AS (Rønningen), testes
kvaliteten på materialet. Fabrikkens kunder stiller krav til
kvaliteten på produktene de kjøper, spesielt polymerens
flytegenskaper er en viktig kvalitetsparameter. Kvalitets Kontroll-laboratoriet
foretar bl.a. en reologianalyse av produktprøver 8-10 timer
etter prøven er tatt. Det ferske produktet inneholder noe
gass og må derfor "hvile" før det kan analyseres. Resultatet
av reologimålingen er en rekke parametere som beskriver plastens
elastiske og plastiske egenskaper.
Målet med prosjektet har vært å utvikle en online-modell
som predikterer reologien for CA8200 på bakgrunn av prosessparametere.
Hensikten med online-modellen er å kunne antyde reologien
til produktet underveis i produksjonen. Dermed vil det være
mulig å regulere prosessen mot godkjent kvalitet langt tidligere
med dagens prosedyre hvor en må vente mange timer på
resultatene.
I utformingen av online-modellen er det benyttet multivariat dataanalyse
i form av kjemometriske verktøy. Det ble foretatt PCA-analyser
av både reologidata og prosessdata. Scoreverdiene fra PCA-modellen
for reologidataene ble anvendt som referanse(Y) i en PLS-kalibrering
med prosessparametere som X data. Denne ble igjen integrert i et
dataprogram basert på Labview for å kunne brukes online.
For å oppnå en god modell ble det analysert reologi
og selektert prøver til et modellgrunnlag. Prosessparametrenes
påvirkning på reologien ble vurdert. Parametere med
størst innflytelse på reologien danner grunnlag for
modellen.
Det anbefales en rekke korrektive tiltak i forbindelse med Labview-modellen.
I tillegg presenteres et forslag for hvordan modellen kan brukes
for konkretisering av driftsinstruks. Det anbefales at online modellen
blir forbedret ytterligere ved å styrke rådatagrunnlaget.
Anvendelse av bildeanalyse på fiskefileter
Lars H. Stien, Institutt for fiskeri og marinbiologi, UiB
Utviklingen innen data og bildebehandling har ført
til nye metoder for å måle kvalitet innenfor både
matproduksjon og annen industri. Bildebehandling begynner også
å bli vanlig innenfor biologisk forskning. På bakgrunn
av dette har vi startet et prosjekt som skal se på hvordan
bildebehandling kan brukes til å beskrive og klassifisere
fiskefileter. Målet er å utvikle metoder for å
beskrive egenskaper som form, farge, fettinnhold, antall parasitter,
ferskhet og cellevekst. Siden prosjektet er i startfasen, har vi
ikke sett på alle problemstillingene ennå. Hittil har
vi konsentrert oss om form og cellevekst.
Form kan f. eks brukes til å beskrive hvordan en filet trekker
seg sammen under rigor mortis (dødsstivhetsprosessen).
Etter at fisken er slaktet, er rigor mortis og andre reaksjoner
i sammenheng med denne svært viktige for hvordan kvaliteten
til fisken blir. Det er derfor interessant å måle hvordan
ulike eksterne og interne faktorer påvirker rigor-prosessen.
Hvis en filet blir filmet under rigor, er det relativt enkelt
å hente ut informasjon om hvordan formen endrer seg ved hjelp
av bildebehandling. Det er imidlertid også interessant å
måle hvordan ulike deler av fileten endrer seg; trekker f.
eks halen seg mer sammen enn resten av fileten? Hvis det blir plassert
markører bestemte steder på fileten, kan disse brukes
til dette. Under bildebehandlingen vil en da måle hvordan
avstanden mellom markørene endrer seg over tid.
I motsetning til pattedyr utvikler fisk nye muskelceller hele livet.
Når en ny muskelcelle blir dannet, er den liten i forhold
til eldre celler. Forholdet mellom store og små celler sier
derfor noe om hvordan fisken vokser. Det er relativt utbredt å
bruke bildebehandling på muskelceller og det har blitt utviklet
flere program for dette. Disse programmene er ofte helautomatiske
og krever at bildene er regelmessige og av svært god kvalitet.
For slides av fiskemuskler er dette imidlertid ofte ikke tilfelle.
Det har gjerne oppstått skader i sammenheng med snitting,
nedfrysning eller farging. Alternativet har derfor vært å
foreta en manuell bildeanalyse. En bruker da musen til å tegne
rundt hver enkelt celle. Dette er en svært arbeidskrevende
prosess. Målet er derfor å utvikle et program som kan
effektivisere denne manuelle tegningen. Programmet skal være
et såkalt ekspertsystem; det er avhengig av at den som bruker
det tar korrekte avgjørelser. En prototyp for dette programmet
har allerede blitt utviklet. Programmet gir et forslag til hvor
cellegrensene skal gå. Brukeren godkjenner deretter hver enkelt
celle, og legger til cellevegger der disse skulle mangle. Tilslutt
lagres dataene i en database ved å trykke på en knapp.
Når det gjelder de andre problemstillingene, har vi utført
et innlende studium av farge og fettinnhold på laks. Resultatene
fra dette forsøket er lovende. Det var relativt god korrelasjon
mellom en fettprosent målt ved bildeanalyse og den kjemiske
fettprosenten. Bildeanalysen klarte også å skille mellom
fileter av ulik fargekvalitet.
I foredraget vil vi ta for oss noen av algoritmene som blir brukt
under analysen og hvordan disse har blitt utviklet. For hvert bilde
blir det typisk hentet ut flere kvalitetsrelaterte variabler. Disse
variablene kan sammen med variabler fra andre målemetoder
gi ny informasjon om fiskekvalitet. I denne sammenheng er det aktuelt
å bruke multivariate metoder til å håndtere de
store datamengdene.
Bioinformatikk
Dataanalyse
av gen-uttrykk med anvendelse i brystkreft undersøkelser
Eivind Hovig
Tumorbiologisk avdeling, Det Norske Radiumhospital
Fra Lettmajones til Kreftforskning,
en reise fra Kjemometri til Bioinformatikk !!!
Narinder Singh, DiaGenic
AS
Undertegnete har vært
kjent i miljøet som Dr. Majones, og har i de tidligere møtene
fokusert på anvendelser av statistiske/kjemometri metoder
på å løse den gåtefulle verden av kvalitetssikring
av vår kjære mmmMills majones. Men i det siste har jeg
hørt ett nytt og et mer eksotisk kall og begynt å jobbe
innenfor kreftdiagnose basert på genekspresjonsteknologi.
Utvilking av micro- og macroarray baserte metoder for kreftdiagnose
er basert på analyse av ekspresjon av tusener av gener, noe
som stiller store krav til dataanalytiske metoder. Her bør
det bemerkes at den siste setning er klippet og limet inn fra en
artikkel som undertegnete skrev i forbindelse med innføring
og bruk av NIR spektroskopi prosessovervåking i næringsmiddelprosesser.
Forskjellen ligger i erstatning av ordene NIR spektroskopi med macroarry
baserte medoder, prosessovervåking med kreftdiagnose, og tusener
av bølgelengder med tusener av gener. Fordraget vil belyse
likheter mellom de tradisjonelle problemstillinger og løsninger
innenfor kjemometri, og den mere "eksotiske" bioinformatikk verden.
Jeg vil i dette foredraget gi en kort presentasjon av datanalytiske
problemer forbundet med micro- og macroarray metoder, og noen forslag
på løsning av disse problemer. Hovedfokus dog vil være
på anvendelse av metoder utviklet innenfor statistikk/kjemometri
på kreftdiagnose.
|