www.kjemometri.org/Nyheter/Sammendragene 2003
Nyheter


Faggruppe for kjemometri

|
|
|
|
|
| | | |  

     

Flere sider:

Symposium 2007
Sammendrag symposium 2006
Generalforsamling 2006
Årsmelding 2005
Sammendrag symposium 2005
Ref. fra generalforsamling 2004
Reisebrev fra Åland, SSC8
Ref. fra generalforsamling 2003
Sammendrag symposium 2003
Reisebrev fra Australia
Sammendrag symposiumet 2002
Ref. fra generalforsamling 2002
Årsmelding 2001
Ref. fra general- forsamlingen 2001
Årsmelding 2000
Sammendrag symposium 2001
Ref. fra general- forsamlingen 2000
Besøk i Russland

 

Kontakt oss:

- for å bli medlem
- for å få mer informasjon

Postadresse:

Norsk Kjemisk Selskaps Faggruppe for Kjemometri
c/o Martin Høy Matforsk Osloveien 1430 Ås


Oppdatert 23.05.2007
kjemometri [Q] kjemometri.org

Her er de antatte innleggene til det 15 Norske kjemometrisymposium, Ål 17-19 mars, 2003

Rekkefølgen følger ikke programmet. Opplev dette i levende live!

Kjemometri ved NTNU

Kjemometrigruppen ved NTNU

Bjørn K. Alsberg

The NTNU Chemometrics Group (NCG) har to hovedsatsingsområder hvor både utvikling og bruk av kjemometriske metoder står sentralt:

  • funksjonell genomforskning (FUGE)
  • struktur-aktivitets relasjoner og drug design

Innenfor FUGE jobber vi spesielt mot to instrumentelle teknikker: Mikromatriser og proteomikk geler. Mikromatriser brukes for å se i hvilken grad ulike gener er slått på eller av i en organsime under ulike forhold. En typisk problemstilling for våre samarbeidspartnere er å kunne finne en sammenheng mellom mikromatrisemønstre og kreft. Men mikromatriseteknologien er svært ny og den har flere problemer. Spesielt gjelder dette støy, ulinære effekter og manglende data. Vi jobber mot slike problemer og har prosjekter igang som spesifikt relateres til variabelseleksjon, estimering eller håndtering av manglende data og instrumentsimulering. For variabelseleksjon arbeider vi bl.a. med dobbel jack knife PLS og GOLPE. For manglende data ser vi på muligheten av å bruke en maksimum entropi basert metode.

Innenfor proteomikk har vi konsentrert oss i hovedsak om ett sentralt problem: Å finne sammenliknbare protein-punkter mellom ulike geler. Til dette bruker vi scale space teori hvor bifurkasjonsmønsteret over skala danner basis for sammenlikning.

Innenfor struktur-aktivitet og drug design fokuseres det spesielt på hvordan 3-D strukturen av molekyler best kan representeres. Det er spesielt utfordrende å finne en god representasjon av den 3-D elektroniske struktur og for dette har vi laget en metode (structure representation using quantum topology, StruQT) som baserer seg på Richard Baders Atoms in Molecules teori. Fra denne teorien danner de kritiske punktene, dvs. punktene i rommet der gradient vektorene blir null i det skalare feltet (f.eks. elektrontettheten), utgangspunkt for en strukturerepresentasjon. Et annet viktig problem tilknyttet dette fagfeltet er å finne sammenliknbare strukturerer mellom ulike molekyler. Som en løsning på dette problemet arbeides det bl.a. med å gjøre bruk av en kunstig intelligens metode som kalles inductive logic programming (ILP).

 Zherlock: Et dataanalyseverktøy for kjemometri

Bjørn K. Alsberg

Zherlock er en open source programpakke for dataanalyse og kjemometri. Hensikten med programmet er å gi det akademiske miljøet et verktøy som gjør det enkelt og raskt å implementere nye kjemometriske metoder, er intuitivt å bruke og som benytter avansert 2-D og 3-D grafikk. Svært lite av dataanalysen foregår inne i selve Zherlock programmet. Istedet kaller det på eksterne programmer som utfører beregningene og returnerer resultatene til Zherlock. Typiske eksempler på slike eksterne programmer er Octave/Matlab, SciLab eller R/S-PLUS. Grunnen til dette er at slike programmer bruker høynivåspråk som gjør det enkelt og raskt å utvikle nye algoritmer. Men Zherlock vil også tillate kopling til enkeltstående programmer skrevet i mer tradisjonelle dataspåk som C/C++, Fortran og Java. Av spesiell interesse for oss er å kople Matlab klonen Octave til Zherlock. Men det arbeides også med å få en kopling mot R som har stor utbredelse innen statistikkmiljøet. Ved å kople Zherlock til slike høynivåspråk kan man enkelt gjøre seg nytte av et stort antall eksisterende metoder. Den brukervennlige presentasjonen og interaksjonen tar selve Zherlock programmet seg av. Av sentral betydning i denne sammenheng er et visuelt programmeringsmiljø som er gitt navnet "Doodler". I Doodleren kan brukeren lage programmer på et høyt nivå ved å tegne grafer der noder representerer ulike metoder og lenker representerer overføring av data mellom metodene. Andre programmer som bygger på samme prinsipp er SIMULINK i Matlab, Cantata i Khoros eller Viper.

 

Octave: Et alternativ til Matlab?

Bjørn K. Alsberg

Matlab har blitt en standard innen kjemometrimiljøet. Dette programmet er uten tvil et meget kraftig og nyttig verktøy for fagfeltet der kompliserte algoritmer på en rask måte kan utvikles og testes ut. Men det er en skyggeside til Matlab: Den baserer seg på et kommersielt dataspråk der brukerne har dannet seg et meget sterkt avhengighetsforhold til ett enkelt firma, MathWorks. Å velge seg vekk fra Matlab blir svært vanskelig for brukeren som har investert mye tid og penger på å utvikle programmer i dette språket. Brukerene har derfor lite kontroll over egen teknologi og dette er en uheldig situasjon for et akademisk miljø. Spørsmålet blir derfor om det finnes et open source alternativ der en Matlab brukere uten problemer kan kjøre sine gamle m-filer? Det beste alternativet pr. idag er Octave (www.octave.org) som er laget av Dr. John W. Eaton ved University of Wisconsin-Madison. Men dessverre har dette programmet en funksjonalitet som ikke er den samme som Matlab. Octave mangler bl.a. Handle Graphics, multidimensjonale tabeller og objektorientering. For å kunne rette på denne situasjonen arbeider vår gruppe med å hjelpe til med Octave utviklingen. Av spesiell interesse er å gjøre plottingen i Octave mye bedre. Som løsning vurderes Visual Toolkit (VTK) og det norske Coin som bibliotekter for 3-D grafikk. Her vil det være mulig å kunne utvide funksjonaliteten i 3-D interaksjonen sammenliknet med hva som finnes tilgjengelig idag i versjon 6 av Matlab. I Matlab er sanntids rotasjon og manipulering av avanserte 3-D modeller ikke tilgjengelig, men for både VTK, Coin og OpenInventor er dette mulig uten problemer. For 2-D grafikk og grafisk brukergrensesnitt er det norske Trolltechs Qt bibliotek svært relevant. Qt blir brukt i vårt dataanalyseprogram Zherlock og er også fundamentet for vindusystemet KDE under Linux.

 

- Signal/kurvetilpassing

Dekonvolusjon av spektre ved bruk av maksimum entropi

Bård Buttingsrud og Bjørn K. Alsberg

Overlapping av ulike topper i et spektrum er et velkjent problem innenfor den analytiske kjemien. Siden dette kan medføre regioner i et spektrum med brede, overlappende topper der det ikke er mulig å fortolke hver enkel topp, blir kvaliteten på måledataene forverret. Dette skyldes at hver enkel topp blir konvolvert, og nærliggende topper kan dermed overlappe hverandre. Flere ulike dekonvolusjonsmetoder har blitt utviklet i literaturen, men de har ofte problemer ved heteroskedastisk støy.
En alternativ metode har blitt utviklet basert på prinsippet om maksimering av entropien til dataene. Metoden kan anvendes på problemer der det er flere løsninger konsistente med dataene. Dekonvolusjon av spektre oppfyller ofte dette kravet grunnet moderate eller større mengder støy i spektrene.
Maksimum entropi metoden fungerer konsepsjonelt anderledes enn andre metoder for dekonvolusjon. I stedet for å bruke de observerte dataene direkte til å gjøre slutninger om et underliggende spektrum, dannes det mange kandidatspektre. Deretter benyttes kunnskap om konvolusjonsfunksjonen til å rekonstruere dataene, og en sammenlikning mellom observerte og rekonstruerte data utføres. Mange underliggende spektre vil kunne forklare datene innenfor et angitt støynivå, og løsninger som tillegger dataene minst struktur vil bli valgt. Denne metoden tillater en implisitt håndtering av støy som behandler heteroskedastisk støy på lik måte som homoskedastisk støy. Ingen preprosesseringsmetode for å transformere heteroskedastisk støy til homoskedastisk støy er nødvendig.
En maksimum entropi algoritme som opprinnelig ble utviklet for å bedre kvaliteten på bilder, har blitt implementert og modifisert for å utføre dekonvolusjonen.

Ny "Funnel" metode for å estimere funksjonsparametre i ulineær kurvetilpasning av spektra

Morten Beck Rye Veil. B. K. Alsberg

Spektra blir ofte representert som absorbanser ved ulike bølgelengder. En alternativ måte å representere spektra på er å bruke en ulineær kurvetilpasning av dataene, istedenfor de individuelle datapunkter ("Sampling Point Representation", SPR). Den nye representasjonen er basert på estimering av Gaussiske og Lorentzianske kurveparametre, og er en såkalt "Peak Parameter Representation", PPR.
Den viktigste fordelen med PPR, er at den kan håndtere fenomen som skift i spektra, som ellers er et stort problem i multivariat modellering. Problemet med PPR er hvordan man skal estimere disse parametrene, og hvor mange topper man skal inkludere i dataprofilen. De estimerte parametrene ofte er ustabile, og sensitive til eksempelvis fenomen av typen skift.
Vi foreslår her en ny "Funnel" metode for bruk til denne type parameter-estimering. Målet er at denne metoden skal øke robustheten til disse parametrene, og dermed skape mer stabile modeller. Funnel metoden baserer seg på såkalt "Scale-Space" teori hentet fra billedanalyse. Tanken bak "Scale-Space" er at den ulineære kurvetilpasningen foregår over ulike skalaer. Ved den høyeste skalaen (lavest detaljnivå) har vi en kurve med kun en topp. Ettersom skalaen minker (høyere detaljnivå) vil antall tilpassede topper øke. Ved hver skala estimeres kurveparametrene. En slik parameter kan for eksempel være posisjonen til en topp. Funnel-metoden vil prøve å finne parametre som er stabile over flere skalaer, og slik øke robustheten av estimatene. Det er vanlig å visualisere Scale-Space med bifurkasjonstrær. Ved å sammenligne strukturen i slike trær, er det mulig å finne sammenlignabare områder som er mindre sensitive til skift og lignende forstyrrelser enn en normal SPR.

 

- Validering og variabelseleksjon

Validering av modeller og variabelseleksjon

Endre Anderssen, Knut Dyrstad, Harald Martens

Innen områder som QSAR, bildeanalyse, funksjonell genomforskning og andre grener av kjemometri, har en ofte X matriser med mange variable og samtidig få prøver tilgjengelig. Både for å forenkle tolkning og for å forbedre prediksjon ønsker en ofte å fjerne unyttige variable fra modelleringen. Denne formen for modell utvikling innebærer dessverre en betydelig mulighet for overtilpassning av modellen. Overtilpassning har vært velkjent mye diskutert i forbindelse med bruk av for mange komponenter o.l., men problemene rundt modellutvikling har ikke vært diskutert like mye. En metode basert på dobbel kryssvalidering blir presentert som kan gi ‘sikker’ validering av optimaliserte modeller samtidig med modellutvikling uten å bruke et eksternt test sett.

Kjemometriske metoder for variabelseleksjon på mikromatrisedata

Lars Gidskehaug* og Bjørn Kåre Alsberg

Norges teknisk-naturvitenskapelige universitet, Institutt for Kjemi, N-7491 TRONDHEIM, Norway

Funksjonell genomforskning tar for seg kartlegging av arvemassen til organismer, og sammenligning av DNA-sekvenser gjør det mulig å studere genetisk variasjon både innen arter og på tvers av artsgrenser. Kvantitativ analyse av genuttrykk (gene expressions) gjør det mulig å finne gener involvert i spesifikke fysiologiske prosesser. F.eks. kan gener involvert i komplekse sykdommer identifiseres ved hjelp av sammenligninger mellom sykt vev og normalvev hos mennesket.

DNA mikromatrise-teknologi kan benyttes til å finne ekspresjonsmønsteret til et stort antall gener samtidig. Et anslag for celleprøvers genuttrykk finnes ved å hybridisere prøvene til kjente gener, og måle aktiviteten til de forskjellige genene. Det vil alltid være et stort antall gener som ikke er uttrykt, og det ligger en utfordring i å finne effektive og pålitelige metoder for å eliminere uinteressante gener (variable) fra den påfølgende analysen.

Kjemometriske metoder er velegnet for denne type variabelseleksjon. Et godt utgangspunkt for analysen kan være Diskriminant PLS (DPLS)(1), hvor et utvalg av celleprøver kan klassifiseres med hensyn på f.eks. vevstype. Nye valideringsmetoder tas i bruk for å identifisere og fjerne inaktive gener, da disse introduserer støy i modellene. Som eksempel på egnede valideringsmetoder kan nevnes cross-model validation (CMV) og double jack-knifing (DJR)(2). Forskjellige metoder er testet for klassifisering av krefttyper ved bruk av et allment tilgjengelig datasett(3).

Referanser:

  1. Martens, H. og Martens, M.; Multivariate Analysis of quality: An introduction. Wiley, Chichester, UK, 2001
  2. Anderssen, E., Dyrstad, K. og Marens, H.; Reducing over-optimism in variable selection by double jack-knifing. Submitted to J. Chemometrics
  3. Ross, D.T. et al; Systematic variation in gene expression patterns in human cancer cell lines (2000). Nat. Genetics, 24, 227-235
  4.  

     - Bioinformatikk

    Design av selektive inhibitorer for proteiner

    Kristin Tøndel a , Endre Anderssen b og Finn Drabløs b

    aInstitutt for kjemi, Norges teknisk naturvitenskapelige universitet, Sem Sælands v. 14, N-7491 Trondheim

    bSINTEF Unimed MR-senter, N-7465 Trondheim

    Vi har utviklet metoder som kan utnyttes i design av selektive inhibitorer for proteiner. Disse metodene benytter en kombinasjon av beregningskjemi og kjemometri. For å oppnå selektivitet, må man identifisere egenskaper som skiller forskjellige proteiner fra hverandre. Dette gjøres ved å kartlegge egenskapene til proteinenes aktive seter. Ved kjemometrisk analyse av disse dataene kan vi predikere egenskaper for et molekyl som binder selektivt til et gitt protein. Vi har anvendt disse metodene i design av selektive inhibitorer for protein kinaser. Protein kinaser bidrar til regulering og koordinering av f.eks. metabolisme, gen-ekspresjon, celle-vekst og celle-deling. Disse proteinene er også viktige for vekst og spredning av kreft-celler. Det er derfor viktig å kunne designe inhibitorer som er selektive for de protein kinasene som inngår i patologiske tilstander, slik at de normale biologiske prosessene påvirkes minst mulig ved en medisinering.

    AUTOMATISK KONSTRUKSJON AV POTENSIELLE TRANSISJONSANALOGER

    Torbjørn Lindahl og Bjørn K. Alsberg

    Transisjonsanaloger (TA) er forbindelser som har en struktur som er lik transisjonstilstanden (TS) for en gitt reaksjon. Slike forbindelser blir ofte brukt som enzyminhibitorer og har stor viktighet innenfor farmasøytisk industri. TS strukturen kan beregnes ved bruk av kvantekjemiske metoder, men problemet er å generere stabile strukturer som likner. I denne studien blir genetiske algoritmer brukt på SMILES (Simplified Molecular Input Line Entry Specification) representasjoner av molekylers strukturer. SMILES gjør bruk av en strengbasert representasjon av molekylers struktur og er derfor ypperlig egnet for genetiske algoritmer. For hvert molekyl (individ) i en populasjon beregnes en stabil struktur ved hjelp av molekylmekanikk. Strukturene kan også underkastes semi-empiriske metoder som AM1, PM3, MNDO eller ab inito metoder, men dette vil begrenses av tilgjengelig datakraft. Skikkethetsverdien (fitness value) for et individ (molekyl) beregnes ut fra hvor likt det er TS strukturen. GA vil finne molekyler som har en optimal "fitness value" og disse vil være gode TA kandidater.

    Ny kunnskap fra simulering av mikromatrise data

    Arnar Flatberg *, Bjørn K. Alsberg*

    * Norges teknisk naturvitenskapelige universitet, NTNU, Institutt for kjemi, seksjon for fysikalsk kjemi, Sem Sælands veg 14, Trondheim

    DNA mikromatrise (microarray) er en metode som gir oss muligheten til en helhetlig forståelse av biologiske prosesser i levende organismer ved parallell avlesning av genutrykksdata for titusener av gener. Gener med samme funksjon synes å gi like uttrykksmønstre, men biologisk tolkning av 30 000 – 50 000 gener krever multivariate data-analyse.
    Det vitenskapelige fokus for mikromatriser er ofte på multivariate klassifiserings teknikker og kilder til variasjon i mikromatrise-data. Simuleringer kan gi verdiful informasjon om data variasjon som er vanskelig tilgjengelig pga. dyre eksperimenter og ukjente sanne relajoner.
    Vi foreslår her instrument simulering som et viktig verktøy til analyse og pre- prosessering av data i funksjonell genomikk. Simuleringene vil være basert på både mekanistiske såvel som stokastiske modeller for det gjeldende instrumentet.
    Det er lagt hovedvekt på analysemetodene mikromatriser og to-dimensjonal eletroforese, gjennom et tett samarbeid med lokal operatør ekspertise fra biomedisinsk teknisk senter ved NTNU.

    Gjennom dette prosjektet håper vi å få:

  5. Lage realistiske mikromatrise data, som kan brukes til å teste nye algoritmer innen signal analyse og kjemometri.
  6. Lage detaljerte matematiske modeller som kan hjelpe til forsåelse av underliggende signal/støy fenomen.
  7. Kalibrere og/eller utvikle ny apparatur og lab-protokoller.
  8. Bruke simulerings data som a priori informasjon i pre-prosessering s- og billed analyse-metoder.
  9. Lage et verktøy som kan underbygge undervisningen ved universitetet.

 

Kjemometriske modelleringsplattformer

Web-basert dataekstraksjon og modellering

av Terje V. Karstang og Rune Mathisen, Borealis

For å forenkle tilgangen til historiske data, sanntidsdata, modeller og modelleringsverktøy har det ved Borealis blitt utviklet en web-basert modelleringsplatform.
Platformen er basert på fri programvare (Apache, PHP, mySQL og Borland C++) og kjører på Windows og Unix maskiner. Historiske data hentes og sammenkobles fra forskjellige databaser og rådatafiler. Disse dataene sammenstilles slik at modelleringen kan startes direkte på filer generert fra søkeresultatene. Alle modeller blir også gjort tilgjengelige. Det er også interface mot flere fabrikkdatabaser som gjør det enkelt å teste ut nye modeller mot fabrikkdata så snart en modell er etablert.
Platformen inneholder programmer for de aller fleste kjente kjemometriske forbehandlinger, dekomponeringsmetoder, optimaliseringer og plot. Det er også implementert metoder for forsøkplanlegging og identifisering av dynamiske systemer. I tillegg inneholder platformen harde modeller som er spesifike for polyolefiner. Platformen vil bli utvidet til å håndtere modeller fra andre modelleringsverktøy (Excel, Aspen....) i tillegg skal modellene linkes slik at utganger fra en modell kan benyttes som innganger i neste modell.

Kjemometriske metoder

Kryssvalidert MSEP: Myter eller fakta?

Bjørn-Helge Mevik, MATFORSK

MSEP (Mean Squared Error of Prediction) brukes ofte som mål på hvor god en regresjon er. Den brukes også til å velge det optimale antall komponenter i PCR (Principal Component Regression) og PLSR (Partial Least Squares Regression). Når man ikke har nok data til å sette av et (stort nok) testsett, må man estimere MSEP fra treningsdataene. Full kryssvalidering (leave-one-out cross-validation) er kanskje det mest brukte interne estimatet. Det er nærmest forventingsrett, og er lett å implementere og forstå. Det har imidlertid blitt kritisert for å være variabelt, og derfor ikke konsistent til variabelselekson. Alternative estimater, oftest basert på k-veis kryssvalidering (k-fold cross-validation) eller bootstrap, har blitt fremsatt for å redusere denne variabiliteten. De fleste teoretiske resultater om disse estimatene er utledet under antagelsen at det er få variabler sammenlignet med antall prøver. Det samme gjelder de fleste empiriske undersøkelsene. Er disse resultatene gyldige for regresjoner som PLSR og PCR? I dette foredraget vil jeg presentere resultater fra simuleringer på reelle, spektroskopiske data, hvor flere ulike MSEP-estimater sammenlignes: full kryssvalidering, k-veis og justert k-veis kryssvalidering, samt en del bootstrap-estimater. Jeg vil også argumentere for at «sannheten» om at k-veis kryssvalidering er mindre variabel enn full kryssvalidering ikke nødvendigvis er sann for PLSR og PCR. Resultatene tyder på at noen av alternativene, f.eks. «0.632» bootstrap-estimatet, kan ha mindre varians enn full kryssvalidering, uten å bli nevneverdig forventnigsskjeve. Den justerte k-veis kryssvalideringen kan også være en god kandidat, fordi den krever så få beregninger sammenlignet med de andre estimatene.

Andre ordens kalibrering

Åsmund Rinnan, KVL

Andre ordens kalibrering er interessant fordi det gir nye muligheter for å lage kalibrerings-modeller selv når man ikke har adgang til kalibreringsprøver som ikke direkte representerer de nye prøvene man ønsker å predikere.
Dagens utvikling av instrumenter fører til at det er mulig å oppta kompleks informasjon, som bedre kan forklare den multivariate virkeligheten som undersøkes. I de siste årene har data fra analytiske instrumenter endret seg fra univariate signaler (et enkelt tall for en enkelt måling, for eksempel en pH måling; en vektor for et sett med prøver), til to-veis data (en vektor for en enkelt prøve, for eksempel NIR spektra; en matrise for et sett med prøver), og videre til multi-veis data (en matrise for en enkelt prøve, for eksempel fluoressens emisjons-eksitasjons landskap; en tre-veis matrise for et sett med prøver).
I denne sammenheng har interessen for andre ordens kalibrering og bruken av den såkalte andre ordens fordelen økt. OLS (Ordinary Least Squares) eller MLR (Multivariate Linear Regression) på skårene fra PARAFAC (PARallel FACtor analysis) er en metode som tar i bruk denne fordelen. Under dette foredraget vil det bli forklart hva den andre ordens fordelen er, hvordan den fungerer, og vise hva forskjellen i prediksjonen blir ved bruk av PARAFAC kontra PCR, PLS eller N-PLS.

 

Separasjon av fysikk og kjemi i diffus spektroskopiHarald Martens1,2,3,4, Jesper Pram Nielsen1, Michael Bom Frøst1, Morten Beck Rye2, Xuxin Lai3 and Achim Kohler4
1. KVL/MLI, DK-1958 Frederiksberg, Danmark,
2.NTNU/Kjemisk inst., 7034 Trondheim
3.DTU/Biocentrum, DK-2800 Lyngby, Danmark.
4.Matforsk, 1432 Ås
Harald.Martens@mail.tele.dk

Spektrale variasjoner i NIR osv som skyldes fysikk, og ikke kjemi, f.eks. fra variasjoner i lysspredning, prøvetykkelse, instrument geometri, temperatur osv, kan forårsake selektivitetsproblemer i kvantitativ kjemisk analyse.
Takket være dagens teknikker for spektral pre-prosessering og multivariat kalibrering, kan disse fysiske selektivitetsproblemene vanligvis bli redusert, om enn ikke helt eliminert. Men det er økonomisk belastende, og intellektuelt utilfredsstillende, å skulle måtte bruke massevis av empiriske data for å separere fysiske og kjemiske effekter i de målte spektrene, spesielt hvis man ikke lærer et dugg av det selv. Hvis man kunne utvikle en mer vellykket fysikalsk pre-prosesseringsteknikk for denne type data, skulle man kunne forvente forbedret selektivitet og en høyere akademisk aksept av diffus spektroskopi (f.eks. NIR).
Foredraget vil forklare og demonstrere teknikken Extended Multiplicative Signal Correction (EMSC) og dens inverse (EISC), for model-basert pre-prosessering av vis. og NIR transmittans- and reflektans-spektra. Disse generelle metodene, slik de er implementert i Matlab, tillater brukeren å anvende kvalitative og kvantitative for-kunnskaper av fysisk og kjemisk natur, til å modellere og derved korrigere for forskjellige interferens-typer.

Forsøksdesign

 

Effekt av fôrsammensetning og fôringsregime på vekst, fôrutnyttelse og næringsmiddelretensjon i Torsk (Gadus Morhua).

Grethe Rosenlund 3, Kristoffer Tveit 3, Ørjan Karlsen 2 og Gro-Ingunn Hemre 1

1 Fiskeridirektoratets ernæringsinstituttet, Bergen
2 Austevoll havbruksstasjon, Austevoll
3 Nutreco Aquaculture Research Centre, Stavanger

Torsk ble fôret 11 ulike dietter over en periode på 28 uker. Det ble brukt et mixture design med fôrsammentning som variable. Fôrets innhold av protein, fett og stivelse varierte mellom 36-66%, 8-28% og 8-18%. I tillegg ble det brukt to ulike fôringsregimer; fôring til metthet hver dag eller hver annen dag. Forsøket ble gjennomført i sirkulære kar (1700L) med sjøvann på 8°C. Alle hadde fôrspilloppsamlere for registrering av mengde fôr spist. Fisken ble veiet 5 ganger, ca hver 6. uke, og fisk ble tatt ut til analyse ved start, etter 12 uker og ved slutten av forsøket.
Målet med forsøket var å bestemme effekten av fôrsammensetning på vekst, fôrutnyttelse og retensjon av næringstoffer og energi i torsk. Det ble spesielt lagt vekt på å bestemme eventuell sammenheng mellom fôrsammensetning og fiskens lever indeks. I tidligere forsøk er det rapportert om en positiv effekt på fôrutnyttelse og lever indeks i torsk ved redusere fôringshyppighet. Derfor ble også fôringsregime tatt med som en ekstra variabel i foreliggende forsøksoppsett.
Fisken vokste fra en gjennomsnittlig vekt på 192g til 820g i løpet av forsøksperioden. Fôringsregime hadde ingen effekt hverken på vekst, fôrutnyttelse eller leverindeks. Det ble funnet relativt små forskjeller i vekst, men det laveste nivået av protein dekket ikke behovet til vekst og resulterte også i forhøyete nivå av blodsukker. Spesifikk vekstrate, fôrutnyttelse og leverindeks var alle påvirket av fôrsammensetning.

UTVIKLING AV PRODUKSJONSPROSESS FOR PEPTIDBASERT RADIOFARMASØYTISK PRODUKT

Solveig Pedersen, Kathrin Bjerknes, Carina Wickmann, Knut Dyrstad

Amersham Health AS, Oslo, Norge

Kjemisk ustabilitet er en utfordring ved framstilling av peptidbaserte legemidler. Et målstyrende radiofarmasøytisk legemiddel kan bestå av en peptid- og en chelatorenhet. Valg av riktig produksjonsprosess er ønskelig for å stabilisere de fysikalsk-kjemiske egenskapene.
Formålet med studiet var å kartlegge den kjemiske stabiliteten til et peptidbasert radiofarmasøytisk legemiddel i vandig løsning, for dermed kunne definere akseptable prosess- og produksjonsbetingelser med tanke på oppskalering av produktet.
Prosesstemperatur, produksjonstid og pH ble ansett som kritiske faktorer for stabiliteten av det peptidbaserte legemiddelet i vandig løsning. Effekten av pH (8,4 – 9,8) og temperatur (5, 15 og 25ºC) ble undersøkt ved hjelp av et flernivåers, fullt faktorielt design. Prøver ble analysert ved jevne mellomrom i perioden 0-26 timer etter tilberedning. Responser var endring i pH og degradering av det peptidbaserte legemiddelet målt ved HPLC.
En regresjonsmodell ble benyttet til å predikere grad av degradering ved ulike betingelser innenfor rammen av modellen og dermed angi valg av produksjonsbetingelser.

 

Metodeutvikling i PLS-modellering

Kompresjon til to-komponent PLS-faktoriseringer – med applikasjoner
av
Rolf Ergon
Høgskolen i Telemark

Inspirert av artikler om OSC (orthogonal signal correction) har jeg nylig vist at alle PLS-prediktorer for en skalar respons (PLS1 med én y-variabel) helt uavhengig av antall komponenter kan komprimeres til bare to komponenter [1]. Poenget med OSC er egentlig å fjerne y-ortogonale variasjoner i X-matrisa før en foretar en regresjon mot responsvektoren y, men det mest vesentlige resultatet ser likevel ut til å være reduksjonen av antall komponenter. De ulike OSC-algoritmene er noe innfløkte, og de gir litt ulike resultater [2], til dels ulike prediktorer. Min nye komprimering til to komponenter er til gjengjeld direkte og meget enkel, og den gir en helt uforandret prediktor. Poenget er altså å forenkle modellen slik at fortolkningen blir enklere. Med bare to komponenter er det nok å se på ett skårplott og ett ladningsplott, eventuelt samlet i et biplott. To-komponent-løsningen er også mer y-relevant, fordi mer av den strukturerte men y-ortogonale variasjonen i X blir fanget i residualene.
Utgangspunktet for to-komponent-algoritmen kan altså være en PLS-løsning med mange komponenter. Men det kan også være en PCR-løsning eller resultatet av en ridge-regresjon, eller tom. en minste-kvadrat-løsning. Alle prediktorer for en skalar respons kan altså uttrykkes som en to-komponent PLS-løsning, med de greie grafiske fortolkningsmulighetene som det gir.
Til tross for at algoritmen er svært enkel, er det ikke så greit å vise at dette stemmer rent teoretisk (det er lett å vise ved å bruke for eksempel Matlab på ulike datasett). Den teoretiske siden av dette ar altså noe teknisk, og den egner seg ikke for en muntlig presentasjon (de interesserte får se i [1] når den forhåpentligvis kommer på trykk). Isteden vil jeg bruke grafiske fremstillinger både for å begrunne og beskrive algoritmen, og for å beskrive den grunnleggende to-komponent-løsningen og et par nyttige transformasjoner av denne.
Jeg vil også vise noen resultater mht. estimering av spektra [1] og prosessovervåking vha. korrespondanse mellom skår- og ladningsplott (biplott) [3].

[1] R. Ergon, Compression into two-component PLS factorizations, submitted to Journal of Chemometrics, 2002

[2] O. Svensson, T. Kourti and J.F. MacGregor, An investigation of orthogonal signal correction algorithms and their characteristics, J Chemometrics 2002, 16: 176-188

[3] R. Ergon, Informative PLS score-loading plots for process monitoring, submitted to Journal of Process Control, 2002.

 

Tittel: Ulineær PLS.

Foredragsholder: Per Anker Hassel, Borealis PO R&T, avd. for Modellering og Simulering

Presentasjonen er del av doktorgradsarbeid utført ved University of Newcastle upon Tyne

Sammendrag:
I prosessindustrien kommer vi ofte over ulineære sammenhenger.Vanligvis kan enkle transformasjoner linearisere dataene slik at PLS og andre lineære metoder kan brukes direkte. Men noen ganger er ikke sammenhengene opplagte og vi må ty til andre metoder. Et slikt tilfelle førte til en undersøkelse av ulineære PLS metoder.Siden eksisterende metoder hadde mangler og ikke viste seg å være effektive for å løse problemet ble to nye ulineære PLS modeller utviklet. Den ene ble presentert på SSC 7, den andre ønsker jeg å presentere her i dag. Målsetningen var å finne en generell ulineær PLS som kan brukes for situasjoner med varierende korrelasjon mellom variablene og for alle matrise dimensjoner. I ulineær PLS erstattes den lineære sammenhengen mellom de latente variablene t og u, med en ulineær funksjon. Det viser seg at vi ikke kan konstruere en ulineær PLS direkte fra lineær PLS. Dette fordi at det å tilpasse en ulineær funksjon er vanskeligere og kan gi store feil. Denne feilen vil følge med når neste par av latente variable skal tilpasses og vil normalt ikke være mulig å modellere. På bakgrunn av disse betraktningene ble en ny ulineær PLS modell utviklet: Nested PLS. Her blir hvert par av latente variable, t og u, oppdatert i en iterative optimalisering basert på en første ordens Taylor approksimasjon. Denne løses ved bruk av en indre lineær PLS hvor antall latente variable er bestemt ved hjelp av kryssvalidering. Det gjør at den underliggende struktur blir bedre representert av de latente variablene og reduserer dermed feilen når den ulineær funksjonen blir tilpasset. Faren er muligheten for overtilpasning.

Per Anker Hassel
Modelling & Simulation Group Borealis AS

e-mail: per.hassel@borealisgroup.com

phone: int.: (216) 8055

ext.: (+47) 3557 8055

fax: ext.: (+47) 3557 7055

web: http://www.borealisgroup.com/

Quidquid latine dictum sit, altum sonatur

 

Flervariabel metodologi og strategiske valg

Development of Organic syntheses, processes and reactions by means of multivariate methodology pdf
Hans-René Bjørsvik, Kjemisk institutt, Universitetet i Bergen

 

Anskaffelse av analyseverktøy for styring av produktkvalitet -
Kundens krav til leverandør

Knut Iversen, Borealis

Innlegget bygger på erfaringer fra et reellt case fra Borealis - hvor følgende hovedpunkter vektlegges:

  • Valg av anskaffelsesprosess
  • Hvilke elementer bør man ha vurdert før man går inn i anskaffelsesprosessen?
  • Finnes det standardløsninger eller må man skreddersy prosessen for det enkelte tilfellet ?
  • Viktigheten av en klar behovsbeskrivelse
  • Hvordan beholde behovsbeskrivelsen som et levende dokument gjennom prosessen?
  • Anskaffelsesstrategi

- Hva er en anskaffelsesstrategi?

- Hvilke elementer bør inngå (bør man ha tatt hensyn til) i en anskaffelsesstrategi?

  • Partnerskap

- Fordeler og ulemper med partnerskap i anskaffelsesprosessen

- Hva bør man være klar over?

  • "Hva ville vi gjort annerledes hvis vi startet idag ?"

- Erfaringsdeling hvor viktige punkter vektlegges.

 

Kjemometriske anvendelser

Prinsipal komponent analyse av HR MAS MR spekter fra hjerne autopsier

Tone F. Bathen, Beathe Sitter, Anna-Maija Häkkinen, Ingrid S. Gribbestad

Neuronal ceroid-fuscinose (NCL) er en gruppe hjernesykdommer som rammer barn, og leder til psykomotoriske forstyrrelser, epilepsi og tidlig død. Infantil NCL (INLC) er en raskt progressiv sykdom med nesten fullstendig tap av nevroner og forventet levealder på ca. 10 år mens juvenil NCL (JNCL) forbindes med et moderat tap av nevroner og forventet levealder på ca. 35 år. I dette studiet ble hjerneautopsier analysert ved HR MAS 1H MRS og PCA for å undersøke om dette kunne avsløre ukjente metabolske abnormiteter i NCL. Autopsier fra pasienter med INCL (n=9), JNCL (n=6) og kontroller (n=9) uten påviste nevrologiske skader ble oppbevart ved -80° C inntil MR analyse. HR MAS MR spekter av representative prøver fra en kontroll og en INCL-pasient er vist i Figur 1. PC1 og PC2 beskriver til sammen 68% av den totale variasjonen, og som vist i Figur 2 er INCL prøvene lineært separert fra JNCL og kontroll-prøvene. Ladningsprofilen av PC1 viser at autopsiene fra INCL pasientene har økte inositol og glycerophosphocholin-konsentrasjoner, i tillegg til lavere mengder kreatin, glutamin, glutamat, GABA, NAA og acetat i forhold til JNCL og kontroll-prøver. PCA viste også at INCL har lavere fettsyre-metylen/metyl-ratio, noe som indikerer at fettsyrer i disse autopsiene har kortere kjedelengde eller høyere grad av umettethet. Konklusjon: PCA førte til klassifisering av INCL basert på HR MAS MR spektra av autopsier, og bidrar til å beskrive de ulike metabolske profilene. Resultatene kan være nyttig for fremtidig diagnostikk med bruk av in vivo spektroskopi.

 

Bestemmelse av pH i kvernet laks og sei ved bruk av nærinfrarød spektroskopi

Berit Nordvi, TINE BA, Postboks 7 Kalbakken, 0902 Oslo
Bjørg Narum Nilsen, MATFORSK, 1430 Ås
Erik Slinde, Havforskningsinstituttet, Postboks 1870 Nordnes, 5817 Bergen

Nøkkelord: Nær infrarød spektroskopi, fisk, pH, MCS, "jack-knifing"

Fisk er Norges nest viktigste eksportprodukt på over 30 milliarder kroner i 2001. Det vil bli mer og mer viktig at både kvalitet og kvantitet bestemmelser i fisk og fiskeprodukter skal kunne dokumenteres bedre. Derfor er det viktig å utvikle enkle, raske og eksakte analysemetoder for bruk i fiskeindustrien. Nær infrarød reflektans spektroskopi (NIR) har blitt en akseptert metode for måling av kjemisk sammensetning (fett, protein og vann) i fisk, og denne metoden begynner så vidt å bli implementert i noen få norske fiskebedrifter.
I forbindelse med måling av kvalitet på fisk er måling av pH en viktig kvalitetsparameter. I fisk er det en relativ stor variasjon i normal pH (ca. 0,4 pH-enheter) ved at melkesyre akkumuleres og hydrolyse av adenosin trifosfat (ATP) skjer i fiskemuskelen i både levende og i slaktet fisk. Etter slakting kan pH i fisken synke opp til en 14-dagers periode ved lagring på is. I fordervet fisk kan pH øke pga produksjon av for eksempel ulike løselige nitrogenforbindelser og dannelse av flyktige aminer. Det er derfor ønskelig å kunne måle pH direkte i fisken på en enkel og mest hygienisk måte.
Ved framstiling av ulike fermenterte fiskeprodukter (som f.eks. gravlaks og rakfisk) er måling av pH en viktig kvalitetsparameter. Det var derfor ønskelig å gjøre en lite innledende studie på måling av pH i kvernet fisk ved bruk av NIR, og det ble valgt å måle den i sei (Pollachius virens) og laks (Salmo salar). Seien innholder lite fett (0,3 %), men har mye av både lys og mørk muskeltyper og er derfor grå til gråhvit i fargen. Laksen har et høyt fettinnhold (8-20%) og er rødfarget pga av et høyt innhold av karatenoider (astaxantin). Fiskeprøver ble kvernet opp og pH ble justert ved tilsetning av 1M HCl eller NaOH. Det ble vist at pH i denne kvernende fiskemassen kunne bli bestemt ved en RMSEP på 0,4 og en korrelasjon koeffisient på 0,90 ved å bruke NIRSystems 6500. Ved å bruke sju forskjellige bølgelengder under 1900 nm og Unscrambler (Camo ASA, Norge) med MSC ("Multiplcative Scatter Correction") and "jack-knifing" ble RMSEP for pH lavere enn 0,1 og korrelasjons koeffisienten ble forbedret til 0.99. Noen av de utvalgte bølgelengdene var i det synelige delen av spekteret (i 600-området).

"Utvikling av modell for online prediksjon av reologi til ett PEL-produkt v/Borealis AS"

Marit Kleven,Cathrin Pedersen Bråthen, Sven Ingard Johansen, Høgskolen i Telemark

I forbindelse med produksjon av polymerproduktet CA8200 ved PEL-fabrikken, Borealis AS (Rønningen), testes kvaliteten på materialet. Fabrikkens kunder stiller krav til kvaliteten på produktene de kjøper, spesielt polymerens flytegenskaper er en viktig kvalitetsparameter. Kvalitets Kontroll-laboratoriet foretar bl.a. en reologianalyse av produktprøver 8-10 timer etter prøven er tatt. Det ferske produktet inneholder noe gass og må derfor "hvile" før det kan analyseres. Resultatet av reologimålingen er en rekke parametere som beskriver plastens elastiske og plastiske egenskaper.
Målet med prosjektet har vært å utvikle en online-modell som predikterer reologien for CA8200 på bakgrunn av prosessparametere. Hensikten med online-modellen er å kunne antyde reologien til produktet underveis i produksjonen. Dermed vil det være mulig å regulere prosessen mot godkjent kvalitet langt tidligere med dagens prosedyre hvor en må vente mange timer på resultatene.
I utformingen av online-modellen er det benyttet multivariat dataanalyse i form av kjemometriske verktøy. Det ble foretatt PCA-analyser av både reologidata og prosessdata. Scoreverdiene fra PCA-modellen for reologidataene ble anvendt som referanse(Y) i en PLS-kalibrering med prosessparametere som X data. Denne ble igjen integrert i et dataprogram basert på Labview for å kunne brukes online.
For å oppnå en god modell ble det analysert reologi og selektert prøver til et modellgrunnlag. Prosessparametrenes påvirkning på reologien ble vurdert. Parametere med størst innflytelse på reologien danner grunnlag for modellen.
Det anbefales en rekke korrektive tiltak i forbindelse med Labview-modellen. I tillegg presenteres et forslag for hvordan modellen kan brukes for konkretisering av driftsinstruks. Det anbefales at online modellen blir forbedret ytterligere ved å styrke rådatagrunnlaget.

Anvendelse av bildeanalyse på fiskefileter
Lars H. Stien, Institutt for fiskeri og marinbiologi, UiB

Utviklingen innen data og bildebehandling har ført til nye metoder for å måle kvalitet innenfor både matproduksjon og annen industri. Bildebehandling begynner også å bli vanlig innenfor biologisk forskning. På bakgrunn av dette har vi startet et prosjekt som skal se på hvordan bildebehandling kan brukes til å beskrive og klassifisere fiskefileter. Målet er å utvikle metoder for å beskrive egenskaper som form, farge, fettinnhold, antall parasitter, ferskhet og cellevekst. Siden prosjektet er i startfasen, har vi ikke sett på alle problemstillingene ennå. Hittil har vi konsentrert oss om form og cellevekst.
Form kan f. eks brukes til å beskrive hvordan en filet trekker seg sammen under rigor mortis (dødsstivhetsprosessen). Etter at fisken er slaktet, er rigor mortis og andre reaksjoner i sammenheng med denne svært viktige for hvordan kvaliteten til fisken blir. Det er derfor interessant å måle hvordan ulike eksterne og interne faktorer påvirker rigor-prosessen. Hvis en filet blir filmet under rigor, er det relativt enkelt å hente ut informasjon om hvordan formen endrer seg ved hjelp av bildebehandling. Det er imidlertid også interessant å måle hvordan ulike deler av fileten endrer seg; trekker f. eks halen seg mer sammen enn resten av fileten? Hvis det blir plassert markører bestemte steder på fileten, kan disse brukes til dette. Under bildebehandlingen vil en da måle hvordan avstanden mellom markørene endrer seg over tid.
I motsetning til pattedyr utvikler fisk nye muskelceller hele livet. Når en ny muskelcelle blir dannet, er den liten i forhold til eldre celler. Forholdet mellom store og små celler sier derfor noe om hvordan fisken vokser. Det er relativt utbredt å bruke bildebehandling på muskelceller og det har blitt utviklet flere program for dette. Disse programmene er ofte helautomatiske og krever at bildene er regelmessige og av svært god kvalitet. For slides av fiskemuskler er dette imidlertid ofte ikke tilfelle. Det har gjerne oppstått skader i sammenheng med snitting, nedfrysning eller farging. Alternativet har derfor vært å foreta en manuell bildeanalyse. En bruker da musen til å tegne rundt hver enkelt celle. Dette er en svært arbeidskrevende prosess. Målet er derfor å utvikle et program som kan effektivisere denne manuelle tegningen. Programmet skal være et såkalt ekspertsystem; det er avhengig av at den som bruker det tar korrekte avgjørelser. En prototyp for dette programmet har allerede blitt utviklet. Programmet gir et forslag til hvor cellegrensene skal gå. Brukeren godkjenner deretter hver enkelt celle, og legger til cellevegger der disse skulle mangle. Tilslutt lagres dataene i en database ved å trykke på en knapp.
Når det gjelder de andre problemstillingene, har vi utført et innlende studium av farge og fettinnhold på laks. Resultatene fra dette forsøket er lovende. Det var relativt god korrelasjon mellom en fettprosent målt ved bildeanalyse og den kjemiske fettprosenten. Bildeanalysen klarte også å skille mellom fileter av ulik fargekvalitet.
I foredraget vil vi ta for oss noen av algoritmene som blir brukt under analysen og hvordan disse har blitt utviklet. For hvert bilde blir det typisk hentet ut flere kvalitetsrelaterte variabler. Disse variablene kan sammen med variabler fra andre målemetoder gi ny informasjon om fiskekvalitet. I denne sammenheng er det aktuelt å bruke multivariate metoder til å håndtere de store datamengdene.

Bioinformatikk

Dataanalyse av gen-uttrykk med anvendelse i brystkreft undersøkelser
Eivind Hovig
Tumorbiologisk avdeling, Det Norske Radiumhospital

Fra Lettmajones til Kreftforskning, en reise fra Kjemometri til Bioinformatikk !!!

Narinder Singh, DiaGenic AS

Undertegnete har vært kjent i miljøet som Dr. Majones, og har i de tidligere møtene fokusert på anvendelser av statistiske/kjemometri metoder på å løse den gåtefulle verden av kvalitetssikring av vår kjære mmmMills majones. Men i det siste har jeg hørt ett nytt og et mer eksotisk kall og begynt å jobbe innenfor kreftdiagnose basert på genekspresjonsteknologi. Utvilking av micro- og macroarray baserte metoder for kreftdiagnose er basert på analyse av ekspresjon av tusener av gener, noe som stiller store krav til dataanalytiske metoder. Her bør det bemerkes at den siste setning er klippet og limet inn fra en artikkel som undertegnete skrev i forbindelse med innføring og bruk av NIR spektroskopi prosessovervåking i næringsmiddelprosesser. Forskjellen ligger i erstatning av ordene NIR spektroskopi med macroarry baserte medoder, prosessovervåking med kreftdiagnose, og tusener av bølgelengder med tusener av gener. Fordraget vil belyse likheter mellom de tradisjonelle problemstillinger og løsninger innenfor kjemometri, og den mere "eksotiske" bioinformatikk verden. Jeg vil i dette foredraget gi en kort presentasjon av datanalytiske problemer forbundet med micro- og macroarray metoder, og noen forslag på løsning av disse problemer. Hovedfokus dog vil være på anvendelse av metoder utviklet innenfor statistikk/kjemometri på kreftdiagnose.