NAMI-projektin R-skriptien versio 0.5.3
Jarno Tuimala, 28.4.2008

Sisllys:
- Tehtv
- Versioon kuuluvat skriptit
- Nykyiset ominaisuudet
- Muutokset edellisest versiosta
- R:n asennus Coronalle (tarvittavat paketit)

---------------------------------------------------------------------------------------------------------------------------

Tehtv:
- Bugeja:
   - venn-diagrammista ei ne mitk ovat kuvaan plotatut ryhmt (Set1...Set3) oikeilta nimiltn
   - norm-cdna ja norm-agilent eivt anna flagej, koska niiden rivimr eroaa datan rivimrst
     (koska datasta on laskettu replikaattispottien suhteen keskiarvo, mutta flageist ei)
   - norm-agilent
      - huonojen spottien poisto?
      - keskiarvon laskeminen vaihtoehtoiseksi?
   - Kuvien antamat tulokset mys tekstin
   - RNA degradation: hankala erottaa siruja toisistaan, kun vrit ovat niin samanlaiset
   - HELP-juttuja:
      - dye swap import -sivu
	- Sourceforgen Wikiin ohjeet ClusterBusterin ym. asennuksesta
      - import-agilent: ControlType-sarake -> Annotation (lis!) 
      - import-agilent: probeUID -> probeName
      - Illumina-datan sisnsytt ja normalisointi
      - Manual: signal -> sample (data formats)
      - Lis Search by gene name -tykaluun esimerkkigeenin nimi
      - Weeder and ClusterBuster: kerro helpiss, ett skripti noutaa mys sekvenssit
      - Lis GenePix-datan sarakkeiden nimet supported types-sivulle manuaalissa
	- Kaikki tool-sivut ajan tasalle
         - Supported-chiptype -sivulle mys sirujen nimet systeemiss (R:ss esim hgu133a)
	- Getting started -sivu
	- Printable version (with CSS)
	- Migrating from GeneSpring
- Kehitettv:
   - chipster-comp:lle skriptej
      - muokkaa sopiviksi
      - asenna ClusterBuster ja Weeder sek tarvittavat fileet
   - skriptit
      - kyt sample-funktiota HC-kuvan tekemisess, jos objektien mr on kovin suuri
      - Varianssitesti
      - Gene set test ei toimi kurssin demodatalla (Agilent)
      - Bring in own annotations
         - New tools for running analyses using these
      - Muuta linear modeling toolin sarakkeiden nimet
      - Muuta Alt CDF:t AffyProbeMinerin kirjastoihin (niille on annotaatiotkin)
      - Lis organismeja promoottorianalyysilistaan
         - Luovu Weederist?
         - Tai lis Weederi kytten lajit:
		DM                      Drosophila melanogaster
		SC                      S. cerevisiae
		FR                      (Taki)Fugu rubripes
		DR                      Danio rerio
		AT                      Arabidopsis thaliana
		GG                      Gallus gallus
		CE                      C. elegans
		AG                      Anopheles gambiae
		AN                      A.nidulans
		CI                      Ciona intestinalis
		XT                      Xenopus tropicalis
		CFI                     Canis familiaris (intergenic frequencies)
		BEC                     E.coli K12
		BBS                     Bacillus subtilis
      - general normalization
          - mahdollisuus mritell pudotusvalikoilla kytettvt sarakkeet
          - Agilentille oma skripti siten, ett tab-delimited fileet vain tuodaan sisn,
            ja skripti hoitaa kaiken muun?
      - variance stabilization normalization for agilent
      - mahdollisuus kytt kontrolliprobeja normalisoinnissa
      - HGU95A-sarjan siruja custom.chiptype:ksi norm-affy:yyn
      - Poista flagien kytt skripteit kokonaan
         - tuottaa vain ongelmia!
      - Merge tables -skripti palauttaa datan molemmista tauluista
         - tee utilities skripti, jolla sarakkoita voi poistaa
      - Illumina-data kaataa hypergeometrisen testin niill GO-ID:ll, joita ei lydy 
      - NUSE-plottiin lis tilaa alamarginaaliin
          - sama heatmap:iin
      - Rikastuneiden GO-luokkien analyysin pitisi palauttaa geenitkin (miten?)
      - SOAP-skripti
      - MA-plot for Illumina
      - Annotations as a tsv-table
      - direct data import form GeneSpring
	- survival analysis -skripti
      - extract genes using a category (GO, KEGG) term
      - search by gene ontology class
      - Normalisointi positiivisten kontrollien (spiked controls) perusteella
      - normalisointi tiettyihin geeneihin
      - Illumina -normalisointi perustuen lumi-pakettiin (R 2.6.1)
      - plot residuals from RLE/NUSE
      - permutation for multiple testing correction
      - Help in selecting a correct p-value cutoff (Qvalue package)
      - connectivity map?
      - other ontologies (cMAP, BioCarta, reactome, panther)
	   - using BioPAX through Rredland
      - Fix export to soft to include all information from phenodata
      - Muuta Weeder-skripti kyttmn Cosmo-pakettia (Bioc)
   - more wizards
      - GO-classification based on min 3-fold change
      - extract the significant pathways
      - QC
   - ISOT JUTUT
      - Exon arrays
      - Tiling arrays
      - ChIP-on-chip
      - CGH
      - SNP analysis
         - Sampsa Hautaniemen ryhmn tuotokset
            - CohortComparator
               - Tsekkaa fortran-koodin kntminen R: varten
	- fylogenetiikka
	- geenikartoitus
   - PAGE / GSEA -analyysi
   - Kuinka saada generoitua ajettava R-skripti suoraan systeemist?
   - skripteihin lis tarkistuksia?
      - joitain skriptej ei voi suorittaa kuin tietyille lajeille. 
        -> lis fenodataan sarake, joka kertoo lajin?
   - Muuta hierarkkinen klusterointi kyttmn Xcluster-ohjelmaa.
   - Phenodatan sarakkeisiin voisi kirjoittaa mys teksti -> ksitelln faktoreina, ei numeroina R-skripteiss
   - Fenodataan generoitavat sarakkeet:
      - group
      - training
      - time
      - random
      - paired
   - klusterointeihin tarkastus, joka testaa, onko yhtn geeni klusteroitavaksi. Jollei,
     niin annetaan virheilmoitus.
- Ominaisuuksia, joita ei voi muuttaa:
   - LPE toimii vain koko datalla.
   - Geneset test (KEGG, GO) toimii vain koko datalla.
   - affy-qc-degplot -> muuta nimet kyttmn alkuperisi nimi (original_name). 
     QC tehdn raakadatalle, jolle fenodataa ei ole viel vlttmtt olemassa.
   - cdna-normalisointi kaatuu, jos jos joku columns-kohdassa mritellyist sarakkeista puuttuu.
   - pathway-bayesian.R -skripti toimii vain, jos datassa on yksi havainto aikapistett
     kohden.
   - pathway-bayesian.R -skripti ei anna plottia. Jospa sen muuttaisi antamaan vain datan, josta
     kyttj sitten saisi itse piirt sen pathwayn...
- R-kirjasto-ongelmia:
   - Seuraavat kirjastot eivt viel asentuneet:
	- Rgraphviz
   - Skriptit, jotka eivt siksi toimi:
	- pathway-bayesian.R
- Ominaisuuksia puuttuu:
   - annotaatioiden ksittely cDNA-datalle
   - parittainen SAM-testi

---------------------------------------------------------------------------------------------------------------------------

Thn versioon kuuluvat skriptit:

Normalisation
   norm-affy.R
   norm-agilent
   norm-cdna.R
   norm-illumina.R
   norm-lme.R
Preprocessing
   filter-expression.R
   filter-flags.R
   filter-sd.R
   impute.R
   na-impute.R
   qc-affy.R
   qc-affy-rle-nuse.R
   qc-cdna.R
   qc-illumina.R
Statistics
   estimate-samplesize.R
   ordination.pca.R
   stat-geneset.R
   stat-one-group.R
   stat-several-groups.R
   stat-singleslide.R
   stat-timeseries.R
   stat-two-groups.R
   stat-correlate-with-phenodata.R
   stat-hyperG.R
Clustering
   classification-knn.R
   cluster-hierarchical.R
   cluster-kmeans.R
   cluster-qt.R
   cluster-som.R
Annotation
   annotate-genelist.R
Pathways
   pathway-bayesian.R
   pathway-boolean-bestim.R
Promoter
   promoter-tfbs.R
   promoter-cbust.R
   promoter-retrprom.R
Visualisation
   plot-chrom-pos.R
   plot-idiogram.R
   plot-volcano.R
Data Manipulation
   average-replicates.R
   export-soft.R
   export-tab2mage.R
   import-soft.R
   merge-tables.R
   search-correlation.R
   search-quoryword.R

---------------------------------------------------------------------------------------------------------------------------

Nykyiset ominaisuudet:

Normalization
	Affymetrix
		mas5
		plier
		rma
		gcrma
		Li-Wong (dChip)
		VSN for mas5 and plier
	cDNA / Agilent
		Background Correction
			none
			subtract
			Edwards
		Within-chip
			none
			median
			loess
		Within-gene
			None
			Scale
			Quantile
	Illumina
		None
		Median
		Quantile
		q-spline

Imputation
	Mean
	Median
	K-nearest neighbor

Quality-control
	Affymetrix
		Average background
		Scaling factor
		3/5 ratio of qc-probesets
		RNA degradation plot
		RLE plot
		NUSE plot
	cDNA
		histogram 
		density plot
		MA plot
	Illumina
		histogram
		density plot

Filtering
	Flags (P/M/A)
	Expression value
	Standard deviation
		Chip
		Gene

Search
	Similarly expressed genes by correlation
		Pearson
		Spearman
	Genes by common name
	Genes by Affymetrix ID
	Chromosome location

Plot
	Chromosomal location of genes 
        Chromosome specific idiogram
	Volcano plot
	Scatter plot (GUI)
	Histogram (GUI)
	Chip image (GUI)
	Hierarchical clustering (GUI)
	Self-organizing maps (GUI)

Annotate
	Make an HTML table from a gene list
	GeneCruiser (GUI)

Statistical testing
	Single slide
		Noise (sd) envelope
		Newton method
	One group
		T-test
		Wilcoxon rank sum test
	Two Groups
		Empirical Bayes
		T-test
		Mann-Whitney U test
		SAM
		LPE
	Multiple groups
		Empirical Bayes
		ANOVA
		Kruskall-Wallis test
		SAM
	Gene set (globaltest)
		Own gene list
		Groups inferred from KEGG
		Groups inferred from GO
		Enrichment analysis of GO terms in a list of genes
	Hypergeometric test for over- or underrepresentation
		GO categories
		KEGG pathways 
		PFAM categories
	Time series
		Periodically expressed genes
		Independent component analysis
	Pathways
		Network inferrence
 			Boolean network
			Bayesian network
	Multiple testing correction
		None
		Bonferroni
		Benjamini and Hochberg false discovery rate
	Experimental design
		Estimation of sample size
		Estimation of power
		Estimation of fold change

Clustering
	K-means
	Hierarchical
		Distances
			Euclidian
			Manhattan
			Pearson
			Spearman
		Methods
			Single linkage
			Average linkage
			Complete linkage
			Ward
		Resampling testing of the result
			Methods
				Bootstrapping
	Self-organizing map (SOM)
	Quality threshold (QT) clustering

Ordination
	Principal component analysis (PCA)

Classification
	K-nearest neighbor
		Cross-validation
		Prediction of test group membership

Promoter analysis
	Retrieve promoters from UCSC genome database 
	Finds sequence motifs common to a set of promoters (Weeder) 
	Finds clusters of putative TF binding sites using JASPAR matrices 

Import / Export
	Import and export in SOFT format for GEO database
	Export in tab2mage format for ArrayExpress database


---------------------------------------------------------------------------------------------------------------------------

Muutokset edellisest versiosta (0.5.2)


Muutokset edellisest versiosta (0.5.1)
- export-soft -skriptiin korjattu virhe, joka kaatoi export-tykalun, jos datassa ei ollut flagej.
- norm-affy -skriptiin korjattu pari virhett. Ensinnkin MAS%- ja Plier-normalisoinnin jlkeen ei
  palautettukaan log2-muunnettuja arvoja. Toiseksi Plier normalisointi pyshtyi aina virheilmoitukseen,
  sill custom.chiptype-testiss oli == sen sijaan ett siin olisi oikein lukunut !=.
- norm-agilent-one-color ei toiminut vaan kaatui. Korjattu useita virheit, jotka johtuivat annotaatioiksi
  merkityn ControlType-sarakkeen vrst ksittelyst.
   - Samat korjaukset tehty mys noem-agilent-skriptiin.
- norm-agilent-skriptin kontrolliprobien poisto aiheutti sen, ett gene set test ei toiminut. Nyt kontrolli-
  probien poisto on vapaaehtoista (default: no), mink pitisi korjata tilanne. Replikaattiprobeista otetaan
  silti edelleen keskiarvo.
- uusi skripti: norm-affy-snp, joka ottaa SNP-sirujen CEL-fileet ja laskee niist genotyypit
- uusi skripti: stat-chisq-snp, joka ottaa normalisoidu SNP-chip datan ja ajaa sille assosiaatioanalyysit
  kytten Khiin nelitesti. Ei ota huomioon perherakenteita.
- filter-by-column -skriptiss on nyt mahdollista testata mys yhtsuuruus (ennen vain suurempi / pienempi kuin).
- uusi skripti: change-interpretation, joka joko muuntaa log2-arvot alkuperisiksi tai muuntaa alkuperiset arvot
  log2-muunnetuiksi.


Muutokset edellisest versiosta (0.5.0)
- Kaikki tss versiossa ovat skriptit on tarkoitettu R:n versioon 2.6.1, ja muutokset koskevat vain nit
  skriptej!
- Stilisoitu skriptien otsikkohelppej ja koodien kommentteja.
- Modifioitu seqanal- ja promoter-skriptien polkumrityksi siten, ett oikea polku tarvitsee osoittaa
  skriptiss vain yhdess paikassa, joten muuttaminen on helppoa.
- norm-affy -skripti korjattu kovalla kdell. Useimmat normalisoinnit uudelleen annotoiduilla siruilla eivt
  toimineet. Nyt pitisi toimia.
- plot-venn -skriptiss valittujen tiedostojen nimet eivt tulleet nkyviin. Asia on nyt korjattu ja
  diagrammin eri osat on nimetty tiedostonnimien perusteella.
- calculate-descriptive-statistics -skriptiin listty mahdollisuus laskea ne joko geeneille tai siruille.
- norm-illumina -skriptiss oli ongelma: flagej ei saatu konvertoitua kirjaimiksi. Korjattu ja nyt toimii.
- sort-samples skriptiss oli virhe, eik se toiminut, jos datassa ei ollut flagej. Korjattu.
- norm-illumina -skriptiin korjattu Mouse V1-1 paketin nimi oikein.


Muutokset edellisest versiosta (0.4.9)
- uusi skripti: seqanal-msa, joka tekee usean sekvenssin rinnastuksen FastA-muotoisille sekvensseille.
- uusi skripti: seqanal-phylogenetics, joka tekee fylogeneettisen analyysin Clustal-muotoiselle rinnastukselle.
- Luotu uusi kategoria quality control, johon QC-skriptit on siirretty.
- Fiksattu bugi norm-lme-skriptiin: sanity check oli ennen datan eristyst, ei hyv. 
- norm-nmds -skriptiss oli kovakoodattu kuvan koko. Muutettu.
- plot-volcano -skriptiss SE-kuvan y-akselin otsikko muutettu muotoon -log(p) eli oikein (oli SE).
- stat-sam -skripti kaatui, jos valitulla Delta-tasolla ei lytynyt yhtn merkitsev geeni.
- stat-timeseries -skriptiin tehty muutamia bugikorjauksia (yksi } poistettu, p->p.cut, jne.).
- skriptit, joiden toimivuus R 2.6.1:ll on testattu, ovat tools-R261 kansiossa. Plussalla 
  merkittyihin skripteihin tyhty muutoksia.
   - annotate-genelist
   - average-replicates
   - calculate-descriptive-statistics
   - calculate-fold-change
   - classification-knn
   + cluster-hierarchical
   - cluster-kmeans
   + cluster-qt
   + cluster-som
   - estimate-samplesize
   - export-soft
   - export-tab2mage
   - extract-genes-from-clustering
   - extract-genes-from-stattest
   - extract-samples-from-dataset
   - filter-by-column
   - filter-cv
   - filter-expression
   - filter-flags
   - filter-iqr
   - filter-sd
   - generate-phenodata
   - import-soft2
   - impute
   - merge-tables
   - na-omitted
   + norm-affy
   + norm-affy-exon
   - norm-agilent
   - norm-agilent-one-color
   - norm-cdna
   - norm-illumina
   - norm-lme
   - ordination-nmds
   - ordination-pca
   - (pathway-bayesian)
   - (pathway-boolean-bestim)
   - plot-boxplot
   - plot-chrom-pos
   - plot-corrgram
   - plot-dendrogram
   - plot-heatmap
   - plot-histogram
   - plot-idiogram
   - plot-venn-diagram
   - plot-volcano
   - plot-volcano-data-exists
   - promoter-accessory
   - promoter-cbust
   - promoter-retrprom
   - promoter-tfbs
   + qc-affy
   - qc-affy-rle-nuse
   - qc-agilent
   - qc-agilent-one-color
   - qc-cdna
   - qc-illumina
   - search-correlation
   - search-queryword
   - seqanal-msa
   - seqanal-phylogenetics
   - sort-samples
   - stat-correlate-with-phenodata
   - stat-geneset
   - stat-hyperG-GO
   - stat-hyperG-KEGG-PFAM
   + stat-linear-modelling
   - stat-one-group
   - stat-sam
   - stat-several-groups
   - stat-singleslide
   - stat-timeseries
   + stat-two-groups


Muutokset edellisest versiosta (0.4.8)
- annotate-genelist -skriptiin oli jnyt muuttamatta ekspressio- ja p-arvo-sarakkeiden default-arvot
  isoilla kirjaimilla. Tm korjattu, ja skripti toimii taas.
- affy-norm-exon -skriptill ei voinut kytt kuin rma-normalisointia, joten kaikki muut optiot on
  poistettu.


Muutokset edellisest versiosta (0.4.7)
- uusi skripti: calculate-descriptive-statistics, joka laskee kullekin geenille perustilastoarvot
- uusi skripti: filter-by-column, joka filtteri datan yhden valitun datan sarakkeen perusteella
- uusi skripti: norm-affy-exon, joka normalisoi Affyn exon-siruja
- norm-agilent-, norm-agilent-two-color- ja norm-cdna -skripteihin on listty mahdollisuus kytt
  taustan korjaamiseen normexp-menetelm, joka on todettu (Bioinformatics 2007) parhaaksi menetelmksi,
  kun siihen liitetn pieni offset (50), mik on myskin listty optioksi skripteihin.
- norm-agilent- ja norm-agilent-two-color -skripteihin listty zebrafish-sirun kyttmahdollisuus.
- plot-chromloc -skriptin tuottaman kuvan taustavriksi vaihdettu valkoinen ja puuttuvien havaintojen 
  vriksi vaalean harmaa, joka tosin rasteroituu ikvsti PNG-kuvassa. Tulos on kuitenkin oletusarvoja
  parempi.
- uusi skripti: sort-samples, joka jrjest nytteet ja fenodatan jonkin fenodatan sarakkeen mukaan
- norm-agilent-skripti muutettu siten, ett se ei en kaadu, vaikkei ControlType-saraketta olisikaan
  tuotu sisn.
    - sama muutos tehty mys norm-agilent-one-color -skriptiin 


Muutokset edellisest versiosta (0.4.6)
- geneset test: tulosta tulokset mys listana, jotta nkee kaikkien kategorioiden tulokset. Korjattu.
- norm-agilent (1- ja 2-vri):
   - Replikaattispoteista lasketaan nyt oletusarvoisesti (eik sit voi knt pois plt) keskiarvo,
     jos spotit ovat samalla sirulla.
   - Poistetaan kontrollispotit datasta automaattisesti
- norm-cdna:
   - Replikaattispoteista lasketaan nyt oletusarvoisesti (eik sit voi knt pois plt) keskiarvo,
     jos spotit ovat samalla sirulla.
- PCA - add a possibility to scale the value before analysis. Listty.
- uusi skripti: ordination-nmds, joka tekee siruille NMDS-analyysin, ja piirt siit kuvan
- uusi skripti: filter-cv, joka filtteri geenit niiden CV:n perusteella
- QT- ja K-means -clustering: R:n tuottamissa kuvissa eivt y-akselit ole samassa skaalassa. Korjattu.
- uusi skripti: qc-agilent, joka tekee QC:n Agilentin 2-vridatalle
- uusi skripti: qc-agilent-one-color, joka tekee QC:n Agilentin 1-vridatalle
- korjattu bugi stat-group-testist. Empirical Bayes -testist puuttui mahdollisuus bonferroni-korjauksen
  kyttn (sit ei laskettu skriptiss ollenkaan, vaikka se oli valittu optioksi).
- norm-agilent -skriptiss oli bugi sirutyyppi mgug4112a:n kohdalla: a puuttui lopusta. Korjattu.
- calculate-fold-change -skriptiss ollut fold change laskenta korjattu oikein (FD<-dat3[,2]/dat3[,1]
  muutettu muotoon FD<-dat3[,2]-dat3[,1]).


Muutokset edellisest versiosta (0.4.5)
- empirical bayes -testien pitisi tulostaa mys fold change (ei pelkstn lineaarisen mallin)
  Korjattu kahden ryhmn testin osalta. Usean ryhmn tapauksessa pitisi kytt linear modelling-
  tykalua.
- limma-analyysi ei tulosta rivinimi -> korjattava ASAP! Korjattu. Lisksi muutettu design-matriisin
  kirjoitusta siten, ett levylle kirjoitettava tiedosto tulkitaan pelkkn tekstin.
- limma-analyysi laittoi geenit vrn jrjestykseen (tulokset on sortattu suurimmasta pieneimpn,
  mit ei ollut otettu huomioon tuloksia levylle kirjoitettaessa). Korjattu, toivottavasti oikein.
- annotate-skripti pivitetty siten, ett jos datalle on tehty tilastollisia testej siten, ett p-arvo
  ja fold change ovat saatavissa, niin kyttj voi valita lisvns ne annotoituun geenilistaan
  lisinformaatioksi.


Muutokset edellisest versiosta (0.4.4)
- Illumina normalisointi ei toiminut, koska sarakkeiden nimet datassa ja rivien nimet fenodatassa
  eivt sisltneet tiedostoptett. Nyt asian pitisi olla kunnossa, ja homman toimia.
- stat-two-groups kaatui, koska sanity check-vaihe oli ennen muuttujien luomista, joiden suhteen
  nuo checkit ajettiin. Korjattu.
- Extract-samples-from-dataset kaatui, jso datasetti ei sisltnyt call-arvoja. Nyt pitisi toimia
  mys datalle, jossa call-arvoja ei ole.
- stat-several-groups kaatui Kruskall-Wallisin testiin, sill muuttujaa p ei ollut alustettu ennen
  silmukkaa. Korjattu.
- QT-clustering kuva R:st saatuna nytt pahalta (x-akseli on liian pitk, fiksaa kuten K-means:ssa).
  Korjattu.
- correlate-with-phenodata kaatuu, jos datasta on ensin laskettu ryhmkeskiarvot
   - tsekkaa, ett datan ja fenodatan dimensiot ovat samat - jolleivat, anna virheilmoitus.
   - Korjattu.
- cluster-som kaatui siihen, ett dists-objektista otettiin ensimminen sarake, vaikka objekti oli 
  oikeasti vektori. Korjattu.


Muutokset edellisest versiosta (0.4.3)
- calculate-fold-change -skripti muutettu hieman. Nyt se ei laskenut fold changea edes kahdelle ryhmlle.
  Lisksi ulostulotiedoston nimeksi muutettu VVSADL:n vaatima fold-change. Lisksi fold change talletetaan
  sarakkeeseen chip.FD entisen FD:n sijaan.
- plot-heatmap -skripti korjattu siten, ett se odottaa tulostiedostoksi heatmap.png eik esim.
  dendrogram-color.png, kuten aiemmin.
- plot-dendrogram -skriptiin listty phenodata, jota ilman skripti ei tuottanut dendrogrammia.
- Muutettu tilastoskriptien oletusarvoiseksi metadata-sarakkeeksi group.
- stat-correlate-with-phenodata -skriptist korjattu virhe: yritettiin pyrist mys flagej
  korrelaatioarvojen lisksi. Skripti kaatui virheilmoitukseen, ett merkkidataa ei voi pyrist.


Muutokset edellisest versiosta (0.4.2)
- Kaikki merge-funktiot poistettu yht geneerist lukuunottamatta.
- norm-illumina -skripti muutettu toimimaan siten, ett data on tuotu
  sytttykalulla, ja se on kirjoitettu levylle yksittisiksi tiedostoiksi.
- stat-two-groups- ja stat-several-groups -skripteist poistettu viittaus SAM-
  analyysiin. 
- uusi skripti: stat-sam, joka laskee SAM-analyysi yhdelle, kahdelle tai useammalle
  ryhmlle.
- KNN ei toimi, sill group-saraketta ei voi jtt tyhjksi test datalle.
   - virhe johtuu siit, ett predict-funktiolle sytetn train-setti, joka
     on oikean mittainen, mutta cl-muuttuja puolestaan on koko vektorin mittainen
     (=ei hjuva).
   - Korjattu.
- filter-IQR ei tuota tulostiedostoa (library-komento puuttuu). Korjattu.
- K-means kuva, joka tuotettu R:ss nytt oudolta. Nyt nytt paremmalta. Koodi
  oli skriptiss hieman vrss jrjestyksess, mutta nyt pitisi olla oikein (
  kuvan piirto ennen taulukon kirjoitusta).
- calculate-fold-change kaatuu. Ongelmana ainakin vaadittava ryhmien mr. Nyt 
  pitisi toimia kunnolla.
- plot-dendrogram kaatui, koska toisen ulostulotiedoston nimi oli vrin.
- plot-corrgram kaatui, koska corrgram-kirjastoa ei ollut ladattu ennen analyysi
- plot-heatmap kaatui, koska heatmap() vaati sytteksi matriisin, ja sille annettiin
  data frame. Korjattu.
- Jos niiss skripteiss, joissa pit valita jokin fenodatan sarake ei ole valittu
  mitn saraketta, niin ajetaan skripti group-sarakkeella, joka pitisi aina olla
  tytettyn. Muutokset tehty skripteihin:
     - average-replicates
     - calculate-fold-change
     - extract-samples-from-dataset
     - extract-genes-from-stattest
     - norm-lme
     - plot-dendrogram
     - plot-volcano-data-exists
     - stat-correlate-with-phenodata
     - stat-geneset
     - stat-linear-modelling
     - stat-sam
     - stat-several-groups
     - stat-timeseries
     - stat-two-groups
     

Muutokset edellisest versiosta (0.4.1)
- stat-linear-modelling -skripti kirjoittaa nyt ulos mys kunkin parametrin suhteen
  lasketun fold changen.
- uusi skripti: extract-genes-from-stattest, joka erottaa tilastollisten testien
  antamista tuloksista ne, joiden p-arvo on alle valitun raja-arvon.
- uusi skripti: volcano-plot-data-exists, joka plottaa tehdyn tilastollisen testin
  (linear model tai empirical bayes) tulokset Volcano plotin muotoon.
- Muutettu muutamiin plottiskripteihin kuvan koon asetukset oikein (600/72 -> w/72 ym.).
- norm-illumina -skriptiin listty mahdollisuus kytt mys ProbeID-annotaatioita.
- norm-illumina -skriptist korjattu flagging-muuttujan ksittelyyn liittyvi virheit.


Muutokset edellisest versiosta (0.4.0)
- uusi skripti: stat-linear-modelling, jossa on toteutettu lineaaristen mallien kytt data-
  analyysiin, kuten se on limma-paketissa toteutettu.
- norm-illumina-skriptiin listty mahdollisuus valita sarake-erotin (, tai ; tai tab). Jos
  erotin on ;, on pilkun merkkin , eli kytetn "suomalaisia asetuksia".
- uusi skripti: norm-agilent-average-replicates, joka laskee normalisoinnin jlkeen keskiarvon
  sirulla olevista kahdesta tplreplikaatista. Tm toimii vain, jos replikaatteja on tismalleen
  kaksi.
- stat-skripteihin listty parametri, jolla kyttj voi valita, mink fenodatan sarakkeen
  suhteen testi halutaan tehd.
- Hypergeometrinen testi ei palauttanut ikin yhtn merkitsev tulosta, koska skriptille
  annetun datan sijaan testeissa kytettiin sirun kaikkien geenien listaa -> kaikilla geeneill
  p-arvo 1. Korjattu.


Muutokset edellisest versiosta (0.3.9)
- norm-lme-skripti muutettu siten, ett kyttj voi valita random-efekti sarakkeen.
- cluster-som -skripti tuottaa nyt tuloksista mys R:ss generoidun kuvan.
- cluster-kmeans -skripti tuottaa nyt mys kuvan klustereista.
- cluster-qt -skripti tuottaa nyt mys kuvan klustereista.
- uusi skripti: extract-genes-from-clustering, joka tallentaa uudeksi datatiedostoksi
  tietyn klusterin geenit.
- uusi skripti: norm-agilent-one-color, joka normalisoi Agilentin 1-vridatan.
  (elina.palonen@btk.fi).
- uusi skripti: norm-illumina-separate-files, joka normalisoi Illumina sirut, jos ne
  on tuotu sisn import tool:n kautta.
- uusi skripti: plot-corrgram, joka visualisoi nytteiden vliset korrelaatiot hauskana
  kuvana. 
- uusi-skripti: extract-samples-from-dataset, joka antaa kyttjn poistaa nytteit ja
  fenodatan rivej tietyn fenodatan sarakkeen perusteella.
- normalisoimaton Illumina-data tuli ulos raaka-arvoina. Muutettu tuottamaan log2-muunnettuja
  arvoja.
- uusi skripti: merge-tables-exp-with-annot, joka yhdist tabulaarisen ekspressiodatan
  tabulaarisen annotaatiodatan kanssa.
- norm-illumina -skripti pivitetty siten, ett ainoastaan jos flagit halutaan tuottaa,
  oletetaan ett datassa on olemassa Detection-sarakkeet. Lisksi, jos Detection sarakkeita ei
  ole, ei skripti edes yrit tuottaa flagej. Pitisi olla vikasietoisempi nyt.
- uusi skripti: filter-iqr, joka filtteri geenit niiden kvartiilivlin pituuden perusteella.


Muutokset edellisest versiosta (0.3.8)
- stat-hyperG -skripti jaettu kahtia siten, ett GO-analyysi on omassa skriptissn, ja
  KEGG/PFAM omassaan.
- norm-agilent -skripti ei kirjoittanut flag-arvoja, vaikka ne oli dataa tuotaessa mritelty.
  Tm muutettu toimimaan samalla periaatteella kuin cDNA-normalisoinnissa.
- filter-sd ei toimi yhdell sirulla, eik toimi filter-flag:kn. Tllin yritetn
  valita subscriptill tyyliin [1,] vektorista tai tyyliin [,1] vektorista. Paha, paha juttu.
   - Nyt tm on korjattu, ja skriptien pitisi toimia. Lisksi nyt voi SD-filtteriss kytt
     vain geenien suhteen filtterinti, joten siruja on oltava vhintn 2.
- uusi skripti: na-omit.R. Poistaa datasta kaikki rivit, joilla on puuttuvia havaintoja.
- cDNA- ja Agilent-normalisointi ei nyt en kaadu flag-sarakkeen puuttumiseen, mutta 
  kyllkin, jos jokin muista vaadituista sarakkeista puuttuu.
- Kyttliittym kaatuu, jos stat-hyperG-GO ajetaan, eik yhtn merkitsev geeni lytynyt. 
  Skripti muutettu hieman toisenlaiseksi, jolloin HTML-file luodaan suoraan kirjoittamalla
  tagit tiedostoon eik R:n helpperi-funktiolla.
- SD-filtteriss oli edelleen maininta muuttujasta marg. Se on nyt poistettu if-lauseesta,
  ja nyt skriptin pitisi toimia.
- uusi skripti: plot-venn-diagram piirt Vennin diagrammin kolmelle datasetille.
- uusi skripti: calculate-fold-change.R laskee kahden ryhmn keskiarvojen perusteella fold changen
- PCA-skriptiss ollut virhe korjattu (samples->chips). Nyt PCA toimii mys nytteille.
- uusi skripti: merge-illumina-files, joka yhdist kaksi systeemiin ladattua bead summary data 
  -tiedostoa. Yhdistmisen jlkeen tiedoston voi normalisoida norm-illumina -skriptill.
- uusi skripti: generate-phenodata, joka kirjoittaa tyhjn phenodatan, jos skripti ajetaan
  esinormalisoidulle datalle.
- uusi skripti: plot-boxplot, joka piirt boxplotin normalisoidulle datalle.
- stat-geneset -skriptiss viitattiin viel hgu133aSYMBOL-ympristn, joka korvattiin siten,
  ett skripti toimii kaikilla annotaatiopaketeilla.
- search-queryword-skriptiss viitattiin edelleen hgu133a-ympristn, mutta tm muutettiin kyttmn
  oikeaa ymprist kaikille siruille, joista annotaatioita on.
- Kaikkin plot-funktioihin listty mahdollisuus st kuvan kokoa.
- norm-cdna- ja norm-agilent -skripteihin tehty pieni muutos flagien ksittelyyn, jotta ne saadaan mukaan
  aina, olipa sarakkeet mritelty miten vain. 
- uusi skripti: plot-dendrogram, joka piirt kaksi erilaista dendrogrammia.
- uusi skripti: plot-heatmap, joka piirt heatmapin.
- uusi skripti: plot-histogram, joka piirt kullekin sirulle histogrammin


Muutokset edellisest versiosta (0.3.7)
- Manuaalia laajennettu ja parannettu huomattavasti.
- Illumina RatRef-12 listty annotaatiokirjastoihin, ja normalisointiskripti
  korjattu vastaavasti.
- Agilent-sirujen (ihminen, hiiri ja rotta) annotaatiot listty, ja normalisointiskripti
  muutettu vastaavasti. Nyt Agilent-normalisoinnin yhteydess pit valita sirutyyppi.
- cDNA-QC-skriptin kaikkien MA-plottien Y-akselien pitisi olla samalla skaalalla. OK.
- Knnetty qc-affy-rle-nuse -skriptin sirujen nimet pystysuoraan, jotta ne ovat luettavissa
  kaikille siruille.
- ClusterBuster-skripti palauttaa nyt tuloksessa transkriptiofaktoreitten nimet, ei niiden
  matriisiluokkia kuten aiemmin.
- Muuta fenodata tuottamaan sarakkeet jrjestyksess: sample, chiptype, group, training. OK.
- hyperG-skriptin silmukoissa oli pient stmist, koska if..else-lauseet oli muotoiltu vrin.
  Nyt ne on korjattu, ja skriptin pitisi toimia oikein.
- Volcano plot implementoitu.
- Agilent-normalisointia korjattu - sirutyypin valinta ei onnistunut. Nyt pitisi toimia.


Muutokset edellisest versiosta (0.3.6)
- Listty skriptiin stat-several-groups parametrin use.simple.analysis, jota AffyWizard
  kytt asetuksella yes. Oletusarvoisesti se on pois plt.
    - stat-several-groups-foAffyWizard skripti on poistettu.
- importGDS-skripti lis nyt sarakkeiden nimien eteen "chip.", jotta analyysitkin toimivat.
- stat-geneset -skriptist korjattu pieni bugi, joka esti kuvan otsikoiden tulostumisen oikein
  oli (names(substr(...)) kun pitisi olla subtr(names(...)).
- stat-hyperG -skriptist poistettu yksi ylimrinen } yhden if-lauseen lopusta.
- search-correlation -skriptist poistettu debuggaus-rivit.
- Pivitetty hc-skripti: write.tree() -> format="Newick" poistettu.
  - Muutettu takaisin, sill muutoin skripti antaa jotain ihan hp.
- Pivitetty skripti stat-hyperg siten, ett sen pitisi toimia, vaikkei merkitsevi
  tuloksia olekaan saatu.
- Listty norm-cdna -skriptin generoiman fenodatan sample-sarakkeen nimien pern ".tsv". Nyt
  normalisoinnin pitisi toimia.
- suurenna hc-bootstrapping fonttikokoa - OK, nyt 0.75 (ennen 0.5)
- PCA kaatuu (Error in if (no < 3) { : missing value where TRUE/FALSE needed)
    - Ongelmana oli parametri, joka pyydettiin prosentteina (0-100) eik desimaalilukuna
      (0-1). Ongelma korjattu jakamalla prosenttiluku sadalla.
- average-replicates -skriptin pit palauttaa sarakeotsikot tyyliin "chip.group1" ei
  "group1" - OK.
- norm-cdna -skripti ei kirjoita flagej, vaikka ne olisi mritettykin - OK
   - Flagit luettiin vrst objektista (dat3), mutta nyt sen pitisi toimia (luetaan
     objektista dat)
- impute-skriptiin listty tarkistus, ett onko A (average) -matriisin sarakeluku yli 0.
  Jos on, niin kirjotettavaan tiedostoon liitetn mys average-sarakkeet, joten imputen
  pitisi toimia nyt mys cDNA-datalle.
- qc-cdna kaatuu (mihin?)
   - Useita juttuja meni pieleen, erityisesti puuttuvien havaintojen tapauksessa.
     Nyt pitisi toimia.
- filter-expression: korjattu pieni bugi, joka esti funktion toimimisen yhdell sirulla
  (tllin palautettiin scaled.dat2-vektori, jolle apply-funktiota ei voinut kytt, nyt
  muutetaan tuo vektori ensin dataframeksi).
   - sama ongelma vaivasi filter-sd -skripti, mutta sekin on nyt korjattu.
- filter-flags antoi virheilmoituksen yhdelle sirulle, koska vektorin sarakkeiden lukumr
  oli looginen nolla. Nyt muutettu flagit ensin datakehikoksi, ja sitten siit lasketaan
  sarakkeiden lukumr.


Muutokset edellisest versiosta (0.3.5)
- Listty stat-several-groups- skriptiin empirical Bayes -menetelm (limma).
  Affy-wizard kytt tt, ja se toimii todella nopeasti.
- stat-two-groups -skriptiin listty empirical Bayes -menetelm (limma)
- norm-cdna-skripti luki rivien nimet annotaatioksi. Muutettu rivien nimet geenien nimiksi
  ja annotation-sarake annotaatioksi.
- Utility-kategoriaan vrin sijoitetut skriptit on nyt siirretty utilities-kategoriaan.
- ClusterBuster palautti tyhjn tiedoston, koska jasparin matriisitietokantaa ei lytynyt. 
  Ongelma on nyt korjattu (jaspar_cor.tsv muutettu ohjelmakutsussa oikein muotoon 
  jaspar_core.txt).
- export-funktiot kaatuivat heti alkuun, koska luettavan fileen nimi oli normalized. Oikea
  file oli tietysti normalized.tsv, mik onkin nyt korjattu.
- Listty cbust-skriptiin ohjelman asetukset (-c, -m, ... ,-p)
- Listty pudotusvalikko norm-illumina-skriptiin. Valikosta valitaan siru, jonka mukaan valitaan
  kytettv annotaatiokirjasto.
- search-queryword -skriptist korjattu kaksi bugia, joiden takia haku aina eponnistui.
  Query oli muodoissa "chr" ja "genename". Nyt yhtenistetty.
- Affy-wizardille tehty oma versio stat-several-groups -skriptist. Se palauttaa merkitsevt
  geenit, jos niiden adjusted p-arvo on yli p-arvon kriittisen arvon. Muutoin palautetaan
  100 raa'alta p-arvoltaan merkitsevint geeni.
- Muutettu one-sample-text raportoimaan adj.p.value -sarake entisen sekasikinimen sijaan.
- Muutettu estimate-samplesize tuottamaan 600/72 tuuman kokoisia kuvia entisen 600 tuuman sijaan.
- clust-hc -skriptiss ollut kirjastojen latausvirhe korjattu, ja nyt bootstrap-analyysinkin
  pitisi toimia.
- Kommentoitu SOM-skriptist pois gridin koon jrkevyystestaus.
- stat-genesettest-skriptiss poistettu parametri ylab par-asetuksesta ja siirretty se plot-komentoon,
  mihin se oikeasti kuuluisikin.


Muutokset edellisest versiosta (0.3.4)
- Muutettu .txt -> .tsv, joka viittaa nyt vain tab-delimited text -tiedostoon. Samaten
  muutettu .text -> .txt, joka viittaa nyt geneeriseen tekstitiedostoon.
- Muutettu SOM-skriptin oletusvritys sini-keltaiseksi
- Muutettu hierarkkisen ryhmittelyanalyysin skripti siten, ett tuloksena
  on bootstrapin tapauksessa 600/72 tuuman kuva 600 tuuman kuvan sijaan.
- Listty parametrien tsekkausta skripteihin:
   - average-replicates
   - classification-knn
   - cluster-hierarchical
   - cluster-kmeans
   - cluster-som
   - filter-flags
   - filter-sd
   - norm-lme
   - stat-one-group
   - stat-several-groups
   - stat-two-groups   
- export-soft -funktio (kuten tab2mage-funktiokin) tulostaa nyt vain blankon SOFT-fileen.
- fiksattu bugi impute -skriptiss
- fiksattu bugi stat-correlate-with.phenodata -skriptiss. Ajo kaatui, koska skriptille ei
  sytetty fenodataa, vaikka se tarvittiin skriptin suoritukseen.
- Hierarkkinen clusterointi palauttaa nyt tiedoston hc.txt entisen hc.tsv:n sijaan.
- norm-affy -skriptiss valitaan nyt custom chip type pudotusvalikosta vahinkojen vlttmiseksi.


Muutokset edellisest versiosta (0.3.3)
- Normalisointiskripteihin tehty muutos siten, ett skripti kirjoittaa fenodatan 
  kyttliittymn sijaan. Samalla listty parametri, jolla voidaan asettaa custom
  chiptype. Muutokset tehty skripteihin:
    - norm-affy.R
    - norm-illumina.R
    - norm-cdna.R
    - norm-agilent.R
- Normalisointiskriptit tuottavat nyt tiedoston phenodata.txt eivtk yrit en
  lukea sit sisn, ja tuottaa phenodata_out.txt:t.
- Uusi skripti: tab2mage.R, joka kirjoitta tyhjn tab2mage-tiedoston, jonka kyttj
  voi tytt vaikka Exceliss.
- Uusi skripti: import-SOFT.R, joka hakee GDS:n suoraan GEO:sta ko. numerolla, ja
  luo siit normalisoidun datan ja fenodatan.
- Illumina koodia muokattu siten, ett se pystyy lukemaan mys BeadStudio 3:lla tuotetut 
  tiedostot, joissa header-informaatiota on 8 rivia aiempien versioiden 7 sijaan. Tm
  vaati pieni muutoksia datan sisnluvussa ja flag-arvojen generoinnissa. Lisksi
  kyttjn on nyt itse valittava BeadStudion versionumero, jolla data on generoitu.


Muutokset edellisest versiosta (0.3.2)
- Uusi skripti: promoter-retrprom, joka vain hakee promoottorisekvenssit tietokannasta,
  muttei tee niill se pidemmlle menevi analyysej.
- qc-affy -skripti muokattu kyttmn simpleaffy-kirjaston funktioita.
- Uusi skripti: qc-affy-rle-nuse, joka tuottaa RLE- ja NUSE- plotit Affymetrix datalle.
- Uusi skripti: stat-correlate-with-phenodata, joka korreloi geeniekspression 
  phenodatan kanssa. 
- Uusi skripti: average-replicates, joka laskee kunkin ryhmn keskiarvon.
- Uusi skripti: stat-hyperG, joka tekee hypergeometrisen testin GO/KEGG/PFAM-luokille.


Muutokset edellisest versiosta (0.3.1)
- qc-affy -skripti piirt nyt eri sirut eri vreill, ja tekee kuvaan kuvatekstin,
  jossa sirujen nimet ja vrit on spesifioitu.
- clust-som -skrptiin listty sarake, joka kertoo gridin koon (x*y). GUI:n piirtm
  kuva tehdn tmn perusteella.
- Korjattu promoter-cbust -skriptiss ollut virhe, joka esti promoottorisekvenssej
  latautumasta oikein objektiin upstream.
- Korjattu search-correlation -skriptiss ollut vika, joka kaatoi analyysin, jos 
  grep-komento lysi useampia geenej, joissa sama string esiintyi.
- Korjattu search-queryword -skriptiss parametrien nimiin liittyv ristiriita.
  Nin ainakin AFfymetrixID:n perusteella toimiva etsint saatiin toimimaan.
- promoter-cbust -skriptiss ollut tulostiedosto clusters.txt muutettu muotoon
  clusters.text, jolloin kyttliittym osaa sen nytt (.txt viittaa aina matriisiin).


Muutokset edellisest versiosta (0.3.0)
- norm-illum -skripti muutettu toimimaan kytetyn Bioconductor-version (1.9) kanssa.
- norm-illum -skriptin normalisointifunktiot (qspline ja quantile) muutettu kyttmn 
  affy-paketin normalisointia.
- listty skripti Agilent-datan sisnlukua ja normalisointia varten.
- cDNA / Agilent -skripteihin tehty muutoksia flagien ksittelyn osalta. Jos flagej ei ole
  ei niit yritet en kirjoittaakaan, joten skripti ei kaadu niihin.
- Korjattu cbust-skriptiss kirjoitusvirhe, joka esti oikean annotaatiokirjaston latautumisen.
- filter-sd -skriptin kuvausta muokattu: retain->filter out.
- stat-geneset -skriptiss muokattu kuvien marginaaleja.


Muutokset edellisest versiosta (0.2.9)
- Hierarkkinen klusterointi tuotti dendrogram.txt:n, mutta GUI odotti hc.txt:t. Korjattu.
- KNN-skriptiss parametrien arvojen testauksessa oli kirjoitusvirhe (sulku puuttui). Korjattu.
- Idiogram menee ajoon, ja tekee tuloksen, mutta kuva ei ilmesty. GUI odotti tiedostoa
  idiogram.png, mutta tuotettiinkin midiogram.png, mist ongelma johtui. Korjattu.
- Geneset test -skriptiin korjattu GO-luokkien testaus toimivaksi (muuttujan nimi oli vrin.
- Korjattu bugi plier-kirjaston latauksessa plier-normalisoinnin yhteydess.
- KEGG/GO-analyysin tuottaman kuvan marginaaleja pienennetty, jotta kuvasta tulee informatiivisempi.
  Samalla mys tekstikokoa suurennettu hieman.
- qc-affy -skripti korjattu toimimaan mys yhdell sirulla.
- qc-affy -skripti muutettu siten, ett sirut ovat nyt sarakkeina ja kontrolliarvot rivein. 
  Lisksi muutettu rivien ja sarakkeiden nimi hieman.
- qc-affy-skriptiss oletettiin tulevan .jpg-kuva, mutta tulikin .png-kuva. Korjattu.
- stat-geneset-skriptist korjattu kirjoitusvirhe, joka esti kuvien marginaalien skaalauksen.
- SD-filtteriskriptiss "retain" muutettu muotoon "filter.out".
- promoter-cbust -skriptiss korjattu promoottorien kokoon liittyvn vertailuoperaattorin
  kirjoitusvirhe.
- promoter-tfbs -skripti muutettu siten, ett medium-analyysi ajaa mys small-analyysin. 
- promoter-tfbs -skriptist poistettu mahdollisuus ajaa large- ja extra-analyysej
- promoter-tfbs -skripti ei en kirjoita seqs.txt.wee tiedostoa. Tai kirjoittaa kyll,
  mutta sit ei en nytet kyttjlle.


Muutokset edellisest versiosta (0.2.8)
- KNN-skripti muutettu toimivaksi (erottelee .chip- ja muut sarakkeet toisistaan aluksi)
- Hierarkkinen klusterointi muutettu kyttmn pvclust-kirjastoa bootstrap-analyysiss.
- Hierarkkinen klusterointi tuottaa sulkukaavion, joka voidaan parsia VISKI-projektin
  visualisointipalikan kyttn.
- Search-correlation-skriptiss korjattu virhe, joka aiheutti sen, ett skripti toimi vain
  Affyn hgu133a-siruilla, ja lysi silloinkin vain tietyn geenin kanssa samalla tavalla
  ekspressoituneet geenit.
- Idiogrammi-funktiolta puuttui tieto ihmisen kromosomiraidoista. Ongelma korjattu, ja nyt
  skripti toimii.
- Fiksattu bugi one-group test ja several groups test -skripteiss. Tm liittyi korjattujen
  p-arvojen laskemiseen.
- Fiksattu pieni bugi (?) PCA-skriptiss. Jostain syyst skripti toimii hyvin R:ss, muttei en
  jos se suoritetaan NAMI:n kautta. Testataan toimiiko korjattukaan versio NAMI:ssa.
     - Ei toimi vielkn, vaikka samalla datalla skripti toimii R:ss
- Fiksattu SOM-skriptiss vrien mr vastaamaan solujen lukumr siten, ett kukin solu,
  joka on yht kaukana ensimmisest solusta vrjtn samalla vrill.
- Chromosome position plot:ssa ei eroteltu dataa ja flagej, joten skripti kaatui heti krkeen.
- Muutamien kuvien tuotossa tiedostoptteet muutettu oikeiksi (jpg->png).
- Stat-two-group-tests -skriptiss ladataan nyt LPE-kirjasto ennen ko. testin suorittamista.
- Stat-one-group -skriptiss muutettu Wilcoxon-testin kyttm datakehikko vektoriksi, jolloin
  testi toimii oikein.
- Search-queryword -skriptiss korjattu verailuoperaattoriin liittyv virhe, joka esti skriptin 
  ajamisen.
- Muutettu search-correlation -skripti siten, ett korrelaatio voi olla vlilt 0-1 (aiemmin
  -1...1).
- Kutsut png-komentoon on muutettu muotoon bitmap("filename", width=w/72, height=h/72).
- Korjattu muutama lyntivirhe (dat, kun piti olla dat2) plot-chrom-pos -skriptiss.
 

Muutokset edellisest versiosta (0.2.7)
- Manuaalin ensimminen draft valmis.
- Muutettu hakemistopuuta hieman
- Muutettu normalisoinnin yhteydess tapahtuvaa phenodatan levylle kirjoitusta: phenodata-taulukko kirjoitetaan aina
  aluksi levylle, ja siihen listn myhemmin chiptype-sarake, jos se siit puuttuu.


Muutokset edellisest versiosta (0.2.6)
- Skriptien nimi GUI:ssa muokattu hiukan (suodin-skripteiss kerrotaan tm nyt jo nimess, jne.)
- Affymetrix-normalisointeihin listty PLIER-algoritmi
- MAS5- ja PLIER-normalisoidulle datalle on mahdollista tehd VSN-normalisointi (mutta muille ei, sill niiden
  antamat arvot on jo log2-muunnettu, mik ajaa saman asian)
- Listty skriptiin classification-knn.R tarkistuksia asetusten oikeellisuuden suhteen ja poistettu phenodata-taulukkoa
  muokkaavat ominaisuudet.
- Listty skripti otoskoon ja voiman arviointiin (estimate-samplesize.R)
- Hierarkkinen klusterointi toteutettu uudelleen amap-kirjaston hcluster-funktiota kytten. Tm mahdollistaa
  puun muodostamisen suurillekin (>20000 havaintoa) aineistoille suhteellisen lyhyess ajassa (~30 min).
- Hierarkkisen klusteroinnin uudelleenotantafunktio on muutettu tysin. Nykyinen toteutus kytt pvclust-kirjastoa,
  joka tuottaa valmiin kuvan, johon bootsrapping-arvot on aseteltu. Aiempi toteutus laski bootstrapping-puun hitaasti
  yksittisi funktioita kytten. Nykytoteutus on nopeampi (yli 6000X), mutta toisaalta ainoastaan pearsonin 
  korrelaatiota voidaan kytt puun muodostamiseen.
- Tunnettujen transkriptiofaktoreitten sitoutumiskohtien etsimiseen sekvensseist kytetn ClusterBuster-ohjelmaa.
  Tm on uusi skripti TFBS-tykalujen joukkoon.


Muutokset edellisest versiosta (0.2.5)
- GEO:ssa tapahtuneet batch submission -ohjeiden mukaiset muutokset toteutettu export-soft.R skriptiin.
- Idiogrammin piirtv skripti muokattu toimivaksi
- Geenien kromosomaaliset positiot visualisoiva skripti plottaa nyt eri vreill yli- ja aliekspressoituneet geenit
- Phenodataan ei en kirjoiteta chiptype-saraketta, jos se on jo olemassa


Muutokset edellisest versiosta (0.2.4)
- Promoottoritykalu muokattu toimimaan UCSC:st ladatuilla RefSeq-promoottorisekvensseill
   - weederlauncher.out ei toiminut, joten skripti kytt nyt weederTFBS:
- Korjattu bugi filter-expression.R skriptiss. Bugi aiheutti sen, ettei skripti poistanut
  filtterinniss datasta yhtn geeni. 


Muutokset edellisest versiosta (0.2.3)
- LME-skripti muutettu kyttmn nlme-kirjastoa lme4:n sijaan.
- bestim.R-skripti tehty bnBestFit-tykalun integrointia varten.


Muutokset edellisest versiosta (0.2.2)
- Uudet skriptit:
   - cPlot-cColor.R
   - GOFisherTest.R
   - idiogram.R
   - promoter.R
- LME-skripti korjattu kyttmn oikeita residuaaleja


Muutokset edellisest versiosta (0.2.1):
- Skriptien parametrien nimet on pyritty muuttamaan informatiivisiksi


Muutokset edellisest versiosta (0.2.0):
- Phenodata luetaan samasta kansiosta kuin datakin
- Bayesian network-skripti on omana kategorianaan eik en timeseries-skriptien osana
- One-sample t-testi toimii noin 500-kertaa nopeammin kuin aiemmin, funktio kirjoitettu uudelleen


Muutokset edellisest versiosta (0.1.4):
- Bootstrapping-validointi listty hierarkkiseen ryhmitttelyanalyysiin
- Aikasarja-analyysi:
   - Etsi periodisesti muuttuvat geenit
   - Muodosta network
   - Independent component analysis


Muutokset edellisest versiosta (0.1.3):
- Muutettu otsikkotietoja edelleen...


Muutokset edellisest versiosta (0.1.2):
- Korjattu otsikkotiedot
   - Kirjoitusvirheet korjattu
   - Skriptit luokiteltu analyysiympristn luokkiin:
      - Normalisation
      - Preprocessing
      - Clustering
      - Statistics
      - Utility
   - Kyttmttmt luokat
      - Spot filtering
      - Expression
      - Pathways


Muutokset edellisest versiosta (0.1.1):
- Linear Mixed Model korjattu
   - Mahdollistaa satunnaisvaikutusten (batch effect) poistamisen normalisoidusta datasta


Muutokset edellisest versiosta (0.0.2):
- tuki cDNA- ja Illumina-siruille
   - normalisointi
   - monet analyysioptiot toimivat mys nill siruilla
- tuki phenodatalle
   - kaikki skriptit lukevat tarvittaessa parametrit tiedostosta phenodata.txt
   - phenodata.txt:n oletetaan olevan hakemistossa ../../common. Jos se puuttuu
     kirjoitetaan normalisointiskriptien yhteydess dummy-demodata
   - Siis, tuotaessa dataa systeemiin, on tuotava mys phenodata ennen 
     normalisointia.
   - Normalisoinnin yhteydess phenodataan listn yksi sarake, jolla kerrotaan
     sirutyyppi, esimerkiksi Affymetrix-sirun versio.
- Laadun tarkistus (QC) sek Affymetrix ett cDNA/Illumina-datalle
- Filtterinti parannettu, mm.
   - Ekspressioarvon perusteella filtteritess voidaan mritt kuinka monella
     sirulla arvon tulee toteutua, jotta arvo lpisee filtterin.
- Monipuolisemmat tilastolliset tykalut
   - LPE, SAM, etc.
   - Yhdelle sirulle soveltuvat menetelmt (noise-envelope ja Newton)
- Toimiva clusterointi ja useita menetelmi
   - Etisyyden voi valita etisyyksien tai korrelaatioiden joukosta
   - Hierarkkisessa klusteroinnissa tuloksen luotettavuuden voi testata permutaatio-
     testill
- Pkomponenttianalyysi
   - Datasetti koodataan uudelleen halutulla mrll pkomponentteja
- KNN-menetelmn perustuva "diskriminanttianalyysi"
- Datan kirjoitus ulos GEO:n SOFT-formaatissa
   - Edellytt, ett data on kuvattu hyvin phenodata.txt-tiedostossa, ks.
     http://staff.csc.fi/~jtuimala/SOFT/
- Muut toiminnallisuudet
   - Taulukoiden yhdistminen geenin nimien perusteella
   - Geenien etsint korrelaation, nimen, Affymetrix ID:n tai kromosomilokaation 
     perusteella


---------------------------------------------------------------------------------------------------------------------------

R:n installointi Coronalle

- 32-bittinen versio
   gzip R-2.4.0.tar.gz
   tar xvf R-2.4.0.tar
   cd R-2.4.0
   ./configure 'CC=gcc -O3' 'F77=g77 -O3' 'FC=g77 -O3' 'CXX=g++ -O3'
   make
   make check

- 64-bittinen versio
  mkdir R-2.4.0_64bit
  cp R-2.4.0.tar R-2.4.0_64bit/
  cd R-2.4.0_64bit/
  setenv LD_LIBRARY_PATH /usr/local/lib/sparcv9 
  ./configure 'CC=gcc -m64 -O3' 'F77=g77 -m64 -O3' 'FC=g77 -O3' 'CXX=g++ -m64 -O3' 'LDFLAGS=-L/usr/local/lib/sparcv9 -L/usr/local/lib' --without-readline
  make
  make check

- Lispaketit molempiin versioihin
  source("http://www.bioconductor.org/biocLite.R")
  biocLite()
  biocLite(c("ctc", "ssize", "LPE", "Ruuid", "graph", "affyQCReport", "GlobalAncova", "impute", "idiogram", "GOstats", "beadarray", "GeneTS", "simpleaffy", "globaltest"))
  install.packages(c("amap", "ape", "flexclust", "kohonen", "e1071", "sma", "fastICA"), repos="http://cran.r-project.org", dependencies = T)
  biocLite(c("hgu133a", "hgu133acdf", "hgu133aprobe", "ygs98", "ygs98cdf", "ygs98probe", "hgu133a2", "hgu133a2cdf", "hgu133a2probe", "hgu133plus2", "hgu133plus2cdf", "hgu133plus2probe"))
  biocLite(c("hs133ahsrefseq", "hs133ahsrefseqcdf", "hs133ahsrefseqprobe", "hs133av2hsrefseq", "hs133av2hsrefseqcdf", "hs133av2hsrefseqprobe", "hs133phsrefseq", "hs133phsrefseqcdf", "hs133phsrefseqprobe"))
  biocLite(c("GO", "KEGG"))
  # Other organisms, mouse and rat
  biocLite(c("mgu74a", "mgu74acdf", "mgu74aprobe", "mgu74av2", "mgu74av2cdf", "mgu74av2probe", "moe430a", "moe430acdf", "moe430aprobe",
             "mouse4302", "mouse4302cdf", "mouse4302probe", "mouse430a2", "mouse430a2cdf", "mouse430a2probe", 
             "rae230a", "rae230acdf", "rae230aprobe", "rat2302", "rat2302cdf", "rat2302probe", 
             "rgu34a", "rgu34acdf", "rgu34aprobe"))
  # Other organisms, arabidopsis, C. elegans, drosophila, xenopus
  biocLite(c("ag", "agcdf", "agprobe", "ath1121501", "ath1121501cdf", "ath1121501probe", "celegans", "celeganscdf", "celegansprobe",
             "drosgenome1", "drosgenome1cdf", "drosgenome1probe", "drosophila2", "drosophila2cdf", "drosophila2probe",
             "test3probe", "xenopuslaevis", "xenopuslaeviscdf", "xenopuslaevisprobe", "zebrafish", "zebrafishcdf", "zebrafishprobe",
             "yeast2", "yeast2cdf", "yeast2probe", "test3cdf"))
  biocLite(c("hgu95a", "hgu95acdf", "hgu95aprobe", "hgu95av2", "hgu95av2cdf", "hgu95av2probe"))
  # Alternative CDF environments for human, mouse and rat
  biocLite(c(
  "hs133ahsensg", "hs133ahsensgcdf", "hs133ahsensgprobe", "hs133av2hsensg", "hs133av2hsensgcdf", "hs133av2hsensgprobe", 
  "hs133phsensg", "hs133phsensgcdf", "hs133phsensgprobe", "mm430mmensg", "mm430mmensgcdf", "mm430mmensgprobe",
  "mm74av1mmensg", "mm74av1mmensgcdf", "mm74av1mmensgprobe", "mm74av2mmensg", "mm74av2mmensgcdf", "mm74av2mmensgprobe",
  "rn230arnensg", "rn230arnensgcdf", "rn230arnensgprobe", "rn230rnensg", "rn230rnensgcdf", "rn230rnensgprobe",
  "rn34arnensg", "rn34arnensgcdf", "rn34arnensgprobe"
  )) 
  biocLite(c("rgug4105a", "mgug4104a", "mgug4120a"))
  biocLite(c("barley1cdf", "barley1probe", "bovinecdf", "bovineprobe", "canine2cdf", "canine2probe", "caninecdf", "canineprobe",
             "chickencdf", "chickenprobe", "citruscdf", "citrusprobe", "maizecdf", "maizeprobe", "medicagocdf", "medicagoprobe",
             "plasmodiumanophelescdf", "plasmodiumanophelesprobe", "poplarcdf", "poplarprobe", "porcinecdf", "porcineprobe",
             "rhesuscdf", "rhesusprobe", "ricecdf", "riceprobe", "soybeancdf", "soybeanprobe", "sugarcanecdf", "sugarcaneprobe",
             "tomatocdf", "tomatoprobe", "vitisviniferacdf", "vitisviniferaprobe", "wheatcdf", "wheatprobe"))


R:n installointi Murskalle

- 64-bittinen versio
   gzip R-2.5.1.tar.gz
   tar xvf R-2.5.1.tar
   cd R-2.5.1
   ./configure 'CC=gcc -m64 -O3 -fPIC' 'F77=g77 -m64 -O3 -fPIC' 'FC=g77 -O3 -fPIC' 'CXX=g++ -m64 -O3 -fPIC'
   make
   make check
- Lispaketit
  source("http://www.bioconductor.org/biocLite.R")
  biocLite()
  biocLite(c("ctc", "ssize", "LPE", "Ruuid", "graph", "affyQCReport", "GlobalAncova", "impute", "idiogram", "GOstats", "beadarray", "GeneTS", "simpleaffy", "globaltest"))
  install.packages(c("Matrix", "amap", "ape", "flexclust", "kohonen", "e1071", "sma", "fastICA"), repos="http://cran.r-project.org", dependencies = T)
  biocLite(c("hgu133a", "hgu133acdf", "hgu133aprobe", "ygs98", "ygs98cdf", "ygs98probe", "hgu133a2", "hgu133a2cdf", "hgu133a2probe", "hgu133plus2", "hgu133plus2cdf", "hgu133plus2probe"))
  biocLite(c("hs133ahsrefseq", "hs133ahsrefseqcdf", "hs133ahsrefseqprobe", "hs133av2hsrefseq", "hs133av2hsrefseqcdf", "hs133av2hsrefseqprobe", "hs133phsrefseq", "hs133phsrefseqcdf", "hs133phsrefseqprobe"))
  biocLite(c("GO", "KEGG"))
  install.packages(c("XML", "snow"))
  biocLite(c("geneplotter", "biomaRt"))


- 64-bittinen versio
   gzip R-2.6.1.tar.gz
   tar xvf R-2.6.1.tar
   cd R-2.6.1
   ./configure
   make
   make check
- Lispaketit
  # Basic CRAN packages
  install.packages(c("Matrix", "lme4", "amap", "ape", "flexclust", "kohonen", "e1071", "sma", "fastICA"), repos="http://cran.r-project.org", dependencies = T)
  install.packages(c("XML"), repos="http://cran.r-project.org", dependencies=T)
  install.packages(c("aplpack", "corrgram", "deal", "outliers", "prada", "pvclust", "zoo"), repos="http://cran.r-project.org", dependencies=T)

  # Basic Bioconductor packages
  source("http://www.bioconductor.org/biocLite.R")
  biocLite()
  biocLite(c("ctc", "ssize", "LPE", "Ruuid", "graph", "affyQCReport", "GlobalAncova", "impute", "idiogram", "GOstats", "beadarray", "GeneTS", "simpleaffy", "globaltest"))
  biocLite(c("geneplotter", "biomaRt", "lumi", "prada", "siggenes", "plier")) 

  # Annotation packages for Affymetrix
  # Human and yeast
  biocLite(c("hgu133a", "hgu133acdf", "hgu133aprobe", "ygs98", "ygs98cdf", "ygs98probe", "hgu133a2", "hgu133a2cdf", "hgu133a2probe", "hgu133plus2", "hgu133plus2cdf", "hgu133plus2probe"))
  biocLite(c("hs133ahsrefseq", "hs133ahsrefseqcdf", "hs133ahsrefseqprobe", "hs133av2hsrefseq", "hs133av2hsrefseqcdf", "hs133av2hsrefseqprobe", "hs133phsrefseq", "hs133phsrefseqcdf", "hs133phsrefseqprobe"))
  biocLite(c("GO", "KEGG"))

  # Mouse and Rat
  biocLite(c("mgu74a", "mgu74acdf", "mgu74aprobe", "mgu74av2", "mgu74av2cdf", "mgu74av2probe", "moe430a", "moe430acdf", "moe430aprobe",
             "mouse4302", "mouse4302cdf", "mouse4302probe", "mouse430a2", "mouse430a2cdf", "mouse430a2probe", 
             "rae230a", "rae230acdf", "rae230aprobe", "rat2302", "rat2302cdf", "rat2302probe", 
             "rgu34a", "rgu34acdf", "rgu34aprobe"))

  # Other organisms, arabidopsis, C. elegans, drosophila, xenopus
  biocLite(c("ag", "agcdf", "agprobe", "ath1121501", "ath1121501cdf", "ath1121501probe", "celegans", "celeganscdf", "celegansprobe",
             "drosgenome1", "drosgenome1cdf", "drosgenome1probe", "drosophila2", "drosophila2cdf", "drosophila2probe",
             "test3probe", "xenopuslaevis", "xenopuslaeviscdf", "xenopuslaevisprobe", "zebrafish", "zebrafishcdf", "zebrafishprobe",
             "yeast2", "yeast2cdf", "yeast2probe", "test3cdf"))
  biocLite(c("hgu95a", "hgu95acdf", "hgu95aprobe", "hgu95av2", "hgu95av2cdf", "hgu95av2probe"))

  # Alternative annotations
  biocLite(c(
  "hs133ahsensg", "hs133ahsensgcdf", "hs133ahsensgprobe", "hs133av2hsensg", "hs133av2hsensgcdf", "hs133av2hsensgprobe", 
  "hs133phsensg", "hs133phsensgcdf", "hs133phsensgprobe", "mm430mmensg", "mm430mmensgcdf", "mm430mmensgprobe",
  "mm74av1mmensg", "mm74av1mmensgcdf", "mm74av1mmensgprobe", "mm74av2mmensg", "mm74av2mmensgcdf", "mm74av2mmensgprobe",
  "rn230arnensg", "rn230arnensgcdf", "rn230arnensgprobe", "rn230rnensg", "rn230rnensgcdf", "rn230rnensgprobe",
  "rn34arnensg", "rn34arnensgcdf", "rn34arnensgprobe"
  )) 

  # Other organisms with no annotations
  biocLite(c("barley1cdf", "barley1probe", "bovinecdf", "bovineprobe", "canine2cdf", "canine2probe", "caninecdf", "canineprobe",
             "chickencdf", "chickenprobe", "citruscdf", "citrusprobe", "maizecdf", "maizeprobe", "medicagocdf", "medicagoprobe",
             "plasmodiumanophelescdf", "plasmodiumanophelesprobe", "poplarcdf", "poplarprobe", "porcinecdf", "porcineprobe",
             "rhesuscdf", "rhesusprobe", "ricecdf", "riceprobe", "soybeancdf", "soybeanprobe", "sugarcanecdf", "sugarcaneprobe",
             "tomatocdf", "tomatoprobe", "vitisviniferacdf", "vitisviniferaprobe", "wheatcdf", "wheatprobe"))

  # Annotation packages for Agilent
  biocLite(c("hgug4100a", "hgug4101a", "hgug4110b", "hgug4111a", "hgug4112a"))
  biocLite(c("rgug4105a", "rgug4130a"))
  biocLite(c("mgug4104a", "mgug4120a", "mgug4121a", "mgug4122a"))

  # Annotation packages for Illumina
  biocLite(c("illuminaHumanv1", "illuminaHumanv2", "illuminaMousev1", "lumiHumanV1", "lumiHumanV2", "lumiMouseV1", "lumiRatV1"))

  # Extra packages
  # Download: http://addictedtor.free.fr/packages/
  # Needed: fpc, A2R
  # Some annotation packages (Illumina ProbeIDs and Affymetrix exon arrays) are available on a disk.


---------------------------------------------------------------------------------------------------------------------------

Coronalla Chipster vaatii siis toimiakseen seuraavat kirjastot:

A2R
affy
affy19173alt
affy19173altcdf
affydata
affyio
affyPLM
affyQCReport
ag
agcdf
agprobe
amap
annaffy
AnnBuilder
annotate
ape
aplpack
ath1121501
ath1121501cdf
ath1121501probe
barley1cdf
barley1probe
base
beadarray
Biobase
Biostrings
boot
bovinecdf
bovineprobe
canine2cdf
canine2probe
caninecdf
canineprobe
Category
celegans
celeganscdf
celegansprobe
cellHTS
chickencdf
chickenprobe
citruscdf
citrusprobe
class
clue
cluster
corpcor
corrgram
ctc
datasets
DBI
deal
drosgenome1
drosgenome1cdf
drosgenome1probe
drosophila2
drosophila2cdf
drosophila2probe
DynDoc
e1071
ellipse
exon.pmcdf
fastICA
fdrtool
flexclust
foreign
fpc
gcrma
gdata
gee
GeneCycle
genefilter
GeneNet
geneplotter
GeneTS
GEOquery
GlobalAncova
globaltest
GO
GOstats
graph
graphics
grDevices
grid
gtools
hgu133a
hgu133a2
hgu133a2cdf
hgu133a2probe
hgu133acdf
hgu133aEG800
hgu133aprobe
hgu133atranscriptrefseq
hgu133atranscriptrefseqcdf
hgu133plus2
hgu133plus2cdf
hgu133plus2probe
hgu95a
hgu95acdf
hgu95aprobe
hgu95av2
hgu95av2cdf
hgu95av2probe
hgug4100a
hgug4101a
hgug4110b
hgug4111a
hgug4112a
hs133ahsensg
hs133ahsensgcdf
hs133ahsensgprobe
hs133ahsrefseq
hs133ahsrefseqcdf
hs133ahsrefseqprobe
hs133av2hsensg
hs133av2hsensgcdf
hs133av2hsensgprobe
hs133av2hsrefseq
hs133av2hsrefseqcdf
hs133av2hsrefseqprobe
hs133phsensg
hs133phsensgcdf
hs133phsensgprobe
hs133phsrefseq
hs133phsrefseqcdf
hs133phsrefseqprobe
idiogram
illuminaHumanBCv1 
illuminaHumanBCv2 
illuminaHumanv1
illuminaHumanv2
illuminaMouseBCv1
illuminaMouseBCv1p1
illuminaMousev1
illuminaMousev1p1
illuminaRatBCv1
illuminaRatv1
impute
KEGG
KernSmooth
kohonen
lattice
limma
locfdr
longitudinal
LPE
lpSolve
maizecdf
maizeprobe
marray
MASS
matchprobes
medicagocdf
medicagoprobe
methods
mgcv
mgu74a
mgu74acdf
mgu74aprobe
mgu74av2
mgu74av2cdf
mgu74av2probe
mgug4104a
mgug4120a
mgug4121a
mgug4122a
mlbench
mm430mmensg
mm430mmensgcdf
mm430mmensgprobe
mm74av1mmensg
mm74av1mmensgcdf
mm74av1mmensgprobe
mm74av2mmensg
mm74av2mmensgcdf
mm74av2mmensgprobe
modeltools
moe430a
moe430acdf
moe430aprobe
mouse4302
mouse4302cdf
mouse4302probe
mouse430a2
mouse430a2cdf
mouse430a2probe
multtest
nlme
nnet
nplplot
outliers
plasmodiumanophelescdf
plasmodiumanophelesprobe
plier
poplarcdf
poplarprobe
porcinecdf
porcineprobe
prada
pvclust
quadprog
rae230a
rae230acdf
rae230aprobe
randomForest
rat2302
rat2302cdf
rat2302probe
RBGL
RColorBrewer
RCurl
Rgraphviz
rgu34a
rgu34acdf
rgu34aprobe
rgug4105a
rgug4130a
rhesuscdf
rhesusprobe
ricecdf
riceprobe
rn230arnensg
rn230arnensgcdf
rn230arnensgprobe
rn230rnensg
rn230rnensgcdf
rn230rnensgprobe
rn34arnensg
rn34arnensgcdf
rn34arnensgprobe
robustbase
ROC
rpart
RSQLite
RUnit
Ruuid
scatterplot3d
siggenes
simpleaffy
sma
snow
soybeancdf
soybeanprobe
SparseM
spatial
splines
ssize
statmod
stats
stats4
sugarcanecdf
sugarcaneprobe
survival
tcltk
test3cdf
test3probe
tomatocdf
tomatoprobe
tools
tweedie
utils
vitisviniferacdf
vitisviniferaprobe
vsn
wheatcdf
wheatprobe
xenopuslaevis
xenopuslaeviscdf
xenopuslaevisprobe
XML
xtable
YEAST
yeast2
yeast2cdf
yeast2probe
ygs98
ygs98cdf
ygs98probe
zebrafish
zebrafishcdf
zebrafishprobe
zoo

