En ændring til en "Ace" genet forudsigelse program af dataloger på Washington University i St. Louis nu gør det muligt for forskerne at forudsige den meget begyndelsen af gen transskription begynder steder, og hvor de første splejse opstår dermed definere det første exon af genet.
Ændringen til genet forudsigelse software TWINSCAN kaldes N-SCAN. Michael Brent, Ph.D. professor i datalogi ved Washington University i St. Louis , sammen med Samuel S. Gross, derefter en bachelor på Washington University, og Randall H. Brown, Ph.D., forsker, rapportere deres resultater i maj 2005-udgaven af Genome Research. N-SCAN har vist sig at være det bedste program til rådighed på at finde både transskription startsted (TSS) og afsluttet første exon i både den menneskelige og bananfluen genomer.
Tilføjelsen af N-SCAN til TWINSCAN giver nu genomik forskerne de nødvendige midler til at finde og forudsige både protein sekvenser produceret af gener og deres uoversatte regioner. Forskere i de seneste år er blevet stadig mere begejstrede for betydningen af uoversatte regioner. Ved at forstå funktionen af disse regioner, forventer forskerne at forstå mere om genregulering - hvordan generne bliver tændt og slukket, tændingen af vores DNA, hvis du vil.
For at gøre de proteiner, der er de grundlæggende mikro-maskiner af livet, er en region af genomet kopieres, eller "omskrives" til at danne et molekyle kaldet messenger-RNA (mRNA). Nogle dele af mRNA bliver derefter kasseres, og beholdt segmenterne er splejset sammen. Genetikere har traditionelt antaget, at transskriptionen starter inden for et par hundrede baser af protein-kodende region. Men for næsten 40 procent af de kendte menneskelige gener, starter transskription længe før begyndelsen af den protein-kodende region. Det meste af denne ekstra lange uoversatte region er derefter kasseres ved splejsning de 5 'utranslaterede region (UTR). Alle de tilstedeværende gen finde systemer - bortset fra N-SCAN - enten ignorere UTR splejse sites eller incorrectly indarbejde dem i nogle protein-kodende segment, hvilket gør genet forudsigelse et ikke alt for sikker på industrien.
"Vi har konstateret, at når vi tilføjer den splejset uoversatte regioner til vores system, vi ikke kun får gode forudsigelser for UTRs, men også bedre forudsigelser af de protein-kodende region af genet. Ved korrekt at identificere UTRs, kan vi undgå mærkning af dem forkert som en del af protein-kodende region, "siger Brent, der, med forskellige kolleger, der er udviklet både TWINSCAN og N-SCAN. "Det er vigtigt at kende disse to områder. Nogle af de signaler, der regulerer transskription bor lige i nærheden af transskriptionen webstedet. Der er en enorm mængde af biologi til at blive opdaget der, og forståelse for dette område vokser dagligt."
Mens genomforskning forskere for 15 år siden lagt megen vægt på dele af genomet uden for de kodende regioner, har de opdaget nogle mærkelige funktioner i UTR, der har provokeret andet og tredje tanker.