2008年03月24日

遺伝子と、たんぱく質とアミノ酸

以前にも記事に書いた気がしますが、今回はDNAとアミノ酸、たんぱく質、それぞれの関係について紹介したいと思います。ごくごく基本的なところなので、高校生以上の生物履修者には当たり前すぎることだと思います。


たんぱく質とは何か。

それは「アミノ酸の鎖」です。私たちの体を構成するたんぱく質は10万種類ほどあるといわれていますが、その全てが20種類のアミノ酸が鎖のように連なることで作られています(アミノ酸についてはビジュアル生理学というサイトのこのページを参照してください)。



遺伝子とは何か、つまり、生き物を作るために保存しておく必要のある情報は何か。

それはアミノ酸の配列。

実は、私たち生物が遺伝子によって記録しているのは、たった一つ、アミノ酸の配列だけです。

まぁ厳密に言えば、その遺伝子を、記された情報をそのままに表面を加工することで更なる情報を付加はしているのですが。ちょうど、文章とフォントみたいな感じでしょうか。太字とか斜体とか下線とか、そんな感じの修飾も情報として重要だといわれています。(エピジェネティクスと呼ばれている分野です。)


と、話を戻します。

私たちが本当の意味で保存しているのは、アミノ酸の配列だけです。あとの修飾は、その読み方に関する情報などであるといわれています。

遺伝子、物質名でいう“DNA”は、デオキシ リボ核酸の略称で、私たちは4種類のデオキシ リボ核酸を並べることで情報を作っています。

つまり、遺伝子は4種の記号(文字)のみで書かれた設計書なんです。

その4種類は構造の一部分、塩基と呼ばれる部分が違います。よくDNAの塩基配列って言いますよね。違うところは塩基の部分だけですので、その部分が情報に当たるんです。

その塩基部分の名称がグアニン、シトシン、チミン、アデニンであるため、塩基配列はその頭文字からG,C,T,Aと略されます。

たとえば、とある遺伝子の配列は

 CTAAATTGTA AGCGTTAATA TTTTGTTAAA ATTCGCGTTA AATTTTTGTT
AAATCAGCTC ATTTTTTAAC CAATAGGCCG AAATCGGCAA AATCCCTTAT
AAATCAAAAG AATAGACCGA GATAGGGTTG AGTGTTGTTC CAGTTTGGAA
CAAGAGTCCA CTATTAAAGA ACGTGGACTC CAACGTCAAA GGGCGAAAAA
CCGTCTATCA GGGCGATGGC CCACTACGTG AACCATCACC CTAATCAAGT
TTTTTGGGGT CGAGGTGCCG TAAAGCACTA AATCGGAACC CTAAAGGGAG
CCCCCGATTT AGAGCTTGAC GGGGAAAGCC GGCGAACGTG GCGAGAAAGG
AAGGGAAGAA AGCGAAAGGA GCGGGCGCTA GGGCGCTGGC AAGTGTAGCG
GTCACGCTGC GCGTAACCAC CACACCCGCC GCGCTTAATG CGCCGCTACA
GGGCGCGTCC CATTCGCCAT TCAGGCTGCG CAACTGTTGG GAAGGGCGAT
CGGTGCGGGC CTCTTCGCTA TTACGCCAGC TGGCGAAAGG GGGATGTGCT
GCAAGGCGAT TAAGTTGGGT AACGCCAGGG TTTTCCCAGT CACGACGTTG
TAAAACGACG GCCAGTGAGC GCGCGTAATA CGACTCACTA TAGGGCGAAT
TGGAGCTCCA CCGCGGTGGC GGCCGCTCTA GAACTAGTGG ATCCCCCGGG
CTGCAGGAAT TCGATATCAA GCTTATCGAT ACCGTCGACC TCGAGGGGGG
GCCCGGTACC CAGCTTTTGT TCCCTTTAGT GAGGGTTAAT TGCGCGCTTG
GCGTAATCAT GGTCATAGCT GTTTCCTGTG TGAAATTGTT ATCCGCTCAC
AATTCCACAC AACATACGAG CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG
CCTAATGAGT GAGCTAACTC ACATTAATTG CGTTGCGCTC ACTGCCCGCT
TTCCAGTCGG GAAACCTGTC GTGCCAGCTG CATTAATGAA TCGGCCAACG
CGCGGGGAGA GGCGGTTTGC GTATTGGGCG CTCTTCCGCT TCCTCGCTCA
CTGACTCGCT GCGCTCGGTC GTTCGGCTGC GGCGAGCGGT ATCAGCTCAC
TCAAAGGCGG TAATACGGTT ATCCACAGAA TCAGGGGATA ACGCAGGAAA
GAACATGTGA GCAAAAGGCC AGCAAAAGGC CAGGAACCGT AAAAAGGCCG
CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC CCCCTGACGA GCATCACAAA
AATCGACGCT CAAGTCAGAG GTGGCGAAAC CCGACAGGAC TATAAAGATA
CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT GCGCTCTCCT GTTCCGACCC
TGCCGCTTAC CGGATACCTG TCCGCCTTTC TCCCTTCGGG AAGCGTGGCG
CTTTCTCATA GCTCACGCTG TAGGTATCTC AGTTCGGTGT AGGTCGTTCG
CTCCAAGCTG GGCTGTGTGC ACGAACCCCC CGTTCAGCCC GACCGCTGCG
CCTTATCCGG TAACTATCGT CTTGAGTCCA ACCCGGTAAG ACACGACTTA
TCGCCACTGG CAGCAGCCAC TGGTAACAGG ATTAGCAGAG CGAGGTATGT
AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG GCCTAACTAC GGCTACACTA
GAAGGACAGT ATTTGGTATC TGCGCTCTGC TGAAGCCAGT TACCTTCGGA
AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA CAAACCACCG CTGGTAGCGG
TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC
AAGAAGATCC TTTGATCTTT TCTACGGGGT CTGACGCTCA GTGGAACGAA
AACTCACGTT AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC
CTAGATCCTT TTAAATTAAA AATGAAGTTT TAAATCAATC TAAAGTATAT
ATGAGTAAAC TTGGTCTGAC AGTTACCAAT GCTTAATCAG TGAGGCACCT
ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT GACTCCCCGT
CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG
CAATGATACC GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA
AACCAGCCAG CCGGAAGGGC CGAGCGCAGA AGTGGTCCTG CAACTTTATC
CGCCTCCATC CAGTCTATTA ATTGTTGCCG GGAAGCTAGA GTAAGTAGTT
CGCCAGTTAA TAGTTTGCGC AACGTTGTTG CCATTGCTAC AGGCATCGTG
GTGTCACGCT CGTCGTTTGG TATGGCTTCA TTCAGCTCCG GTTCCCAACG
ATCAAGGCGA GTTACATGAT CCCCCATGTT GTGCAAAAAA GCGGTTAGCT
CCTTCGGTCC TCCGATCGTT GTCAGAAGTA AGTTGGCCGC AGTGTTATCA
CTCATGGTTA TGGCAGCACT GCATAATTCT CTTACTGTCA TGCCATCCGT
AAGATGCTTT TCTGTGACTG GTGAGTACTC AACCAAGTCA TTCTGAGAAT
AGTGTATGCG GCGACCGAGT TGCTCTTGCC CGGCGTCAAT ACGGGATAAT
ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG CTCATCATTG GAAAACGTTC
TTCGGGGCGA AAACTCTCAA GGATCTTACC GCTGTTGAGA TCCAGTTCGA
TGTAACCCAC TCGTGCACCC AACTGATCTT CAGCATCTTT TACTTTCACC
AGCGTTTCTG GGTGAGCAAA AACAGGAAGG CAAAATGCCG CAAAAAAGGG
AATAAGGGCG ACACGGAAAT GTTGAATACT CATACTCTTC CTTTTTCAAT
ATTATTGAAG CATTTATCAG GGTTATTGTC TCATGAGCGG ATACATATTT
GAATGTATTT AGAAAAATAA ACAAATAGGG GTTCCGCGCA CATTTCCCCG
AAAAGTGCCA C


みたいな感じで示せます。私たちの設計図には、こんな感じで塩基が30億ほど並んでいます。



次に、DNAとアミノ酸の関係です。

私たちのたんぱく質は20種類のアミノ酸で作られていますので、4つの記号では3つを組み合わせる必要があります。ATCGのみを使って20種類の並びを作るには文字を3つ並べる必要がある、ということです。

1つでは4種類しかありませんし、2つでは最初が4つとその後が4つで合わせて16種類しかありません。3つだと4・4・4で64種類の並び方が存在します。

そのため、4種類の核酸で20種類のアミノ酸を記すには3文字ずつ区切っていけば充分です。

事実、私たちの遺伝子は3文字単位で区切られていて、それぞれに対応するアミノ酸が存在します。

その対応関係はわかっていて、コドン表と呼ばれています。(実際の表はwikipediaコドン表を参照。ただ、ここではDNAではなくRNAの塩基で表記されていますので、チミンがウラシルになっています。流れとしては、DNA→RNA→アミノ酸なので:wikiセントラルドグマ

コドン表は、核酸3つとアミノ酸の対応表で、この対応表どおりにDNAを読んでアミノ酸の鎖が作られることで私たちの体は作られ機能しています。


そして、DNAの記録どおりにアミノ酸を並べて作られたたんぱく質が私たちの体を構成しています。


アミノ酸20種類にはアルファベット1文字での略称があるのですが、一般的に、たんぱく質のアミノ酸配列を示すときには、そのアルファベットを並べます。

DNAで塩基の名前を並べたように、たんぱく質ではアミノ酸の名前を並べるんです。

たとえば、ロドプシンのアミノ酸配列は次の図のような感じで示せます。

ロドプシン









ロドプシンは7回細胞膜を貫通していますので、それを表すように並べてあります。もちろん、DNAのように文字だけをずらっと並べることもありますが、こっちの方がロドプシンをイメージしやすいです。



私たちの体はまずたんぱく質から出来ています。

というのは、先ほど書いたとおり、遺伝情報としてはたんぱく質の情報しかもっていないんです。

他の要素は全て作られたたんぱく質によって調整されたり合成されたりするんです。

もちろん、DNAだけを容器に入れていても生物は出来ません。受精卵には、体作りを開始するためのきっかけや材料が含まれています。


ただ、基本的に、「アミノ酸配列の記されたDNA情報からアミノ酸が並べられてたんぱく質が作られる」ことで、私たちの体は作られ、機能しているということです。

これがある意味、生きているということなんです。


posted by new_world at 08:25| Comment(4) | TrackBack(0) | 生命の科学 | このブログの読者になる | 更新情報をチェックする
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。