SEARCH

PAGETOP

Vol.2
大学院生前田日向子さんと行く立花研究室ツアー ゲノムの研究者とドライ解析をしてみよう! 2021.7.5

大学院生の前田日向子さんとともに、立花研究室(エピゲノムダイナミクス研究室)の前田亮先生と立花誠先生を訪ねました。立花研究室では、ほ乳類の発生におけるエピゲノムの変動の役割について研究されており、マウスの性決定についても重要な発見をされています。前田日向子さんは、佐々木研究室(初期胚発生研究室)で、着床前のマウスの初期胚に注目して体を正確につくるしくみについて研究されています。ふだんは細胞を観察し、遺伝子の発現をしらべるなど、生き物をつかう実験にどっぷりつかっているそうです。このたび、生き物をつかわず、コンピュータだけでできる解析(ドライ解析)を体験。とっつきにくい印象をもっていた日向子さんも、体験してみて印象が変わったそうです。そのときの様子をすこしご紹介します。

(企画広報室)

前田亮(→亮):ようこそ。今日は顕微鏡をのぞくとかいうことはせずに、コンピュータだけでなにができるかを体験してもらいます。次世代シーケンサーが誕生して以来、ゲノムの膨大なデータを解析する機会も増えていますから、生き物をつかって実験する(ウェットな)研究者も、自分でドライ解析ができると、なにかといいですね。

前田日向子(→日向子):講義でもきいたことがあり、興味はあるのですが、むずかしそうです。専門のひとに依頼していますが、自分でできるようになれたらいいなと思います。

:依頼すると、満足のいく結果を得るまでに1〜2ヶ月はかかるのがもどかしいですね。ドライ解析も、生き物をつかう実験とおなじように、一回では済まないです。どういうパラメータをいれ、どういうパラメータをのぞくのがいいか、いろいろと試さないとね。自分でできるようになると、時間もかからないし、たのしいですよ。

日向子:できるようになるまで、どれくらいかかりますか?

:2〜3週間くらいかな。才能は要らないし、センスも要らない。ウェットな研究者が解析プログラムをつくる必要はないから、やる気があればできます!モチベーションを維持できるかどうかが鍵です。自分の実験データをつかうといいですよ。日向子さんは、どんな研究をしているんでしたっけ?

日向子:再生と発生に興味があり、二年次(修士)までは、受精卵が桑実胚から胚盤胞へすすむステージに注目して発生が正確に進むための制御機構をしらべていました。いまは、着床前のステージすべてを視野にいれて研究しています。着床後におこるダイナミックな変化が初期胚のどこに由来するのか、すべてのきっかけとなるものをつかみたいと思っています。

:遺伝子の発現がガラッと変わるきっかけとか、発生のメカニズム、知りたいですよね。今回、日向子さんにも馴染みがありそうなデータで、うちの研究室が昨年発表した論文にもつかわれたものを見ていただきましょう。

日向子:あの「マウス性決定遺伝子Sryの全貌をついに解明」というScienceの論文ですね。

『サイエンス誌に載った日本人研究者』(Science, Japanese Scientists in Science 2020, 2021 Issue, March 2021, p49)

論文タイトル:The mouse Sry locus harbors a cryptic exon that is essential for male sex determination
論文内容:性決定因子をコードすると信じられていた遺伝子のDNA領域(エキソン)は、その周辺が特殊な構造をしていたため「真の」かたちと機能が、みえていなかったというもの。性決定遺伝子と信じられていたエキソンだけでは、実は不安定なタンパク質しか作れず、このたび発見されたエキソンこそが、生体内で機能する真のオス化因子をコードしていた。

:これまで知られてこなかった「隠れエキソン」がみつかり、そこに真の性決定因子がコードされていることがわかったというものです。その発見にドライ解析がどのように役立てられたか、見てもらおうと思います。

Sryを発現する細胞をつかい、次世代シーケンサーで、すべての遺伝子の発現(転写)を読み取り、転写産物がどのように分布するのか、解析しました。解析する前のデータは、こんな感じです。

日向子:配列だというのはわかりますが、むずかしそうですね。

:四行セットでひとつの転写産物に対応しています。四千万くらいのセットがあります。これらの転写産物すべてについて、それぞれがゲノムのどこに由来するのか、マッピングします。表計算ソフトではめんどうなことになり、とてもやってられませんね。それがドライ解析を学び始めた理由のひとつです。

日向子:なるほど、そういうきっかけだったのですね。マッピングは、どんなプログラミングをするのですか?

:UCSC、Ensemblなど、バイオ系のデータベースに登録されているゲノムの配列と、次世代シークエンサーで取得したリード配列(転写産物)を比較します。ぼくたちのプログラミングはこんな感じです。

:解析プログラムへのインプット(リード配列)と、そこからのアウトプット、参照するゲノムの情報などを記述しています。

日向子:思ったよりも簡単に記述できるのですね。

:ウェットな研究者が簡単に使えるように、バイオインフォマティシャン(生命情報科学の研究者)が解析プログラムをつくってくれていますからね。アウトプットは、こんな感じになります。

:そのままではわかりにくいですが、すべての転写産物について、それらがゲノムのどこにどれくらいの精度でマッピングされたかを示しています。IGV*というゲノムブラウザで見ると、次のようになります。Sryの周辺をみてみましょう。Genesで示した部分が、Sryのタンパク質をコードしている領域です。左右にのびる青色の直線がゲノムで、そのうえに立っている青色のピークが転写産物です。

  • *IGV(Integrative Genomics Viewer)は、マッピングデータを視覚的に確認することができる大変便利なツールで、米Broad Instituteによって作成されたゲノムブラウザ。

Sryの発現パターンをIGVでみたもの

Sry周辺のゲノム構造は特殊で、知られていたエキソンを挟んで左右で完全に同じ配列が鏡写しに存在するパリンドローム構造がある。この構造内の転写産物の配列リードは、どちらに由来するか区別がつかないので、左右両方にマッピングされる。

日向子:緑で囲った部分がSryの転写産物ですね。

:このデータを見た研究者が、おかしな転写産物があると言い出したんです。赤で囲った部分がそれです。Sryから離れた部分に転写産物がマッピングされていますね。

日向子:なるほど、まさにこれが今回の発見の鍵ですね。たしかに、Sryと同じくらいの発現量がありますね。

:次の図を見てください。どこからどれくらいの長さで転写されるのか、今回のツアーで紹介したRNA-seqにくわえ、CAGE-seq、Long-read RNA-seqという方法でしらべています。

性決定に関わっている細胞からRNAを抽出し、Sry近傍の遺伝子発現(転写)を包括的に調べたもの

転写を網羅的に解析:RNA-seq、転写開始点を解明:CAGE-seq、転写産物を断片化せずに長いまま解析:long-read RNA-seq。

:どこからどれくらいの長さで転写されるのか、わかりますね。ひとつのエキソンでなりたつSryにくわえ、ふたつのエキソンにわかれてコードされているSryがあります。

日向子:なるほど、赤い点線で囲まれたマッピングが「隠れエキソン」ですね。

:それで、その領域を削ったら、マウスが性転換したというわけです。言うのは簡単ですが、このマウスをつくるのはとてもたいへんでした。

日向子:性転換したマウスでは、遺伝子の発現はどのようになりますか。

:オス(XY)、メス(XY)、そしてSryの隠れエキソンが発現しないようにしたオス(Sry KO)についてすべての遺伝子の発現を比較してみると、次の図になります。

:XX、XY、Sry KOそれぞれふたつずつ、縦に遺伝子が並んでいます。それぞれの遺伝子の発現の度合いが、色で表されています。水色はあまり発現していないもの。紫色がたくさん発現しているもの。右の二列がオスで、中の二列がメス。注目してほしいのは、左の二列です。Sryの隠れエキソンが発現しないようにしたオスなのですが、メスにそっくりなパターンでしょ。第一エキソンは発現しているのに、オスにならない。

日向子:第二エキソンが真の性決定因子をコードしている証拠ですね。きれいな図です。

:この図は、いままで解析してきたなかでいちばん美しいと思います。マッピングして定量してグラフにしただけです。マッピングは、処理がおわるまでに、3年前は2時間くらいかかったけれど、この頃は3分間くらい。

日向子:パソコンの性能がよくなったからですか?

:それもあるけれど、解析プログラムの進化かな。そのあたり、日進月歩だから、論文をしっかり読まないといけない。解析プログラムにも流行があり、以前の解析をすべてやり直さないといけなくなることもあリます。

日向子:ドライ解析だけの論文ってあるのですか。

:それだけで業績になることもあるけれど、ウェットな実験をサポートすることが多いですね。研究室の生産性が上がり、自分の業績も増えます。ウェットな実験をしながらドライ解析をするのは、正直、つらいけれど、やっていますよ。

亮先生はあくまでウェットな実験を主に行う(全体の約95%?)研究者であり、ES細胞も使っておられます。

ドライ解析の体験を終えたところで、研究室主催者の立花先生を訪ねました。日向子さんも気になるのは、やはりエポックメイキングな論文のこと。

日向子:どうしたらScienceに論文を出せますか?

立花:うーん、難しい質問です。ハイインパクトジャーナルが狙えるような成果って、期待するとスルリと逃げていく気がします。地味ですが、日々多くの実験をこなすことが重要かもしれません。そうしてると、「あれ、これどういうこと?」みたいな予想外の結果に出くわすことがあります。これを逃さないことでしょうか。2013年のScienceのときもそうでした。

:そうですね。でも、立花先生は、チャンスをつかんだら放さないとは思います。

立花先生と亮先生は趣味で釣りをされるそうです。釣りをたのしむ研究者のいう「つかんだら放さない」にいっそう重みを感じました。お二人は徳島大学にいたときに「エピゲノム釣友会」を結成し、よく釣りに出かけていたそうです。

立花:魚を釣る感覚とサイエンスが似ているかというと、どうでしょうかね。「隠れエキソン」の論文の筆頭著者の宮脇くんも、徳島大のエピゲノム釣友会のメンバーでした(と言っても全メンバーは3人ですが)。宮脇くんは昨年母校の岐阜大に異動しました。2013年のScienceのとき、前田くんは千葉から、宮脇くんは北海道から論文を読んで一緒に研究がしたいと連絡をくれました。内容で研究室を選び、徳島までついてきてくれたのがうれしかったです。

日向子:仕事も趣味も、好みが合うっていい関係ですね。ところで、立花先生はいまも実験はされますか?

立花:しますよ。研究室主催者だからといって書き物ばかりしているとカンが鈍っていくように思います。実験していると調子がいいです。テーマもありますよ。先日、クローニングをしたのですが、かつて苦労していたトリプルライゲーションなんかも、いまや簡単にできる方法が開発されていて驚きました。

日向子:ドライ解析はされるのでしょうか?

立花:ドライは、前田くんに任せています。若いうちにやっとくといいですね。

日向子:亮さんはどれくらいドライ解析をされているのですか?

:Rは修士二年からです。Perlは三年間くらいかな。学生の時に覚えておくと、楽ですよ。ウェットな実験の気晴らしにもなるしね。

日向子:覚えたいです。どんな言語を学ぶのがよいですか?

:いろいろあるけれど、RとPythonができれば、ほとんどカバーできますよ。つかっているひとが多い言語ほど、よいと思います。ディープラーニングは、Pythonをつかうことが多いです。バイオインフォマティクスは、Rから入るのがよいかもしれません。表計算の感覚でうごかせて、イメージがしやすいので。つかっている研究者にきくのが、はやいですよ。

日向子:たよれるひとが近くにいると安心ですね。

:ウェットな研究者が困っていることも、ドライ解析で一瞬にして解決することがあります。ウェットとドライの交流が、もっとふえるといいですね。

一同:本日はどうもありがとうございました。

日向子さんは、画像解析などについても相談され、ご自身の研究をすすめるヒントを得られたようです。このたびは、おだやかな雰囲気のなか、ドライ解析やコンピュータのみならず、研究についてじっくり語っていただきました。ここでは紹介できない話も、たくさん。ご興味のある方は、以下のサイトも参考に、前田亮先生や立花先生に問い合わせてみてください。

PAGETOP