Rでカイ二乗検定 Chai-squared test in R

私はこの論文(1)の中でナメクジウオの遺伝子Msxの上流にある保存的な非コード領域(Conserved Noncoding Elements=CNE)がMsxの発現をどのように制御しているのかを調べている部分を担当させていただきました。

まずはプラスミド作成から。ナメクジウオFoxDのエンハンサー領域を調べた過去の研究(2)で、LacZの発現が得られなくなるまで上流配列を短くしたもの(名前をFM1ngctrlとしています)にMsx-CNEをつなぎました。(このエピソードについては別の記事参照)。

本来LacZの染色で染まらないはずのネガコン(no enhancer: LacZ)ですが、インジェクションした胚の数十個体中0〜3個体だけ一部の細胞が染まる個体がいたのです(上の図中のK, N のような感じです)。もちろんMsx-CNEが入っているものはI、J、L、Mのように染まります。もちろん、インジェクションの際に蛍光デキストランを一緒に打っていて、インジェクションされていることを確認してはいるので、発色がみられない個体は単純に発現していないと考えても良いと思うのですが、発色がある個体のみをカウントすることになりました。

もちろん、統計処理をするからにはそこそこのサンプル数が必要です。

ふとボスが「統計計算するならどのくらいサンプル数が必要なの」と聞いてきたので、「30個体、できれば50個体くらい欲しいとこですね」と言うと、ボスはすかさず「じゃあ50個体以上集めなさい」と。。。30とだけ言っときゃよかった笑(ちなみに30あれば大標本です)。


同じインジェクションを何度も、しかもナメクジウオが卵を産まないこともあり、発色が得られないこともありましたが(ネガコンなので)、地道にインジェクションを繰り返して、発色のあるネガコン胚を最終的に59匹集めました。とてもいい標本数です。


これでやっと計算ができます!!


発色のあるネガコンと、Msx-CNEとの間で、発色にどのような違いがあるのかを調べたいのである。まず、パーツごとに表皮、体節、脊索、内胚葉、神経管そして消化管内にある細胞塊(これは通常の発生でも時々見られ、発生後期には消失する)のどこに発色があるのかをしらべた。ノートに表を書いて集計、エクセルに入力してcsvファイルで保存、Rで計算。こんな流れです。半日で終わります。案外あっけないものです。


まず、自分の場合、表をデスクトップに保存

作業スペースをどこにするかを指定します。今回はMacのデスクトップなので

> setwd("/Users/ユーザー名/Desktop")   こんな感じに入力

> getwd()  自分がどこにいるかを確かめる。カッコ内は何も入力しない。

[1]"/Users/ユーザー名/Desktop"

こうなるはず。今デスクトップで作業しているのがわかる。

今度は、エクセルで作った表を読み込む

> MSX<-read.csv("MSXsheet.csv") <-の意味は<-の左に右のファイルを格納するという意味

>MSX ファイルを開いてみる

実行すると格納したファイルが表示されるはずです。(長いので図を切りました)

ちなみに、発現の有無を1と0で表しています。単純に発現があった個体数だけにすると全体の個体数がわからなくなってしまうので、有と無の両方が必要です。

今度はクロス集計表を作ります(そのまま検定しても大丈夫ですが、念のため)。例えば、プラスミド名と外胚葉で集計をつくるときは、以下のように打って実行

> table(MSX$PLASMID,MSX$ECTODERM)

こんな感じにクロス集計表ができます。

じゃあ、実際にχ2検定をしてみましょう。コマンドは以下のように

> chisq.test(MSX$PLASMID,MSX$ECTODERM, correct=FALSE)

P値が0.05より大きいので有意差は無いとする。

他の部位については…


どれもこれもP値が0.05より大きいので有意であるとはいえません。

では、体節はどうでしょう

なんと、P値は0.0000002928

つまり、ネガコンはどこの部位でもLacZを発現するポテンンシャルを持っていて、そのランダムな発現はMSX-CNEがあっても出るにはでるけれど、それ以上に明らかに体節で有意にLacZが発現するようになっているといえます。

それにしても、ナメクジウオでMsxは神経管と表皮の境界付近で発現していたはずですが、その発現が観察できなかったということは、どうやら他のエンハンサーが機能しているようですね。


参考文献

1. Yue, J-X.; Kozmikova, I.; Ono,H.; Nossa, C. W.; Kozmik, Z.; Putnam,N. H.; Yu, J-K.; Holland L. Z. (2016). "Conserved Noncoding Elements in the Most Distant Genera of Cephalochordates: The Goldilocks Principle". Genome Biol. Evol. 8(8):2387-2405.

2. Yu, J-K.; Holland, N. D.; Holland, L. Z. (2004). "Tissue-specific expression of FoxD reporter constructs in amphioxus embryos". Developmental Biology 274:452–461.

4. 栗原伸一. (2011). "入門統計学ー検定から多変量解析・実験計画法までー". オーム社.

3. 村井潤一郎.(2013). "はじめてのRーごく初歩の操作から統計解析の導入までー". 北大路書房.


BIOLOGY IS FUN!!

このページでは生物学に関する研究や実験のコツ・裏話、他にも色々ご紹介しております。 This website contains articles about my research experiences, tips for experiments, and others.

0コメント

  • 1000 / 1000