第9回日本エピジェネティクス研究会年会
学術総合センター
2015年05月26日
P2-63
ポスター発表/口頭発表

MDLプロットを用いた比較メチローム解析
Comparative methylome analysis with MDL-Plot
 
三浦 史仁1, 横山 貴央2, 荒木 啓充1, 岡村 浩司3, 伊藤 隆司1
1九大・医学研究院・医化学分野, 2東大・新領域・情報生命, 3成育医療セ・システム医学・組織工学
 
全ゲノムバイサルファイトシークエンシング(WGBS)で取得したメチロームデータを眺めると、染色体は似通ったメチル化状態を示すシトシンが連続する多くのドメインから構成されている様子がはっきり見える。こういったドメインを計算機上で効率的に検出するために、従来はスライディングウインドウとアドホックなパラメータを用いる手法、あるいは隠れマルコフモデルを利用した手法が利用されてきた。我々は統計的手法の一つである変化点検出がメチロームデータのドメイン分割に効果的なのではないかと考え、近年開発されたPELTと呼ばれるアルゴリズムをメチロームデータに適用することを試みた。その結果、唯一調整可能なペナルティと呼ばれるパラメータの最適化をほとんど経ずにほどよくドメインを検出することが可能であった。面白いことに、検出されたドメインのサイズと平均メチル化率をプロットすると、それぞれの細胞毎に異なるパターンが確認された。MDL (Methylated Domain Landscape)プロットと名付けた本描画手法は、メチロームデータ間の比較を容易にし、FMR、LMR、UMRといった基本的なドメインを始め、PMDやDMV、がん細胞で高頻度に確認されることが知られる局所的高メチル化やグローバルな低メチル化の有無を容易に判別することが可能であった。また、MDLプロットはゲノムを5倍程度網羅するリード量で描画可能であった。このデータ量はWGBSにおける標準的リード量の6分の1であることから、MDLプロットが低コストでゲノム全体のメチル化状態を把握する上で有効な手法であることを意味していた。