トレヤ・グランディスのゲノムは裸子植物の起源と進化を解明する

ニュース

ホームページホームページ / ニュース / トレヤ・グランディスのゲノムは裸子植物の起源と進化を解明する

Jul 30, 2023

トレヤ・グランディスのゲノムは裸子植物の起源と進化を解明する

Volume sulle comunicazioni sulla natura

Nature Communications volume 14、記事番号: 1315 (2023) この記事を引用

4055 アクセス

21 オルトメトリック

メトリクスの詳細

トレヤ植物は、さまざまな機能を持つドライフルーツを生産します。 今回我々は、T.グランディスの19Gb染色体レベルのゲノムアセンブリを報告する。 ゲノムは、古代の全ゲノム重複と反復的な LTR レトロトランスポゾン バーストによって形成されます。 比較ゲノム分析により、生殖器官の発達、細胞壁の生合成、種子の貯蔵に関与する重要な遺伝子が明らかになります。 C18 Δ9-エロンガーゼと C20 Δ5-デサチュラーゼをコードする 2 つの遺伝子が、シアドン酸生合成に関与していることが同定されており、どちらも被子植物を除く多様な植物系統に存在します。 我々は、Δ5-デサチュラーゼのヒスチジンに富むボックスがその触媒活性にとって重要であることを実証する。 メチローム解析により、T.グランディス種子ゲノムのメチル化バレーに、細胞壁や脂質生合成などの重要な種子の活動に関連する遺伝子が存在することが明らかになりました。 さらに、種子の発育には DNA メチル化の変化が伴い、これによりエネルギー生産が促進される可能性があります。 この研究は重要なゲノム資源を提供し、陸上植物におけるシアドン酸生合成の進化機構を解明します。

被子植物と裸子植物からなる種子植物の出現は、陸上植物の進化と地球環境の変化にとって重大な出来事でした。 被子植物と裸子植物はミシシッピ川下流域で分岐し 1、その後開花植物が急速に放射され、その結果地球上には裸子植物がわずか 1,000 種しか存在しないのに対し、約 352,000 種が現存しています。 被子植物と裸子植物の間には、さまざまな形態学的/解剖学的多様性と代謝の多様性がありますが、根底にある遺伝的および生化学的メカニズムはほとんど解明されていません 2,3。

イチイ科(イチイ科)の小さな属に属する裸子植物の種であるトレヤ・グランディスは、木材、薬、食用の種子、油を提供する有用な多目的樹木です4(図1a)。 薬源としての T. グランディスの信頼できる最初の記録は、中国の三国時代の『マテリア メディカの古典』に記載されており、その起源は 3 世紀の初めに遡ります。 T.グランディスは、タキシード科で食用の種子を持つ唯一の種であり、その独特の風味と有益な成分により、中国で何千年もの間、食品として使用されてきました5,6。 オイルには T. グランディスの種子が豊富に含まれており、平均含有量は 45.80 ~ 53.16% です7。 シアドン酸 (SCA) はメチレン非破壊の ω6 脂肪酸であり、核油の脂肪酸組成の主要成分の 1 つであることがわかっています 7。 SCA は人間の健康にプラスの効果をもたらし、炎症の軽減、トリグリセリドの低下、血栓の予防、脂質代謝の調節に機能します 8、9、10。 SCA の産生は、裸子植物のさまざまな系統および少数の藻類およびシダで検出されています 11。 しかし、SCA は、少数の下等真正双子葉植物 (キンポウゲ科など) を除いて一般に顕花植物には存在しないため 12、緑色植物におけるその起源と進化については謎が残されています。

T.グランディスの木と果物のセット。 下のパネルは、加工された乾燥種子とその可食部分(胚乳)を示しています。 b T.グランディスゲノムと染色体によってコードされるゲノム特徴のCircosプロット。 各特徴は、染色体全体の 10 Mb ウィンドウに基づいて計算されました。 色付きの星は、染色体の 5' 末端 (緑色) または 3' 末端 (オレンジ色) にテロメア配列が存在することを示します。 c LTR-RT挿入時間の分布。 左側のパネルはジプシーとコピアの家族のすべてのメンバーを示し、最も多い上位 6 つのサブファミリーを右側のパネルに示します。 d T.グランディス、セコイアデンドロン・ギガンテウム、イチョウおよびグネツム・モンタナムの間のオーソログのKs分布。 T. grandis のパラログの Ks はガウス混合モデルに適合し、推定上の古代 WGD が示されました。 e T.グランディス、G.ビロバ、およびG.モンタナムのゲノム間の微小共線性。 ソース データはソース データ ファイルとして提供されます。

ゲノム配列は、植物進化の重要な問題に取り組む鍵となります。 代表的な裸子植物のゲノムの分析により、顕花植物とは異なる遺伝子およびゲノム進化の独特な側面が示されています 13、14、15、16、17、18、19。 しかし、裸子植物のゲノムリソースの利用可能性が限られていることもあり、開花植物と非開花植物の間の表現型の多様性の生物学的および進化的メカニズムを理解することは依然として困難です。

この研究では、複数の組織におけるトランスクリプトームおよびメチロームプロファイリングを伴う、T.グランディスの染色体スケールの参照ゲノムを構築します。 私たちのデータは、比較ゲノム解析を通じて、主要な陸上植物系統の形態学的多様性に関連する興味深いフットプリントを解明し、SCA生合成を担う2つの重要な酵素を発見して検証します。 この研究によって提供される情報は、SCA 生産の改善に関する戦略設計に役立ち、トレヤ遺伝資源の利用を促進します。

T.グランディスに対して合計1.93TbのIlluminaと463.7GbのPacBio HiFiリードを生成しました(補足データ1)。これは、推定サイズが約20のT.グランディスゲノムのそれぞれ96.5倍と23.2倍のカバレッジを表します。 Illumina 読み取りの k-mer 分析による Gb (補足図 1)。 最終的なアセンブリのサイズは 19,050,820,213 bp で、N50 サイズが 2.82 Mb の 11,811 個のコンティグで構成されていました (補足表 1)。 約106.2倍のカバー率のHi-Cリードを使用して、組み立てられたコンティグの18.87 Gb(99.1%)が11の染色体にグループ化されました(図1bおよび補足図2)。 11本の染色体すべてに、セントロメアのランドマークとして知られるタンデムセントロメアサテライトリピートに似た101bpの反復配列ユニットが豊富に含まれていることが判明したが、9本の染色体には少なくとも一端にテロメア配列(5'-TTTAGGG-3')が含まれていた。 (図1b)。 Merqury20 を使用した T. grandis ゲノムの評価では、99.998% の基本精度に相当する 46.9 のコンセンサス品質スコアが明らかになりました。 BUSCO21 の評価では、1614 個の陸上植物の保存されたオルソログのうち 1386 個が T. grandis アセンブリによってうまく捕捉されたことが示され、これは他の裸子植物ゲノム アセンブリのものと同等でした (補足表 2)。 T.グランディスゲノムのLTRアセンブリインデックス(LAI)は10.7であり、参照ゲノムの提案された基準よりも高かった22。 これらは、高い DNA (99.48%) および RNA (最大 97.5%) の読み取りマッピング率と合わせて、T. grandis ゲノム アセンブリの高品質を示唆しました。

T.グランディスのゲノムアセンブリには11.4Gb(59.8%)の反復配列が含まれており、そのうちLTRレトロトランスポゾン(LTR-RT; 87.0%)が優勢で、DNAトランスポゾン(7.1%)および長く散在する核エレメント(LINE; 3.1%)が続いた。 ) (補足データ 2)。 コピアLTR-RTの割合(11.6%)は、他の裸子植物よりもT.グランディスで比較的高かった。これはおそらく、LTR-RTの複数のサブファミリーで最近種特異的なバーストが発生しているためである(図1c)。 裸子植物のLTR-RT膨張のほとんどは2500万年前から700万年前の間に起こり(mya;補足図3a)、地球が氷河期に向けて寒冷化した中新世の地質時代(2303万年から533万年)と重なっています。これは、裸子植物のゲノムサイズ進化に対する潜在的な環境影響を示唆しています。

T.グランディスゲノムでは合計47,089個のタンパク質コード遺伝子が予測され、そのうち46,338個は相同性および/またはトランスクリプトームの証拠によって裏付けられました(補足表1)。 イントロンのサイズは、被子植物よりも裸子植物の方がより多様であり(補足図3b)、これはLTR-RTの拡大に起因すると考えられます。 植物では、LTR-RT が不均等な組換えによって除去され、ゲノム内に単独の LTR が生成されることがあります。 ソロ:インタクト LTR 比は、T. grandis (4.3) や、Taxus Wallichiana (5.5) 18、Ginkgo bilova (4.26)、Welwitschia mirabilis (3.87)、Gnetum montanum (2.07) などの他の裸子植物で高くなります。 裸子植物のゲノムには古代LTR-RT(10〜3000万年)が豊富に含まれているため14、15、16、17、18、19、最近拡張せずに古代LTR-RTを除去したことが、それらの高いsolo:intact LTRに寄与した可能性があると仮説を立てています。比率。 これは、LTR-RT バーストがより最近(<400 万年)発生した小型ゲノム被子植物とは対照的です 24。 トランスポゾンおよび動原体周囲リピートのエピジェネティックなサイレンシングは、RNA 指向性 DNA メチル化 (RdDM) および 24 塩基 hetsiRNA によって媒介されます 25。 T.グランディスゲノムは、RdDM経路の主要な構成要素のホモログをコード化しました(補足データ3)。 しかし、7つの組織の低分子RNAプロファイリングでは、被子植物で最も豊富な24塩基のsRNAとは対照的に、T.グランディスでは21塩基のsRNAが最も豊富であり、22塩基および24塩基のsRNAの産生は組織特異的であることが示された。 (補足図4)。 このパターンは、針葉樹 13,26 および Welwitschia mirabilis 16 で見られるものと似ています。 それにもかかわらず、追加の組織および段階からさらに広範なサンプリングが行われれば、裸子植物と被子植物の間の sRNA プロセシングの相違についてより深い洞察が得られるでしょう。

全ゲノム重複 (WGD) は、真核生物の系統発生全体にわたって発生しています 27。 裸子植物では、いくつかの WGD が認識されていますが、その一部はまだ議論の余地があります 16、17、18、19、28。 T.グランディス内の3859個のパラロググループのKs分布は、最近のWGDが存在しないことを示した。 しかし、我々は、1から2の範囲のKsのピークと1.4の頂点を観察しました。これは、針葉樹とイチョウ植物の共通の祖先、つまり閃緑体から分岐した系統で発生した潜在的な古代のWGDを表しています(図1d)。 次に、遺伝子ツリーと種ツリーの調整により系統発生のすべての枝における遺伝子重複の頻度を計算するツリーベースのアプローチ 29 を使用して、WGD イベントを相互検証しました。 8つの選択された種からの19,649の遺伝子ツリーの分析により、以前に報告された2つ(ゼータとオメガ)17,28とKs分析と一致する1つを含む3つの古代WGDシグナルの発見につながりました(補足図5)。 全ゲノム比較により、T.グランディスと進化的に遠い2つの裸子植物、セコイアデンドロン・ギガンテウムとイチョウのゲノム間の高い共線性が示され(補足図6)、また、T.グランディスとG.ビロバの両方で重複した共線ブロックの痕跡も明らかになった。しかし、Gnetum montanumではそうではなく、新たに発見されたWGDが発生したタイミングと一致しています(図1e)。

我々は、主要な緑色植物系統の7つの裸子植物と12の代表的な種を含む19の植物種において19,362のオルソロガスグループ(遺伝子ファミリー)を同定した。 219の低コピー遺伝子ファミリーを使用した系統発生および分子年代測定により、T.グランディスは6,850万年頃にT.ワリキアナから分離されたことが示されました(図2a)。 遺伝子ファミリーの拡大は、形態学的革新と密接に関係していると考えられています 30,31。 遺伝子ファミリーの進化の再構築を通じて、遺伝子ファミリーの爆発的な拡大が植物の適応の主要な移行と一致していることを発見しました(図2a)。 大規模な遺伝子ファミリーの拡大 (n = 417、P < 0.05) が陸上植物の共通祖先で観察され、その後、種子植物 (n = 575)、被子植物 (n = 432)、および裸子植物のさまざまな系統につながる絶滅した祖先でも観察されました。 (n = 428–818)。 拡張された遺伝子ファミリーの機能は、植物器官の発達、生物(細菌や真菌など)および非生物(水分不足、光、温度、塩など)ストレスへの応答、植物ホルモンの生合成とシグナル伝達に主に関連していた(補足データ) 4)。 遺伝子ファミリーの多くは高等植物の進化に向けて継続的に拡張されており、おそらく遺伝子重複とそれに続くサブ/ネオ機能化が植物の形態的多様性と環境適応の遺伝的基盤を提供していることが示唆されています。 T.グランディスで大幅に拡大した遺伝子ファミリーの多くは、脂質輸送(オレオシンおよびPF14368)、生物的および非生物的ストレス応答(PF00201およびPF03018)、二次代謝(PF00067)などの重要な生物学的機能に関連するpfamドメインをコードしていました。 (補足データ5)。 T.グランディスのゲノムには、パクリタキセル生合成の中心成分であるタキサジエンシンターゼのオルソログが欠如しており、この種にはパクリタキセルおよび関連代謝産物が存在しないことが説明されている。

a 緑色植物の進化における遺伝子ファミリーの拡大と縮小。 最尤系統発生は、219 の低コピー オーソロガス グループを使用して構築されました。 遺伝子ファミリー解析は、緑色植物の最​​新の共通祖先 (MRCA) によって共有される 10,345 個のオルソロガス グループから開始されました。 枝上の数字は、各ノードの拡張 (青) および縮小 (赤) の遺伝子ファミリーのサイズです。 右側の色付きの円は、ツリーの各葉ノードの拡張/縮小した遺伝子ファミリーのサイズと、獲得/喪失した遺伝子を表します。 b T.グランディスの栄養組織および生殖組織におけるMIKCCタイプMADSボックス遺伝子の発現。 c T.グランディスにおける提案された生殖器官同一性遺伝子。 AP3/PI 様遺伝子 (TG7g01668 および TG7g01669) および TG8g01565 は、それぞれ雄錐体および雌錐体で主に発現されました。 AG 様 (TG10g01848)、AGL6 様 (TG2g00325)、および AP1/SEP 様 (TG4g01441) 遺伝子は雌錐体と雄錐体の両方で発現され、最初の 2 つは雌錐体に偏ったパターンを示しました。 d T.グランディス遺伝子の細菌起源を示す最尤系統発生。 青い円は、対応するブランチで 80% を超えるブートストラップ サポートを示します。 e 異なる組織における水平移入されたと推定される遺伝子の発現。 ソース データはソース データ ファイルとして提供されます。

裸子植物は鱗や葉の表面に包まれていない、または裸の種子を持っていますが、花や果実は被子植物の革新です。 よく研究されている花発生遺伝子を使用した系統発生に基づく相同体検索 32 では、裸子植物および非種子植物におけるこれらの相同体の散発的な分布が示され (補足データ 6)、これは陸上植物の進化中に花発生遺伝子の二次的喪失を伴う段階的な出現を示しています。 NOP10(花の雌性配偶体形成に必要)33およびWUS(シュートと花の分裂組織の完全性に必要)34に例示されるように、陸上植物で早期に出現し、その後T.グランディスとT.ワリキアナの両方で失われた遺伝子(補足データ6) )。

MADS-box ファミリー遺伝子は、花器官の特異性、開花時期、果実の発育の制御に関与する転写因子のクラスです。 我々は、花器官同一性のABCEモデルにおける遺伝子の相同体を含む、T.グランディスにおける23個のMIKCC MADSボックス遺伝子を同定した35。 これらには、1つのAP1 / SEP様遺伝子(AまたはE機能)、2つのAP3 / PI様遺伝子(B機能)、および6つのAG様遺伝子(C機能)が含まれていました(補足図7)。 栄養器官および生殖器官からの 18 サンプルのトランスクリプトーム解析により、T. grandis の雄および/または雌の球果で高度に発現している 6 つの MADS ボックス遺伝子が明らかになり、そのうち 2 つのタンデムに複製された AP3/PI 様遺伝子 (TG7g01668 および TG7g01669) はは主に雄の錐体で発現され、一方、1つのAG様遺伝子(TG10g01848)は雄で発現したが、雌の錐体では6.6倍上方制御された(図2b)。 最近の研究では、MADS ボックス遺伝子の古代サブファミリーのメンバーである AGL6 が、イネ、トウモロコシ、コムギの花の発達の E 機能に関与している一方、基底被子植物 Nymphaea colorata では A 機能に関与していることが示唆されています 38。 T. grandis では、AGL6 様遺伝子 (TG2g00325) は C 機能遺伝子と同様の発現パターンを示しましたが、AP1/SEP 様遺伝子 (TG4g01441) は雄錐体と雌錐体の両方で中程度に高いレベルで発現しました。 、E 関数の祖先の役割に似ています。 興味深いことに、最も高度に発現された MADS-box 遺伝子 (TG8g01565) は雌の錐体でのみ活性化されました (図 2b)。 この遺伝子は、AP3、PI、およびB姉妹遺伝子TT16およびGOAを含むBクレード遺伝子と系統発生的にクラスター化されました(補足図7)。 しかし、その発現パターンはAP3/PI様遺伝子の発現パターンとは逆でした。 結論として、裸子植物の種子発生における追加のMADSボックス遺伝子の関与に関する我々の発見は、基本的な「BC」モデルを支持しており、C機能遺伝子は一般に雄と雌の生殖器官で発現され、B機能遺伝子は雄に限定されている。生殖器官39であり、裸子植物における生殖器官の発達のためのより洗練された制御システムを示唆しています(図2c)。

T.グランディス種子のタンパク質含有量は、品種に応じて10.34%から16.43%の範囲です7。 2S アルブミン (n = 0 ~ 7)、7S グロブリン (n = 1 ~ 9)、および 11S グロブリン (n = 2 ~ 14) を含む種子貯蔵タンパク質 (SSP) をコードする遺伝子は、T. grandis および他の裸子植物では同定されましたが、植物の初期の形態 (補足データ 7) は、それらの起源が種子植物であることを示唆しています。 トランスクリプトーム分析により、2S アルブミンと 7S グロブリンをコードする遺伝子が T. グランディス種子の穀粒内で非常に高いレベル (100 万あたりの平均転写産物 (TPM) = 14,125) で発現され、種子の発育中に発現が増加したことが示されました (補足図 8a)。 )。 対照的に、穀粒内で中程度に発現された11Sグロブリン遺伝子を含むすべてのSSP遺伝子は、栄養組織では転写不活性のままでした(補足図8a)。 2S アルブミンタンパク質は、サブユニット内およびサブユニット間にジスルフィド架橋を形成するために多数のシステイン残基を保持しています40。 我々は、タンパク質配列全体が被子植物の対応物からかなり異なっていたにもかかわらず、これらすべての残基がT.グランディスで保存されていることを発見した(補足図8b)。 相同性モデリングにより、T.グランディス(TG11g02972など)とヒマワリの2Sアルブミンタンパク質の間、特にαヘリックスが形成される領域において高度なタンパク質構造の保存が明らかになった(補足図8c)。 同様に、三量体の形成と安定化、ならびに開花植物からの11Sグロブリンの正しい球状フォールディングに関与する残基のほとんど41は、T.グランディスで保存されていました(補足図9)。 全体として、遺伝子発現と構造解析は、裸子植物と被子植物の両方における主要な SSP の保守的な役割を示唆しています。

裸子植物は主に木本植物であり、そのゲノムは、細胞壁生合成と密接に関連する機能を持つ炭水化物活性酵素 (CAZyme) の大規模なセットをコードしています。 選択された19の代表的な植物種の中で、T.グランディスは、特にグリコシド加水分解酵素(例、GH1、GH16、GH18、GH19、GH27​​、GH71、GH99、およびGH152)、GT61グリコシルトランスフェラーゼ、 PL1 多糖リアーゼ (補足データ 7)、その多くは他の裸子植物でも拡張されました。 植物に普遍的に存在するほとんどの CAZyme ファミリーとは対照的に、我々は 18 個の遺伝子、GH71 (n = 7)、GH99 (n = 9)、GH103 (n = 1)、および CE4 (n = 1) を含む 4 つのファミリーを同定しました。これは裸子植物と以前の系統にのみ存在し、被子植物には存在しませんでした(補足データ8)。 系統解析により、これらの家族は細菌起源である可能性があることが示されました(図2dおよび補足図10)。 体系的な分析を通じて、水平遺伝子伝達に由来する 14 個の追加の T. グランディス遺伝子 (HGT; 補足表 3) を特定しました。 これらの遺伝子のほとんどは植物のさまざまな組織で発現され(図2e)、陸上植物の進化におけるHGTの寄与を強化しています42。

リグニンは植物の二次細胞壁の主要成分であり、p-ヒドロキシフェニル (H)、グアヤシル (G)、およびシリンギル (S) モノリグノールに由来します。 S-リグニンは顕花植物と一部のヒ化植物に限定されていますが、G-およびH-リグニンはすべての維管束植物の基本です2。 一貫して、S-リグニン生合成の 2 つの重要な遺伝子、F5H と COMT は被子植物でのみ見つかり、裸子植物では見つかりませんでした。 木部の主要な導水要素が道管である被子植物43とは異なり、裸子植物の森林は主に仮道管で構成されています2。 血管の分化は血管関連MACドメイン(VND)タンパク質によって制御されています44が、線維の発達はNAC二次壁肥厚促進因子(NST)/二次壁関連NACドメイン(SND)タンパク質と関連しています45。 T.グランディスのゲノムは、VND4/5/6に相同な遺伝子をコードしていましたが、VND1/2/3、NSTおよびSND1のホモログを欠いており(補足図11)、これは、VND / NSTホモログの多様な制御ネットワークの発見と組み合わされています。木材形成中の針葉樹や顕花植物におけるこの現象46は、道管形成と被子植物におけるマスター NAC 転写因子およびその制御ネットワークの出現との間に密接な関係があることを示唆しています。

シアドン酸(SCA)はΔ5-オレフィン脂肪酸であり、その生合成には、最初の基質として18:2-ホスファチジルコリン(PC)を使用するC18 Δ9-エロンガーゼおよびC20 Δ5-デサチュラーゼの活性が必要です(図3a)。 Δ5-デサチュラーゼは「フロントエンド」デサチュラーゼとして知られており47、通常、シトクロム b5 様ヘム/ステロイド結合ドメイン (PF00173) および脂肪酸デサチュラーゼ ドメイン (PF00487) をコードするのに対し、Δ9-エロンガーゼは GNS1/SUR4 をコードします。長鎖脂肪酸伸長のファミリードメイン (PF01151)。 ドメイン検索に基づいて、T. grandis ゲノムは 4 つのデサチュラーゼ遺伝子と 4 つのエロンガーゼ遺伝子をコードしました。 ただし、1 つのデサチュラーゼ (TgDES1) だけが、アネモネ leveillei で以前に報告された Δ5-デサチュラーゼと高い類似性を示しました 48。一方、2 つのエロンガーゼは推定上の Δ9-エロンガーゼと考えられましたが、種子穀粒で高度に発現されたのは 1 つ (TgELO1) だけでした (補足図 12)。 。 不飽和脂肪酸は種子油に豊富に含まれる成分であるため、種子の成熟中の TgDES1 と TgELO1 の発現を調査しました。 我々は、成熟種子では TgDES1 の発現増加に伴って SCA が蓄積することを発見しました。 同様の傾向が、TgELO1の発現およびその推定生成物であるシス-11,14-エイコサジエン酸の含有量についても観察されました(図3b、c)。 細胞内局在の研究により、TgELO1とTgDES1の両方がN.ベンサミアナの葉の小胞体(ER)のマーカーと共局在することが示され(図3d)、既知の細胞内局在と一致して、それらがER膜に結合していることを示唆しています。デサチュラーゼとエロンガーゼ49. SCA生合成におけるそれらの機能をさらに検証するために、本発明者らは、TgELO1およびTgDES1のオルソログをコードせず、SCAまたはその前駆体20:2Δ11,14-PCを生成しないA. thalianaでTgELO1およびTgDES1の両方を過剰発現させた。 ガスクロマトグラフィー分析により、TgDES1およびTgELO1を発現するトランスジェニック系統の種子においてSCAが首尾よく合成されたことが示され、TgELO1およびTgDES1がT.グランディスにおいてSCAを合成できることが実証された(図3e)。

脂肪酸生合成経路の概要。 PDHピルビン酸デヒドロゲナーゼ、CTカルボキシルトランスフェラーゼ、BCビオチンカルボキシラーゼ、BCCPビオチンカルボキシルキャリアタンパク質、MCMTマロニル-CoA:ACPマロニルトランスフェラーゼ、ACPアシルキャリアタンパク質、KASケトアシル-ACPシンターゼ、SADステアロイル-ACPデサチュラーゼ、FATAアシル-ACPチオエステラーゼA、FATBアシル-ACP チオエステラーゼ B、LACS 長鎖アシル CoA シンテターゼ、DGAT ジアシルグリセロール アシルトランスフェラーゼ、PDAT リン脂質:ジアシルグリセロール アシルトランスフェラーゼ、PAP ホスファチジン酸ホスファターゼ、LPAT リゾホスファチジン酸アシルトランスフェラーゼ、GPAT グリセロール-3-リン酸アシルトランスフェラーゼ、CPT コリンホスホトランスフェラーゼ、FAD2 オレイン酸デサチュラーゼ、 FAD3 リノール酸デサチュラーゼ、PC ホスファチジル コリン。 b 初期発育段階(5月)から成熟段階(9月)までの種子におけるTgDES1発現およびSCA含有量。 バー上の異なる文字は、α = 0.05 (一元配置分散分析およびテューキー検定) でのサンプル間の統計的有意性を示します。 測定は 3 つの生物学的反復で実行され、データは平均値 + SD として表示されます。 c 種子中のTgELO1の発現とその生成物であるシス-11,14-エイコサジエン酸の含有量。 バー上の異なる文字は、α = 0.05 (一元配置分散分析およびテューキー検定) でのサンプル間の統計的有意性を示します。 測定は 3 つの生物学的反復で実行され、データは平均値 + SD として表示されます。 d N.ベンサミアナの葉におけるTgDES1およびTgELO1の細胞内局在。 e シロイヌナズナ Col-0 および TgDES1 と TgELO1 の両方を過剰発現するトランスジェニック系統における SCA およびその前駆体の検出。 ソース データはソース データ ファイルとして提供されます。

緑色植物(Viridiplantae)におけるデサチュラーゼの系統解析により、TgDES1は非被子植物生物由来のデサチュラーゼのみでクラスター化しており、この単系統クレードはシロイヌナズナ由来のAtSLDを含むスフィンゴ脂質デサチュラーゼを含むファミリーに近似していることが示されました(図4a)。 興味深いことに、TgDES1 クレードは、基底真正双子葉植物 Anemone leveillei の SCA 生合成に関与することが判明した 2 つのタンパク質である AL10 および AL21 を保有するグループから明確に分離されました 48。 TgDES1、AtSLD2、およびAL21の構造モデリングでは、特に活性中心が形成された領域において、TgDES1とAtSLD2の間で全体的に類似した構造を示しましたが、AL21の構造はTgDES1とは比較的異なっていました(図4b)。 顕花植物はSCAをほとんど合成しないため、我々の系統学的および構造的証拠は、これがTgDES1クレードデサチュラーゼの喪失による可能性があることを示唆しており、一方、真正双子葉植物の特定の種におけるSCA生合成能力は主にΔ5-デサチュラーゼ活性の二次的な獲得に起因するものであると示唆した。進化的に独立した対応物。 同様に、TgELO1の密接な相同体は開花植物では見つかりませんでしたが、初期の陸上植物と藻類に存在し、植物におけるΔ5-デサチュラーゼとΔ9-エロンガーゼの共進化を示唆しています(補足図13)。

a 植物デサチュラーゼの最尤系統発生。 TgDES1 は、Δ6- および Δ8- デサチュラーゼを含む姉妹クレード (クレード 2) に近いグループ (クレード 1) 内にクラスター化されています。 b TgDES1とシロイヌナズナ(AtSLD2)およびアネモネ・レベイレイ(AL21)由来のデサチュラーゼの構造モデリング。 タンパク質構造は AlphaFold2 でモデル化されており、3 つのヒスチジンに富んだモチーフを含む各タンパク質の生物活性中心は黄色でマークされています。 c aに示すさまざまなデサチュラーゼグループにおける保存モチーフの比較。 d 保存されたヒスチジンに富むモチーフ(モチーフ2およびモチーフ3)をT.グランディスのTgDES1由来のものに置き換えたシロイヌナズナAtSLD2を発現するN.ベンタミアナ葉におけるSCAおよびその前駆体の検出。 AtSLD2、AtSLD2-Motif2、およびAtSLD2-Motif3は、それぞれシロイヌナズナ野生型AtSLD2遺伝子、TgDES1由来のモチーフ2を有するAtSLD2、およびTgDES1由来のモチーフ3を有するAtSLD2を有する系統である。

タンパク質配列の特性評価により、TgDES1 クレード デサチュラーゼ (クレード 1) の N 末端シトクロム b5 様ドメインと 3 つのヒスチジンに富むボックス、およびそれらの 2 つの密接に関連したグループ (クレード 2 のグループ 1 およびグループ 2) が保存されていることが明らかになりました。最初の 2 つのヒスチジンに富むボックスでは、異なるグループ間で変動が観察されました (図 4c)。 以前の研究では、ヒスチジンボックスの部位特異的置換が基質鎖長の特異性と選択性に影響を与える可能性があることが報告されています50。 単一アミノ酸の置換は、基質の脂肪酸アシル炭素原子と活性中心金属イオンの間の距離を調節することにより、不飽和反応の結果を制御すると考えられます 51。 ヒスチジンに富むドメインの配列変異がSCA生合成の成功につながる基質特異性を決定するかどうかを試験するために、シロイヌナズナデサチュラーゼAtSLD2のヒスチジンに富むドメインをTgDES1のドメインに置き換え、この構築物をN.ベンサミアナの葉で一過性に発現させた。 我々は、Δ9-エロンガーゼ触媒作用の産物である20:2Δ11,14-PCが野生型タバコの葉で検出できるため、TgELO1が改変デサチュラーゼ遺伝子と共発現していないことに注目した。 SCAは、野生型AtSLD2を発現するN.ベンサミアナの葉では検出されなかった。 しかし、TgDES1からの2つのヒスチジンに富むボックスのいずれかを切り替えるだけで、N.ベンサミアナの葉でSCAを合成するのに十分でした(図4d)。 総合すると、我々のデータは、デサチュラーゼのこれら 2 つのヒスチジンに富むモチーフの変異が基質特異性の変化をもたらし、その結果、SCA 生合成のための特定のクレードの進化をもたらし、その喪失が裸子植物と被子植物の間の重要な代謝多様性を特徴付けることを示唆しています。

裸子植物の種子の発達は、複数年にわたる長いプロセスです3。 開花植物52で明らかなように、DNAメチル化がT.グランディスの種子の発育に関与しているかどうか、そしてどのように関与しているかを理解するために、我々は3つの発育段階で種子のメチロームをプロファイリングしました(図5a;補足データ9)。 3 つすべてのシトシン コンテキスト (CG、CHG、CHH) の DNA メチル化に関与する遺伝子が T. grandis ゲノムで同定されました (補足データ 3)。 T.グランディス種子ゲノムにおけるmCG、mCHG、mCHHの全平均メチル化レベルは、それぞれ83%、69%、4%でした。 mCG と mCHG のメチル化レベルは両方とも、これまでに研究されたほとんどの被子植物のものよりも高く 53、これはゲノムサイズと mCG/mCHG メチル化レベルの間に正の相関関係があるという提案と一致しています 54。 mCGとmCHGの両方が染色体腕にも広く分布していたにもかかわらず、すべての配列コンテキストのmCはセントロメア領域およびセントロメア周囲領域に富んでいました(図1b)。 顕花植物では、遺伝子のエクソンに mCG が豊富に含まれる場合がありますが、mCHG と mCHH の両方が枯渇することがあります。これは遺伝子本体メチル化 (gbM) と呼ばれます 55。 我々は、T.グランディス遺伝子におけるmCGの濃縮とmCHHの枯渇を観察した。 ただし、mCHGの濃縮は転写領域でも見つかりました(図5bおよび補足図14a、b)。これは針葉樹で見られるパターンと類似しています56。 GbM は遺伝子転写を調節することが提案されています 55。 我々は、中程度に発現された遺伝子上でmCHG / mCHHではなくmCGの明らかな富化を観察し、その発現はメチル化レベルと正の相関があり(図5cおよび補足図14c)、これは被子植物の姉妹系統におけるgbMの機能的保存を示している。 gbM の進化は、遺伝子近傍の TE の DNA メチル化サイレンシングに関連していると仮説が立てられています 55。 一貫して、遺伝子領域のTEの主成分であるLTR-RTが高度にメチル化されており(図5d)、TE挿入のある遺伝子はTEのない遺伝子よりも発現とCGメチル化の両方が高いことがわかりました(補足図5d)。 15)。

a メチロームプロファイリング用にサンプリングされた種子。 写真は種子の外側と内側(縦断面)を示しています。 b 種子のエクソン、イントロンおよび遺伝子隣接領域のメチル化レベル。 c 遺伝子のエキソン領域上の 3 つのシトシンコンテキストでのメチル化レベル。 遺伝子は、順序付けられた発現レベルに基づいて 20 のグループに分類されます。 各グループについて、遺伝子発現の中央値と遺伝子のすべてのエキソン領域にわたる平均メチル化レベルが記録されます。 d T.グランディスゲノムにおける無傷のLTR-RTのメチル化レベル。 e GO タームは、3 つの発生段階すべての種子に共有される脱メチル化バレーと重複する遺伝子が豊富です。 調整済み P 値 < 0.05 (Benjamini-Hochberg 補正を使用した両側フィッシャーの直接確率検定) を持つ GO 用語がプロットされ、ワー​​ド クラウド図内の GO 用語のサイズが統計的有意性と相関します。 f 脱メチル化の谷と重なる選択した遺伝子のメチル化レベルの図。 CESセルロースシンターゼ、PEペクチンエステラーゼ。 g 3 段階の種子のさまざまなゲノム領域における mCG および mCHG メチル化レベルの比較。 ソース データはソース データ ファイルとして提供されます。

種子の発育および発芽遺伝子は、どのシトシンコンテキストでもメチル化レベルが低かった (たとえば、<5%) 脱メチル化バレー (DMV) 内に局在していることがよくあります 57。 3 つのサンプルの種子ゲノムで 5,099 個の共通 DMV を特定しました。これは、144 kb に及ぶ最大間隔を含む 30 Mb に及びました。 DMVは4200のタンパク質コード遺伝子と交差し、その多くは貯蔵タンパク質、転写因子、細胞壁修飾、ホルモン恒常性、脂肪酸生合成のための酵素などの重要なクラスの種子タンパク質をコードしていました(図5e、f)。 T.グランディスの種子は仮種皮と呼ばれる特殊な成長物で覆われています(図5a)。 発育中、種皮は高度に木質化した二次細胞壁を発達させて種子の外面を強化します58。その一方で、胚乳を直接取り囲む柔らかい内部壁は保存されます。 一貫して、細胞壁の木質化に機能するラッカーゼ (n = 38) をコードする遺伝子 59 と、細胞壁の弛緩に関連するエクスパンシン (n = 13) 60 が DMV で頻繁に見つかりました (図 5f)。 注目すべきことに、T.グランディス転写因子(TF)遺伝子の18%(n = 370)が種子DMV領域内に位置しており、有意な濃縮を示しています(χ2検定; P < 0.0001;補足データ10)。 これらのTFは多様な遺伝子ファミリーに属していましたが、植物の成長と発育を調節することが知られているMYB、NAC、AP2ファミリーに特に豊富に含まれていました。 mCHHのメチル化は、種子発育中にmCGおよびmCHGのメチル化よりも顕著に変化しました(図5gおよび補足図16)。 3つのシトシンコンテキストのそれぞれについて、差次的にメチル化された領域(DMR)を特定しました(補足データ11〜13)。 DMRと重複する遺伝子のうち、それらの12%は差次的に発現され、種子発育中のエピジェネティックな変異が遺伝子発現の柔軟性に翻訳されることを示唆しています(補足図17)。 GO濃縮分析では、光合成が緑色植物の発達中に種子組織に酸素を提供することによってエネルギー生成生化学経路を促進するという事実と一致して、DMR関連遺伝子は主に光合成と二次代謝に関与する遺伝子で濃縮されていることが示されました(補足データ14)。発育中の種子は、特に内部組織への酸素の浸透が制限されています61。

裸子植物は地球上の生命史の宝庫と考えられています。 ここでは、裸子植物種 T. grandis の染色体レベルの参照ゲノムを構築しました。 ゲノムのサイズは巨大で、これまでに配列決定されたほとんどの植物種よりもはるかに大きいです。 マルチオミクスデータのこのアセンブリと分析に基づいて、我々は、(1) 古代LTR-RTの蓄積がT.グランディスゲノムの肥大化の一因となっているのに対し、T.グランディスは不均等な組換えとエピジェネティックなサイレンシングを通じてTEの拡大に対抗していると結論付ける。被子植物とは潜在的に異なるメカニズム。 (2) T.グランディスにおける重要な遺伝子ファミリー、例えば、その表現型の多様性の根底にある細胞壁活性およびパクリタキセル生合成に関与する遺伝子ファミリー、および生殖器官の同一性に関連するMADSボックス遺伝子の獲得または喪失には、古典的なB-およびCだけではないものも含まれる- 以前の研究ですでに提案されている機能遺伝子 35、36、37、38、39 だけでなく、B および C 機能遺伝子とは異なる発現パターンを示す追加の遺伝子 (例、TG8g01565)。 (3) Δ9-エロンガーゼとΔ5-デサチュラーゼはSCAを合成することができますが、これら2つの酵素は共進化し、顕花植物では失われています。 さらに、Δ5-デサチュラーゼの基質特異性は、2 つのヒスチジンに富むボックスによって決定され、その変異により基質認識が変化し、その後その産物が変化する可能性があります。 (4) T.グランディスの種子ゲノムは、高度にメチル化された反復配列と脱メチル化バレーの両方を含み、後者は細胞壁修飾や脂肪酸生合成、遺伝子発現やホルモン恒常性の調節などの重要な種子機能を発揮する遺伝子と交差する。 。 全体として、比較および機能ゲノム解析と組み合わせた当社の高品質参照ゲノムは、裸子植物の生物学、特に主要な陸上植物系統間の代謝の多様性を特徴とするSCAの生合成と進化についての洞察を提供します。

中国の紹興で栽培された T. grandis の植物からの若い葉は、2018 年 3 月に収集され、CTAB (2%) 法に従って DNA 抽出に使用されました62。 挿入サイズが 350 bp のペアエンド (PE) ライブラリーを、Illumina ゲノム DNA サンプル調製キットを製造元 (Illumina) の指示に従って使用して構築し、Illumina NovaSeq システムで 150 bp のリード長で配列決定しました。 PacBio SMRTbell ライブラリは、SMRTbell Express Template Prep Kit 2.0 を使用して構築され、PacBio Sequel II プラットフォームで配列決定されました。 循環コンセンサス リード (HiFi リード) は、パラメーター「-minPasses 3」を指定した ccs ソフトウェア (https://github.com/pacificbiosciences/unanimity/) を使用して生成されました。 Hi-C ライブラリーの調製と配列決定は、Novogene (中国、天津) によって、他の場所で説明されているプロトコールに従って実行されました 63。 簡単に言うと、2%ホルムアルデヒドで固定した葉組織を使用してライブラリーを調製しました。 核を抽出して透過処理し、クロマチンを DpnII 制限酵素 (NEB) で消化しました。 消化されたクロマチンは平滑末端化され、ビオチンで標識されました。 T4 DNA リガーゼ (NEB) を使用して DNA ライゲーションを実行し、その後、逆架橋のためにプロテイナーゼ K を添加しました。 次に、DNA 断片を精製し、Illumina NovaSeq プラットフォームで 2 × 150 bp のリード長で配列決定しました。

遺伝子の予測を支援するために、同じ植物の葉、根、茎、若い種子、仮種皮、種皮および穀粒組織から収集されたサンプルに対してトランスクリプトーム配列決定が実行されました(補足データ 1)。 TRIzol試薬(Invitrogen)を使用して全RNAを抽出し、NanoDrop ND-2000分光光度計(NanoDrop Technologies)を使用して定量した。 RIN スコア ≥8 の全 RNA から精製された mRNA (Bioanalyzer 2100、Agilent Technologies) を、メーカーの指示に従って NEBNext Ultra II RNA Library Prep Kit for Illumina (NEB) を使用したライブラリー構築に使用しました。 非鎖 RNA-Seq ライブラリーは、Illumina NovaSeq プラットフォーム上で 2 × 150 bp モードで配列決定されました。 PacBio Iso-seq では、葉、根、茎、仮種皮、および穀粒組織からの全 RNA を均等にプールし、SMARTer PCR cDNA 合成キット (Clontech) を使用して cDNA を合成しました。 サイズ分画と選択 (1 ~ 2、2 ~ 3、および 3 ~ 6 kb) は、BluePippin サイズ選択システム (Sage Science) を使用して実行されました。 SMRT ライブラリーは、SMRTbell Template Prep Kit 1.0 (Pacific Biosciences) を使用して生成し、PacBio RSII プラットフォームで配列決定しました。

HiFi リードは、hifiasm64 (バージョン 0.8-dirty-r280) をデフォルトのパラメーターで使用してアセンブルされ、アセンブルされたコンティグは Illumina リードを使用して Racon (https://github.com/lbcb-sci/racon; v1.4.13) によってさらに洗練されました。 Purge Haplotigs65 (バージョン v1.1.0) は、'contigcov' サブコマンドのパラメーター '-l 15 -m 70 -h 125' と 'purge' サブコマンドのパラメーター '-a 55' を使用して、アセンブリ内の冗長なシーケンスをフィルターで除外するために使用されました。 Hi-C ライブラリからの Illumina リードは Trimmomatic66 (v0.36) で処理され、アダプターと低品質配列が除去されました。 クリーン化されたリードは HiCUP (https://www.bioinformatics.babraham.ac.uk/projects/hicup/) によって分析され、重複していない有効なアライメントが特定され、ALLHiC67 (バージョン 0.9.8) によるスキャフォールディングに使用されました。 最初の足場は、Juicebox (https://github.com/aidenlab/Juicebox) を使用して手動でキュレーションされました。 アセンブリの完全性は、Illumina シーケンシングリードを使用して評価され、BWA-MEM68 を使用してゲノムアセンブリにマッピングされました。

反復配列は、相同性ベースの予測と de novo 予測の組み合わせを使用して同定されました。 T.グランディスの種特異的TEライブラリーは、LTR_Finder69およびRepeatModeler70によってそれぞれ同定されたLTRレトロトランスポゾン(LTR-RT)および他のTE要素を含むように構築されました。 次に、このライブラリは、Repbase ライブラリ 71 と結合され、RepeatMasker72 (v.4.0.7) による TE 識別が行われました。 反復要素もRepeatProteinMaskによって予測され、タンデム反復配列はTRFプログラムによって特定されました73。 LTR-RT の挿入時間を推定するために、無傷の LTR-RT を LTR_Finder と LTR-harvest74 で検索しました。 MUSCLE75 を使用して、インタクトな LTR-RT の LTR 配列をアラインメントし、それらの間のヌクレオチド距離 (K) を、EMBOSS パッケージ (http://emboss.sourceforge.net) の distmat プログラムを使用して、Kimura 2 パラメーター基準で計算しました。 。 挿入時間 (T) は次のように計算されました。

ここで、裸子植物種に使用されたヌクレオチド置換率 (r) は、年間 1 塩基あたり 2.2 × 10−9 でした11。 推定上のセントロメアリピートは、TRFによって同定されたタンデムリピートのコピー数と染色体分布に基づいて決定されました。

タンパク質をコードする遺伝子は、リピートマスクされたゲノム配列を使用して予測されました。 相同性に基づく予測の場合、1 つのコケ (Physcomitrella patens)、1 つのシダ (Selaginella moellendorffii)、7 つの被子植物 (Amborella trichopoda、Arabidopsis thaliana、Oryza sativa、Phalaenopsis equestris、Populus trichocarpa、Vitis vinifera、Zea Mays) および 4 つの被子植物からのタンパク質配列裸子植物 (イチョウ、グネトゥム モンタナム、エゾマツ、およびピナス テダ) を、e 値カットオフ 1E-5 の TBLASTN76 を使用して T. grandis ゲノムとアラインメントしました。 次に、GenBlastA77 を適用して、同じタンパク質アラインメントから隣接する高スコアのペアをクラスター化し、対応する遺伝子構造を GeneWise78 (v.2.4.1) で同定しました。 生の RNA-Seq リードを Trimmomatic66 (v0.36) でクリーニングし、TopHat279 を使用して T. grandis ゲノムにマッピングしました。 続いて、Cufflinks80 (v.2.2.1) を使用して遺伝子モデルを予測しました。 クリーン化された RNA-Seq リードは、Trinity81 (v2.0.13) および PASA82 (v2.2.0) で遺伝子構造を予測するためにも使用されました。 PASA パイプラインによって予測されたすべての完全な遺伝子構造は、AUGUSTUS83、GlimmerHMM84、および SNAP85 の遺伝子モデルのトレーニングに使用されました。 これら 3 つの予測子と、geneid86 および GENSCAN87 は、「-noInFrameStop=true -genemodel=complete」が AUGUSTUS に適用されたことを除き、デフォルトのパラメーターで ab initio 遺伝子予測に使用されました。 最後に、さまざまなアプローチで予測されたすべての遺伝子モデルを統合し、EVidenceModeler88 と次の重みスコア マトリックスを使用して信頼性の高い遺伝子セットを生成しました: PASA、100。 ジーンワイズ、20歳。 カフリンクス、20; アウグストゥス、5 年。 その他の ab initio 予測子、1.

予測遺伝子の精度を評価するために、BUSCO19 を使用して高度に保存された遺伝子の範囲を調べました。 さらに、データベース京都遺伝子・ゲノム百科事典 (KEGG; https://www.genome.jp/kegg/)89、SwissProt および TrEMBL (https:// www.uniprot.org/) は、1E-5 の e 値カットオフを持つ BLASTP を使用し、最良のアライメント ヒットを使用して相同性に基づく遺伝子機能を割り当てました。 GO (http://geneontology.org/) カテゴリと InterPro (https://www.ebi.ac.uk/interpro/) エントリは InterProScan90 経由で取得されました。

18 の代表的な種(イチイ属ワリキアナ、アンボレラ・トリコポダ、シロイヌナズナ、イチョウ、グネトゥム・モンタナム、ウェルウィッチア・ミラビリス、イネ、ナス・リコペルシクム、フィスコミトレラ・パテンス、ピヌス・タブリフォルミス、セラギネラ・モエレンドルフィ、ヴィティス)の各タンパク質コード遺伝子の最長転写産物vinifera、Sequoiadendron giganteum、Azolla filiculoides、Klebsormidium flaccidum、Chara braunii、Marchantia Polymorpha、Penium margaritaceum) および T. grandis を選択し、OrthoFinder91 を使用した全対全 BLASTP アラインメントに基づいて遺伝子ファミリーを構築しました。 系統解析は、IQ-TREE92 (v. 2.1.3) を使用して実施されました。 CAFE93 (v.4.2.1) を使用した MRCA 解析に基づいて、現存種とその最後の共通祖先の間の遺伝子ファミリーの拡大と縮小を決定しました。

全対全 BLASTP 検索は、1E-5 の e 値カットオフで実行されました。 各遺伝子について上位 5 つのアラインメントが選択され、MCScanX94 と同一線上のブロックに位置するシンテニック遺伝子ペアを検出するために使用されました。 パラロガス遺伝子ペアは、最良の相互 BLASTP アラインメントによって決定されました。 各シンテニックまたはパラロガス遺伝子ペアの Ks は、パッケージ PAML 4.8a95 の YN00 をデフォルトのパラメーターで使用して計算されました。 WGD の系統発生に基づく推論は、各遺伝子ツリーと種ツリーの調整に基づいて実行されました。

メーカーの推奨に従い、NEB Next® Multiplex Small RNA Library Prep Set for Illumina® (NEB, USA) を使用して、低分子 RNA ライブラリー構築のために葉から全 RNA (3 μg) を単離しました。 構築されたライブラリー内の 140 ~ 160 bp の範囲内の DNA フラグメントが回収され、ライブラリーは Agilent Bioanalyzer 2100 システムで評価され、続いて Illumina HiSeq 2500 プラットフォームで配列決定されました。 Small RNA ライブラリの生のリードを Trimmomatic66 (v0.36) で処理してアダプターを除去し、Bowtie96 を使用してミスマッチを許さずに参照ゲノムにアラインメントしました。

T.グランディスの種子は、重亜硫酸塩およびトランスクリプトーム配列決定のために、2021年の3月8日(ステージ1)、3月24日(ステージ2)、および4月8日(ステージ3)に1本の木から収集されました。 0.5 ng のラムダ DNA をスパイクした約 100 ng の高品質ゲノム DNA を Covaris S220 で超音波処理しました (パラメーター: PIP、50 W、デューティーファクター、20、バーストあたりのサイクル数、200、処理時間、110 秒、温度、20 °C、処理時間、110 秒)。サンプル量、52 μL)。 断片化された DNA (200 ~ 300 bp) は、EZ DNA Mmethylation-GoldTM Kit (Zymo Research) を使用して亜硫酸水素塩で処理され、ライブラリーの品質が評価され、Illumina NovaSeq プラットフォームでペアエンド モードで配列決定されました。

生のリードは Trimmomatic66 (v0.36) でクリーニングされ、アダプターと低品質の配列が除去されました。 クリーニングされたリードをアライメントするために、参照ゲノムとリードの両方が変換され (C-to-T および G-to-A)、パラメータ「-X 700 –dovetail」を使用して Bismark97 (バージョン 0.16.3) でアライメントされました。 ゲノムの「ワトソン」鎖と「クリック」鎖の両方に対して独自の最良のアライメントを生成したリードが保持され、すべてのシトシン ヌクレオチドのメチル化状態が推定されました。 亜硫酸水素ナトリウムの変換率は、ラムダゲノムに対するリードアライメントに基づいて推定されました。 メチル化部位は、メチル化数 (mC)、総数 (mC+umC)、および変換率 (r) を使用した二項検定で同定されました。 FDR 補正 P 値 < 0.05 の部位をメチル化部位とみなしました。 全ゲノムのメチル化レベルを計算するために、ゲノムを 10 kb のビンに分割し、各ウィンドウのメチル化レベルを count(mC)/(count(mC) + count(umC)) として計算しました。 示差的にメチル化された領域 (DMR) は、DSS ソフトウェア 98 を使用して、P 値閾値 0.05 の下で同定されました。 DMR は、遺伝子と重複するかどうか、またどのように重複するかに基づいてカタログ化されました。 あらゆる状況においてメチル化レベルが 5% 未満である T. grandis ゲノム全体にわたる連続的なシトシン部位を統合し、脱メチル化バレーとして定義しました。

雄の球果は、2021 年 2 月から 4 月にかけて 7 日の間隔で 8 つの異なる段階で T. グランディスの木から収集され、雌の球果は 2021 年 1 月から 4 月にかけて 16 日の間隔で 6 つの異なる段階で収集されました。 。 穀粒、葉、根、茎を含む他のサンプルも同じ木から収集されました。 各サンプリングは 3 つの生物学的複製を使用して実行されました。 TRIzol試薬(Invitrogen)を使用して全RNAを抽出した。 RNA-Seq ライブラリーは、メーカーの指示に従って NEBNext Ultra II RNA Library Prep Kit for Illumina (NEB) を使用して構築し、Illumina NovaSeq プラットフォームで 2 × 150 bp モードでシーケンスしました。 生の RNA-Seq リードは Trimmomatic66 (v0.36) を使用してクリーニングされました。 クリーン化されたリードは、STAR aligner99 (v2.7.10a) を使用してゲノムにマッピングされました。 アラインメントはHTSeq-count100を使用してカウントされ、調整されたP ≤ 0.01および倍数変化≧2のカットオフの下で、差次的に発現される遺伝子がDESeq2(参考文献101)で同定されました。

潜在的な HGT は、相同性スコアと系統発生シグナルに基づいて同定されました 102。 簡単に言うと、我々は 3 つのカスタマイズされたデータベースを作成しました。すなわち、古細菌、細菌、真菌のすべてのタンパク質配列を含むグループ外データベース、公開されている 10 種の裸子植物種のタンパク質配列を含むグループ内データベース、およびすべての種のタンパク質配列からなる中間グループ データベースです。裸子植物を除く植物を掲載しました。 T.グランディスのタ​​ンパク質配列は、1E-5のe値カットオフで3つのカスタマイズされたデータベースに対して個別にブラストされました。 各クエリタンパク質配列について、データベースごとに 100 個以下のブラスト ヒット (種ごとに 1 ヒット) を保存し、アライメントの平均ビットスコア値 (ABV) を計算しました。 アウトグループの ABV が中間グループの ABV よりも大きいクエリタンパク質が保持されました。 残りのクエリタンパク質のそれぞれについて厳密な系統解析を実行し、ツリーのトポロジーを手動で検査しました。 ABV と系統発生の両方によってサポートされる T. grandis 遺伝子は、水平転移遺伝子の可能性があると考えられました。

約0.5gの乾燥サンプルを9mLの10%H2SO4−CH3OH溶液と室温で10時間混合した。 脂肪酸メチルエステルを濾過し、次いで30mLの蒸留水および30mLのジクロロメタンで抽出した。 有機相を無水硫酸ナトリウムで乾燥し、窒素ブロワーで約1mlまで濃縮した。 濃縮抽出物を、内部標準として脂肪酸メチルを使用したガスクロマトグラフィー(GC; Thermo Scientific TRACE-1300、イタリア)による脂肪酸分析に使用しました。 GC 分離は、Agilent DB-WAX キャピラリ GC カラム (30 m × 0.25 mm、膜厚 0.25 μm) を使用して実行し、各サンプル 1 μl を 1:20 の比率のスプリット モードで注入しました。 超高純度ヘリウムをキャリアガスとして使用しました。 注入口と検出器の温度はそれぞれ 220 °C と 240 °C に設定されました。 カラム温度プログラミングは 140 °C で開始し、1 分間保持し、4 °C/分の速度で 250 °C まで加熱しました。 カラム温度を 250 °C で 2 分間保持しました。

終止コドンを含まない各遺伝子の CDS をクローニングし、pCAMBIA1300-GFP ベクターの GFP 遺伝子の N 末端に融合しました。 得られたプラスミドをアグロバクテリウム・ツメファシエンスGV3101に導入した。 陽性クローンを OD600 が 0.6 になるまでインキュベートし、8000 rpm で 6 分間遠心分離しました。 収集した細胞を浸潤緩衝液 (10 mM MgCl2、0.2 mM アセトシリンゴン、および 10 mM MES、pH 5.6) で再懸濁し、次にこれをベンサミアナタバコの葉に注入しました。 3日間の培養後、葉からのGFP蛍光シグナルを観察し、共焦点レーザー走査顕微鏡(LSM510: Karl Zeiss)を使用して捕捉した。

RNAprep pure Plant Kit (TIANGEN) を使用して全 RNA を抽出しました。 PrimeScriptTM RT Master Mix Kit (Takara) を使用して、1 μg のトータル RNA から First-strand cDNA を合成しました。 SYBR Premix Ex Taq™ キット (Takara) を使用して定量的リアルタイム PCR を実行しました。 標的遺伝子の発現データをアクチンをコードする遺伝子の発現で補正した。 反応条件は、95℃で10秒間、55℃で10秒間、72℃で20秒間、45サイクルでした。 相対発現は2-ΔΔCt法を用いて計算した。

TgEOL1、TgDES1、AtSLD2 (AT2G46210) のコード領域と 2 つの組換え遺伝子 (AtSLD2-Motif2 および AtSLD2-Motif3) をバイナリーベクター (pCAMBIA1300) の 35S プロモーターの下流にそれぞれ挿入しました。 得られた各構築物をアグロバクテリウム ツメファシエンス GV3101 株に形質転換し、カナマイシン (50 mg/L) およびリファンピシリン (50 mg/L) を添加した LB 培地中で 28 °C で OD600 が 0.6 に達するまで増殖させました。 N. ベンサミアナの葉における AtSLD2 および 2 つの組換え遺伝子の一過性発現のために、細胞を採取し、最終 OD600 が 1.0 になるまで 10 mM MES 緩衝液 (10 mM MgCl2 および 0.1 mM アセトシリンゴンを含む) に再懸濁しました。 無針注射器を使用して、生後5週間のN.ベンサミアナ植物の若葉に各株の細胞を浸潤させ、5日後にSCA含有量の測定のために採取した。 TgDES1 および TgELO1 過剰発現シロイヌナズナの生成のために、pCAMBIA1300-TgELO1 および pCAMBIA1300-TgELO1 構築物を A. tumefaciens 媒介フローラル ディップ法によってシロイヌナズナに形質転換しました。 ハイグロマイシン耐性 T1 植物を種子収穫用に植え、ハイグロマイシン耐性比 3:1 の T2 種子を選択して T3 種子を収集しました。 ハイグロマイシンに対して 100% 耐性を持つ T3 種子を SCA 含有量の測定に使用しました。

研究デザインの詳細については、この記事にリンクされている Nature Portfolio Reporting Summary を参照してください。

ゲノムアセンブリおよびゲノム、トランスクリプトーム、およびメチロームシークエンシングの生リードは、国立バイオテクノロジー情報センター BioProject データベースにアクセッション PRJNA938254 で、および中国国家ジーンバンク データベース (CNGBdb) の CNGB 配列アーカイブ (CNSA) にアクセッション CNP0003453 で寄託されています。 ゲノムのアセンブリとアノテーションは、Figshare [https://doi.org/10.6084/m9.figshare.21089869] からも入手できます。 ソースデータはこのペーパーに付属しています。

李、HTら。 被子植物の起源とジュラ紀のギャップの謎。 ナット。 Plants 5、461–470 (2019)。

論文 PubMed Google Scholar

デ・ラ・トーレ、アーカンソー州ほか裸子植物の機能的および形態的進化: 関与する遺伝子ファミリーの肖像。 進化。 Appl 13、210–227 (2020)。

論文 PubMed Google Scholar

Linkies, A.、Graeber, K.、Knight, C. & Leubner-Metzger, G. 種子の進化。 N.フィトール。 186、817–831 (2010)。

記事 CAS Google Scholar

Chen, X. & Jin, H. 中国におけるトレヤの栽培と開発に関するレビュー。 Trees Livelihoods 28、68–78 (2019)。

記事 Google Scholar

Wang, H.、Guo, T. & Ying、GQ トレヤ・アーンの植物の活性成分とその薬理学的活性に関する研究の進歩。 顎。 伝統。 ハーブ。 Drugs 38、1748–1750 (2007)。

Google スカラー

ウー、J.ら。 トレヤ グランディスの新たなトランスクリプトーム配列決定により、シアドン酸生合成経路における遺伝子制御が明らかになりました。 工業用作物生産品 120、47–60 (2018)。

記事 CAS Google Scholar

彼、Z.ら。 さまざまなトレヤ グランディス品種の低温圧搾核油の化学成分。 食品化学。 209、196–202 (2016)。

論文 CAS PubMed Google Scholar

バーガー、A.ら。 5,11,14 20:3 の表皮抗炎症特性: マウスの耳浮腫、培養ケラチノサイトの PGE2 レベル、および PPAR 活性化に対する効果。 脂質の健康障害 1、5 (2002)。

記事 PubMed PubMed Central Google Scholar

ペドロノ、F. et al. 松の実由来のシアドン酸は、ラット肝臓のΔ9-デサチュラーゼを阻害することで血漿トリグリセリドを低下させる食品成分です。 科学。 議員 10、6223 (2020)。

論文 ADS PubMed PubMed Central Google Scholar

Endo, Y.、Osada, Y.、Kimura, F. & Fujimoto, K. ラットの脂質代謝に対する日本のトレヤ (Torreya nucifera) 種子油の効果。 栄養学 22、553–558 (2006)。

論文 CAS PubMed Google Scholar

ソング、L.ら。 デルタ 5-不飽和ポリメチレン中断脂肪酸の進歩: 資源、生合成、および利点。 クリティカル。 食品科学牧師ニュートル。 63、767–789 (2023)。

Aitzetmüller, K. エランシス種子油の異常な脂肪酸パターン。 リピッド 31、201–205 (1996)。

論文 PubMed Google Scholar

Niu, S. et al. 中国のマツのゲノムとメチロームは、針葉樹の進化の重要な特徴を明らかにします。 セル 185、204–217.e14 (2022)。

論文 CAS PubMed Google Scholar

Nystedt、B. et al. ノルウェートウヒのゲノム配列と針葉樹のゲノム進化。 ネイチャー 497、579–584 (2013)。

論文 ADS CAS PubMed Google Scholar

Liu、H.ら。 イチョウのほぼ完全なゲノムは、裸子植物の進化を明らかにします。 ナット。 Plants 7、748–756 (2021)。

論文 CAS PubMed Google Scholar

ワン、T.ら。 ウェルウィッチアのゲノムは、砂漠での極端な長寿を支える独特の生物学を明らかにしています。 ナット。 共通。 12、4247 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Liu、Y.ら。 ソテツのゲノムと種子植物の初期進化。 ナット。 Plants 8、389–401 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

Cheng, J. et al. ヒマラヤイチイの染色体レベルのゲノムは、パクリタキセル生合成経路の起源と進化についての洞察を提供します。 モル。 プラント 14、1199–1209 (2021)。

論文 CAS PubMed Google Scholar

シオン、Xら。 イチイのゲノムは、パクリタキセル生合成に関する洞察を提供します。 ナット。 Plants 7、1026–1036 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Rhie, A.、Walenz, BP、Koren, S. & Phillippy, AM Merqury: ゲノム アセンブリの参照フリーの品質、完全性、および段階的評価。 ゲノムバイオル。 21、245 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Manni, M.、Berkeley, MR、Seppey, M.、Simão, FA & Zdobnov, EM BUSCO の最新情報: 真核生物、原核生物、およびウイルスのゲノムをスコアリングするための、より広範囲かつより深い系統発生的範囲に加え、斬新で合理化されたワークフロー。 モル。 バイオル。 進化。 38、4647–4654 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Ou, S.、Chen, J. & Jiang, N. LTR アセンブリインデックス (LAI) を使用したゲノムアセンブリの品質の評価。 核酸研究 46、e126 (2018)。

PubMed PubMed Central Google Scholar

Steinthorsdottir, M. et al. 中新世: 過去の未来。 古海洋生物。 古気候。 36、e2020PA004037 (2021)。

記事 Google Scholar

El Baidouri, M. & Panaud, O. 植物界全体にわたるゲノム古生物学の比較により、TE によるゲノム進化のダイナミクスが明らかになります。 ゲノムバイオル。 進化。 5、954–965 (2013)。

記事 PubMed PubMed Central Google Scholar

Matzke, MA & Mosher, RA RNA 指向性 DNA メチル化: 複雑さが増大するエピジェネティックな経路。 ナット。 ジュネ牧師。 15、394–408 (2014)。

論文 CAS PubMed Google Scholar

中村 M.、ケーラー C. & ヘンニッヒ L. 裸子植物の木、ノルウェーのトウヒにおける組織特異的トランスポゾン関連低分子 RNA。 BMCジェノム。 20, 997 (2019)。

記事 CAS Google Scholar

Van de Peer, Y.、Mizrachi, E.、Marchal, K. 倍数性の進化上の重要性。 ナット。 ジュネ牧師。 18、411–424 (2017)。

論文 PubMed Google Scholar

Leebens-Mack、JH et al. 1,000 の植物トランスクリプトームと緑色植物の系統ゲノミクス。 ネイチャー 574、679–685 (2019)。

記事 Google Scholar

サン、Xら。 アーバスキュラー菌根菌 Diversisspora epigaea (以前は Glomus versiforme) とその細菌内部共生生物のゲノムと進化。 N.フィトール。 221、1556–1573 (2019)。

記事 CAS Google Scholar

Jiao, C. et al. Penium margaritaceum のゲノム: 陸上植物の起源の特徴。 セル 181、1097–1111.e12 (2020)。

論文 CAS PubMed Google Scholar

ボウマン、JLら。 陸上植物の進化についての洞察は、ゼニゴケのゲノムから得られました。 セル 171、287–304.e15 (2017)。

論文 CAS PubMed Google Scholar

Bouché, F.、Lobet, G.、Tocquin, P. & Périlleux, C. FLOR-ID: シロイヌナズナの開花期遺伝子ネットワークの対話型データベース。 核酸研究所 44、D1167–D1171 (2016)。

論文 PubMed Google Scholar

リー、LXら。 シロイヌナズナ NOP10 は配偶体の形成に必要です。 J.Integrate. 植物バイオル。 60、723–736 (2018)。

論文 CAS PubMed Google Scholar

Schoof, H. et al. シロイヌナズナのシュートメリステムの幹細胞集団は、CLAVATA 遺伝子と WUSCHEL 遺伝子の間の制御ループによって維持されています。 セル 100、635–644 (2000)。

論文 CAS PubMed Google Scholar

Soltis, DE、Chanderbali, AS、Kim, S.、Buzgo, M. & Soltis, PS ABC モデルと基底被子植物へのその適用性。 アン。 ボット。 100、155–163 (2007)。

論文 CAS PubMed PubMed Central Google Scholar

Dreni, L. & Zhang, D. 花の発生: AGL6 サブファミリー MADS ボックス遺伝子の進化の歴史と機能。 J.Exp. ボット。 67、1625–1638 (2016)。

論文 CAS PubMed Google Scholar

Kong、X.ら。 コムギAGL6様MADSボックス遺伝子は花器官のアイデンティティーのマスター調節因子であり、小穂分裂組織の発達操作の標的である。 植物バイオテクノロジー。 J. 20, 75–88 (2022)。

論文 CAS PubMed Google Scholar

Zhang、L.ら。 スイレンのゲノムと顕花植物の初期進化。 ネイチャー 577、79–84 (2020)。

論文 ADS CAS PubMed Google Scholar

チャンデルバリ、AS et al. 被子植物の多様化の間の遺伝子発現の保存と運河化は、花の起源と進化に伴います。 手順国立アカデミー。 科学。 USA 107、22570–22575 (2010)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Souza、PFN 忘れられた 2S アルブミンタンパク質: 農業と人間の健康における重要性、構造、およびバイオテクノロジーへの応用。 内部。 J.Biol. マクロモル。 164、4638–4649 (2020)。

論文 CAS PubMed Google Scholar

Tandang-Silvas, MR 他結晶構造に基づく植物種子11Sグロブリンの保存と分岐。 ビオチム。 生物物理学。 Acta 1804、1432–1442 (2010)。

論文 CAS PubMed Google Scholar

Cheng, S. et al. 地上のZygnematophyceaeのゲノムは、陸上植物の進化に関する洞察を提供します。 セル 179、1057–1067.e14 (2019)。

論文 CAS PubMed Google Scholar

Weng, JK & Chapple, C. リグニン生合成の起源と進化。 N.フィトール。 187、273–285 (2010)。

記事 CAS Google Scholar

山口正人 他血管関連 NAC-ドメイン 6 および血管関連 NAC-ドメイン 7 は、誘導システムの制御下で木部血管要素への分化転換を効果的に誘導します。 植物生理学。 153、906–914 (2010)。

論文 CAS PubMed PubMed Central Google Scholar

Zhong, R.、Richardson, EA & Ye, ZH 2 つの NAC ドメイン転写因子、SND1 と NST1 は、シロイヌナズナの線維における二次壁合成の制御において重複して機能します。 Planta 225、1603–1611 (2007)。

論文 CAS PubMed Google Scholar

Jokipii-Lukkari, S. et al. NorWood: 針葉樹材の発達に関する evo-devo 研究のための遺伝子発現リソース。 N.フィトール。 216、482–494 (2017)。

記事 Google Scholar

Meesapyodsuk, D. & Qiu, X. フロントエンド デサチュラーゼ: 構造、機能、進化、およびバイオテクノロジーの利用。 リピッド 47、227–237 (2012)。

論文 CAS PubMed Google Scholar

Sayanova, O.、Haslam, R.、Venegas Caleron, M. & Napier, JA アネモネ・レベイレイ由来の珍しい脂肪酸デサチュラーゼのクローニングと特性評価: シアドン酸の合成に関与するアシル補酵素 A C20 Δ5-デサチュラーゼの同定。 植物生理学。 144、455–467 (2007)。

論文 CAS PubMed PubMed Central Google Scholar

Xue、JA et al. 酵母のアシル-CoA-Δ9 デサチュラーゼの発現により、大豆種子における異常な一価不飽和脂肪酸の蓄積が引き起こされます。 バイオテクノロジー。 レット。 35、951–959 (2013)。

論文 CAS PubMed Google Scholar

Lim, ZL、Senger, T. & Vrinten, P. 4 つのアミノ酸残基が、Siganus canaliculatus Δ4 および Δ5/6 デサチュラーゼの基質鎖長と位置選択性に影響を与えます。 リピッド 49、357–367 (2014)。

論文 CAS PubMed Google Scholar

Buček, A.、Vazdar, M.、Tupec, M.、Svatoš, A. & Pichová, I. デサチュラーゼの特異性は、基質結合トンネル内の単一アミノ酸残基の物理化学的特性によって制御されます。 計算します。 構造体。 バイオテクノロジー。 J. 18, 1202–1209 (2020)。

記事 PubMed PubMed Central Google Scholar

チェン、M.ら。 種子ゲノムの低メチル化領域には転写因子遺伝子が豊富に含まれています。 手順国立アカデミー。 科学。 USA 115、E8315–E8322 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

Niederhuth、CE et al. 被子植物内の DNA メチル化の広範な自然変動。 ゲノムバイオル。 17、194 (2016)。

記事 PubMed PubMed Central Google Scholar

オーシン、I.ら。 20ギガベースのノルウェートウヒゲノムのDNAメチローム。 手順国立アカデミー。 科学。 USA 113、E8106–E8113 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Bewick、AJ & Schmitz、RJ 植物における遺伝子体の DNA メチル化。 カー。 意見。 植物バイオル。 36、103–110 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Tatsuno, S.、Ran, JH & Gaut, BS 遺伝子 DNA メチル化の進化パターンは陸上植物によって異なります。 ナット。 Plants 2、15222 (2016)。

論文 CAS PubMed Google Scholar

リン、JY 他ダイズとシロイヌナズナの種子のメチロームの類似性および非 CG メチル化の喪失は種子の発育に影響を与えません。 手順国立アカデミー。 科学。 USA 114、E9730–E9739 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Chen, F.、Tobimatsu, Y.、Havkin-Frenkel, D.、Dixon, RA & Ralph, J. 植物種子中のカフェイルアルコールのポリマー。 手順国立アカデミー。 科学。 USA 109、1772–1777 (2012)。

論文 ADS CAS PubMed PubMed Central Google Scholar

平出 宏 ほか局所的なラッカーゼ活性は、裸子植物圧縮木材中のリグニンポリマーの分布を調節します。 N.フィトール。 230、2186–2199 (2021)。

記事 CAS Google Scholar

コスグローブ、DJ エクスパンシンによる植物細胞壁の緩み。 Nature 407、321–326 (2000)。

論文 ADS CAS PubMed Google Scholar

Vigeolas, H.、van Dongen, JT、Waldeck, P.、Huhn, D. & Geigenberger, P. 脂質貯蔵代謝は、アブラナの発育中の種子内の一般的な低酸素濃度によって制限されます。 植物生理学。 133、2048–2060 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

マレー、MG およびトンプソン、WF 高分子量植物 DNA の迅速な単離。 核酸研究所 8、4321–4325 (1980)。

論文 CAS PubMed PubMed Central Google Scholar

Zhu、W.ら。 変化したクロマチン圧縮とヒストンメチル化により、種間シロイヌナズナ雑種における非相加的遺伝子発現が促進されます。 ゲノムバイオル。 18、157(2017)。

記事 PubMed PubMed Central Google Scholar

Cheng, H.、Concepcion, GT、Feng, X.、Zhang, H. & Li, H. ハイフィアズムを備えた段階的アセンブリ グラフを使用した、ハプロタイプ解決された de novo アセンブリ。 ナット。 方法 18、170–175 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Roach, MJ、Schmidt, S. & Borneman, AR ハプロティグのパージ: 第 3 世代二倍体ゲノム アセンブリのシンテニーの削減。 BMCバイオインフォマ。 19、460 (2018)。

記事 CAS Google Scholar

Bolger, AM、Lohse, M. & Usadel, B. Trimmomatic: Illumina シーケンス データ用の柔軟なトリマー。 バイオインフォマティクス 30、2114–2120 (2014)。

論文 CAS PubMed PubMed Central Google Scholar

Zhang, X.、Zhang, S.、Zhao, Q.、Ming, R. & Tang, H. Hi-C データに基づく、対立遺伝子を認識した染色体スケールの自己倍数体ゲノムのアセンブリ。 ナット。 Plants 5、833–845 (2019)。

論文 CAS PubMed Google Scholar

Li, H. & Durbin, R. Burrows-Wheeler 変換による高速かつ正確なショートリード アライメント。 バイオインフォマティクス 25、1754–1760 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: 全長 LTR レトロトランスポゾンを予測するための効率的なツール。 核酸研究所 35、W265–W268 (2007)。

記事 PubMed PubMed Central Google Scholar

フリン、JM 他転移因子ファミリーの自動ゲノム発見のためのRepeatModeler2。 手順国立アカデミー。 科学。 USA 117、9451–9457 (2020)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Bao, W.、Kojima, KK & Kohany, O. Repbase Update、真核生物ゲノムの反復要素のデータベース。 モブ。 DNA 6、11 (2015)。

記事 PubMed PubMed Central Google Scholar

Tarailo-Graovac, M. & Chen, N.RepeatMasker を使用してゲノム配列内の反復要素を識別します。 カー。 プロトック。 バイオインフォマ。 25、第 4 章:ユニット 4.10 (2009)。

記事 Google Scholar

Benson, G. Tandemrepeats finder: DNA 配列を分析するプログラム。 核酸研究所 27、573–580 (1999)。

論文 CAS PubMed PubMed Central Google Scholar

Ellinghaus, D.、Kurtz, S. & Willhoeft, U. LTRharvest、LTR レトロトランスポゾンの de novo 検出のための効率的で柔軟なソフトウェア。 BMCバイオインフォマ。 9、18 (2008)。

記事 Google Scholar

Edgar、RC MUSCLE: 高精度および高スループットの複数配列アライメント。 核酸研究所 32、1792–1797 (2004)。

論文 CAS PubMed PubMed Central Google Scholar

Altschul, SF、Gish, W.、Miller, W.、Myers, EW & Lipman, DJ 基本的なローカル アライメント検索ツール。 J.Mol. バイオル。 215、403–410 (1990)。

論文 CAS PubMed Google Scholar

She、R.、Chu、JS、Wang、K.、Pei、J.、Chen、N. GenBlastA: BLAST による相同遺伝子配列の同定を可能にします。 ゲノム研究所 19、143–149 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Birney, E.、Clamp, M. & Durbin, R. GeneWise およびゲノムワイズ。 ゲノム研究所 14、988–995 (2004)。

論文 CAS PubMed PubMed Central Google Scholar

Trapnell, C.、Pachter, L. & Salzberg, SL TopHat: RNA-Seq によるスプライス結合の発見。 バイオインフォマティクス 25、1105–1111 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Roberts, A.、Pimentel, H.、Trapnell, C. & Pachter, L. RNA-Seq を使用した注釈付きゲノム内の新規転写物の同定。 バイオインフォマティクス 27、2325–2329 (2011)。

論文 CAS PubMed Google Scholar

Grabherr、MG et al. 参照ゲノムを使用しない RNA-Seq データからの全長トランスクリプトーム アセンブリ。 ナット。 バイオテクノロジー。 29、644–652 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

ハース、BJら。 最大転写アライメントアセンブリを使用したシロイヌナズナゲノムのアノテーションの改善。 核酸研究所 31、5654–5666 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

スタンケ、M.ら。 オーガスタス: 代替転写産物の ab initio 予測。 核酸研究所 34、W435–W439 (2006)。

論文 CAS PubMed PubMed Central Google Scholar

Pertea, M.、Salzberg, SL & Majoros、WH TigrScan および GlimmerHMM: 2 つのオープンソースの非経験的真核生物遺伝子ファインダー。 バイオインフォマティクス 20、2878–2879 (2004)。

論文 PubMed Google Scholar

Korf, I. 新規ゲノムにおける遺伝子発見。 BMCバイオインフォマ。 5, 59 (2004)。

記事 Google Scholar

Alioto, T.、Blanco, E.、Parra, G.、Guigó, R. 遺伝子を識別するためのgeneidの使用。 カー。 プロトック。 バイオインフォマ。 64、e56 (2018)。

記事 Google Scholar

Burge, C. & Karlin, S. ヒトゲノム DNA における完全な遺伝子構造の予測。 J.Mol. バイオル。 268、78–94 (1997)。

論文 CAS PubMed Google Scholar

ハース、BJら。 EVidenceModeler とスプライスアラインメントを組み立てるプログラムを使用した自動化された真核生物の遺伝子構造アノテーション。 ゲノムバイオル。 9、R7 (2008)。

記事 PubMed PubMed Central Google Scholar

森島和也、田辺正人、古道正人、兼久正人、佐藤裕也 KEGG: ゲノム、経路、疾患、薬物に関する新たな視点。 核酸研究所 45、353–361 (2016)。

Google スカラー

ミッチェル、A.ら。 InterProScan 5: ゲノムスケールのタンパク質機能分類。 バイオインフォマティクス 30、1236–1240 (2014)。

記事 PubMed PubMed Central Google Scholar

Emms, DM & Kelly, S. OrthoFinder: 比較ゲノミクスのための系統発生的オルソロジー推論。 ゲノムバイオル。 20、238 (2019)。

記事 PubMed PubMed Central Google Scholar

Nguyen, LT、Schmidt, HA、von Haeseler, A. & Minh, BQ IQ-TREE: 最尤系統を推定するための高速かつ効果的な確率論的アルゴリズム。 モル。 バイオル。 進化。 32、268–274 (2015)。

論文 CAS PubMed Google Scholar

De Bie, T.、Cristianini, N.、Demuth, JP & Hahn, MW CAFE: 遺伝子ファミリーの進化を研究するための計算ツール。 バイオインフォマティクス 22、1269–1271 (2006)。

論文 PubMed Google Scholar

Wang, Y. et al. MCScanX: 遺伝子のシンテニーと共線性の検出と進化的分析のためのツールキット。 核酸研究所 40、49 (2012)。

記事 ADS Google Scholar

Yang、Z. PAML 4: 最尤法による系統解析。 モル。 バイオル。 進化。 24、1586–1591 (2007)。

論文 CAS PubMed Google Scholar

Langmead, B.、Trapnell, C.、Pop, M. & Salzberg, SL ヒトゲノムに対する短い DNA 配列の超高速かつメモリ効率の高いアライメント。 ゲノムバイオル。 10、R25 (2009)。

記事 PubMed PubMed Central Google Scholar

Krueger, F. & Andrews, SR Bismark: Bisulfite-Seq アプリケーション用の柔軟なアライナーおよびメチル化コーラー。 バイオインフォマティクス 27、1571–1572 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Park, Y. & Wu, H. 一般的な実験計画に基づく BS-seq データの示差メチル化分析。 バイオインフォマティクス 32、1446–1453 (2016)。

論文 CAS PubMed Google Scholar

ドービン、A.ら。 STAR: 超高速ユニバーサル RNA-seq アライナー。 バイオインフォマティクス 29、15–21 (2013)。

論文 CAS PubMed Google Scholar

Anders, S.、Pyl, PT & Huber, W. HTSeq - 高スループットのシーケンス データを操作する Python フレームワーク。 バイオインフォマティクス 31、166–169 (2015)。

論文 CAS PubMed Google Scholar

Love, MI、Huber, W. & Anders, S. DESeq2 を使用した RNA-seq データの倍数変化と分散の適度な推定。 ゲノムバイオル。 15, 550 (2014)。

記事 PubMed PubMed Central Google Scholar

リー、Yら。 HGT は昆虫に広く分布しており、鱗翅目では雄の求愛に寄与しています。 セル 185、2975–2987.e10 (2022)。

論文 CAS PubMed Google Scholar

リファレンスをダウンロードする

この研究は、中国国家自然科学財団 (NSFC) から、浙江省重点研究開発プログラムである JW (助成金番号 U20A2049)、LS (助成金番号 31971699)、XS (助成金番号 32102318) への助成金によって支援されました。省からHLへ(助成金番号2021C02001)、浙江農産大学の科学研究スタートアップ基金プロジェクトからHLへ(助成金番号2018FR028)、亜熱帯造林国家重点研究所からJWへの助成金(助成金番号ZY20180312およびZY20180209)。 著者らは、植物サンプルを提供してくださったアトランタ植物園(米国)のエミリー・ED・コフィー博士とカリフォルニア大学デービス校のマーク・W・シュワルツ教授に感謝します。

これらの著者は同様に貢献しました: Heqiang Lou、Lili Song、Xiaolong Li。

亜熱帯造林国家重点実験室、浙江農産大学、杭州、311300、浙江省、中国

Heqiang Lou、Lili Song、Weijie Chen、Yadi Gao、Shan Zheng、Jiasheng Wu

浙江省山岳地帯における効率的でグリーンな農業生産のための共同イノベーションセンター、浙江農工大学、杭州、311300、浙江省、中国

Xiaolong Li & Xuepeng Sun

亜熱帯果物と野菜の品質と安全管理の主要研究所、農業農村省、杭州、311300、浙江省、中国

Xiaolong Li & Xuepeng Sun

ノボジーン バイオインフォマティクス研究所、100083、北京、中国

ハイリン・ジー

ボイス・トンプソン研究所、コーネル大学、イサカ、ニューヨーク州、14853、米国

ジャンジュン・フェイ

米国農務省-農業研究サービス、ロバート W. ホーリー農業健康センター、イサカ、ニューヨーク州、14853、米国

ジャンジュン・フェイ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

JW、XS、HL、LS がこのプロジェクトを考案し、監督しました。 WC、YG、SZ はサンプルを収集し、トランスジェニック実験を実施しました。 XS、XL、HZ はライブラリを構築し、バイオインフォマティクス解析を実行しました。 XSとHLが原稿を書きました。 ZF と JW は原稿を修正しました。

Zhangjun Fei、Xuepeng Sun、Jiasheng Wu との通信。

著者らは競合する利害関係を宣言していません。

Nature Communications は、この研究の査読に貢献してくれた Amanda De La Torre、Liang Guo、Nathaniel Street、Haifeng Wang に感謝します。 査読者レポートが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

ルー、H.、ソング、L.、リー、X. 他トレヤ グランディスのゲノムは、裸子植物に特有のシアドン酸生合成の起源と進化を解明します。 Nat Commun 14、1315 (2023)。 https://doi.org/10.1038/s41467-023-37038-2

引用をダウンロード

受信日: 2022 年 10 月 28 日

受理日: 2023 年 2 月 28 日

公開日: 2023 年 3 月 10 日

DOI: https://doi.org/10.1038/s41467-023-37038-2

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。