2、结果表明了水稻品种之间香味的关系,并对认为水稻香味特点起源于籼稻的传统假说提出了挑战。最近的研究表明,亚洲栽培稻(Oryzasativa)是几个不同的遗传组组成,在这些遗传组中,一些等位基因对关键驯化和粮食品质性状负责。由于复杂的水稻进化史,这些基因变异的起源是怎么样通过高度不同的水稻亚种生存下来,在水稻生物进化中任然是个核心问题。香味被认为是最重要的粮食稻米品质性状之一,因为它是决定市场价格的关键因素,同样关系到地方和国家的地位(1,2)。对水稻香味基因的遗传基础进行调查研究,发现了水稻8号染色体上的一个单一位点与水稻香味有关(3、4)。精细定位(5-7)和随后的序列分析鉴定
3、甜菜碱醛脱氢酶基因,BADH2与香味表型有关命名如下(8)。把功能基因的突变创建隐性badh2.1等位基因描述为在第七外显子基因处三个核苷酸多态性(SNP9和8-bp的缺失,导致了密码子的提前终止以及假定存在缩短的BADH2S白(9)。其他序列比对已被用来描述这种复杂的突变(10,11)。因此,badh2.1突变被称为功能核苷酸多态性(FNP)。最近的调查各种不同的香味种质,支持badh2.1与香味有关(10,12,13),一个有关香味与非香味主要基因的转变实验,已经显示消除了香味(14),确认BADH在水稻种是主要香味遗传决定基因。在香米品种中,100多种容易挥发的物质已经
4、被检测到,2-乙酰-1-吡咯啉(2AF)(15,16)是最主要的化合物对香米品质其主要作用。这种化合物在水稻植物除根以外的所有器官中产生,含量非常低,人们能够立即在密集种植或者碎叶组织中发现,以及在蒸煮过程或者以后或之前的谷物中发现(17)。然而2AP的化学合成途径还没有成功,BADH催化r-氨基丁醛的氧化(AB-ald;a2AP的前身),于是非功能等位基因在AB-ald和其循环物中吡咯啉积累,导致2AP的合成的增强。中国自古已经认识到(19,20)亚洲栽培稻(O.sativa)分为两个主要品种群体,籼稻和粳稻(谈到品种组时用大写)。用15种同工酶标记能够进一步的把这
5、两个主要群体分为遗传上的六个不同的亚群,这和公认生态型是一致的(21).随后用SSRs(22)andSNPs(23)标记分辨出了和上面的群体差不多5种分界线清楚的遗传群组:即籼稻,澳大利亚稻,温带粳稻,热带粳稻和芳香稻(提到亚群时小写)(图1)。系统进化分析法和Fst显示构成粳稻品种群的芳香稻,温带粳稻和热带粳亚群之间有密切的进化关系;然而籼稻,澳大利亚稻亚群具有不同的祖先,并作为籼稻品种组成员(22,23)。尽管它的名字怎么样,芳香亚群的表型多样,既包括香型也包括非香味型。为了避免混淆,从今以后我们将用其同工酶的名字命名芳香亚群,简称V组(24)。水稻香料新品种已经确定至少包
7、研究这个等位基因的起源和探究它的祖先。我们同样也把BADH中主要负责独立遗传,香味基因定位的基因的额外功能突变作为研究对象。结论badh2.1等位基因在不同的水稻种质资源中出现的概率。我们曾在280种野生稻(普通野生稻)中观察badh2.1等位基因的出现频率,发现它不在所有野生基因型中,除了一个单一位点杂合的等位基因外(表1)。这种野生插入位点显示了驯化水稻的几个特征,包括白色果皮,表明这是栽培稻香味品种和野生稻近交的结果。共收集调查了176种不同的栽培稻种类,这些栽培稻的不同亚种的身份发现是通过一套全基因组SSR和SNP分子标记确定的(22,23)。总之,badh2.1等位基因
8、在这些种类中被检测到17次(10%),香味基因在v组中出现的频率最大,在温带稻和澳大利亚稻中出现的频率最小(表1)badh2.1等位基因的起源。考虑到在籼稻还是在粳稻品种群体中检测相同badh2.1等位基因,我们的目标是检测badh2.1等位基因起源于哪个种类。为了解决这个问题,我们检测了一个包含242个水稻品种的的BADH淫基因,包含起源组和拥有BADH基因的额外加入组(表si)。在5kb的对齐基因系列中,我们发现106个SNP标记的系列插入缺失和SSR多态性,其中54个已经显示出频率大于5%.。这些多态性被用于构建8个基因单体型(GH,以及这些单体基因型被明确的分成两个不同的小
9、组(图2a,表s2)。在第一组中,粳稻品种组Jap_GH)的所有品种都携带了野生类型的等位基因,然而绝大多数(74%的种类在第二组中都是来自于籼稻。尽管亚种的种类不同,每一个插入系列都在Jap_GH检测到了badh2.1基因,在Jap_GH中,香味种类基因仅仅在编码badh2.1等位基因的FNP中和原始非香味基因不同(在图2a中用黄色显示的部分)。这些数据支持badh2.1等位基因在像粳稻型遗传背景的品种中有单一的起源。来自籼稻品种组携带有badh2.1等位基因的的所有香稻品种与Jap-GH形成集群,形成一个这些品种基因和基因组表型系统之间明显的矛盾。如果籼稻品种能检测到具有
10、籼稻遗传背景环绕BADH2基因一样的粳稻DNA特定区域,这种不一致就能够得到很好的理解。然后,在我们这个242个亚洲栽培稻品种的BADH基因的跨度上游3.2MB和下游2.1MB的基因组区域扩增24个位点系列,用以扩宽我们对单基因表型的分析。在这个BADH侧翼的5.3MB的范围内,总的有426个SNP标记的插入缺失,在一致的13KB区域内确定了SSR标记的多态性。其中271个多态性的出现率大于5%从这些数据中,78个多态原始信息(AIPs)被找到并且用于扩增单体型(见方法和材料,表S3)。这些扩增单体型被称为单体扩增一致系列显示出六类大的单体型(图2b)o这些扩增的单体型和基因单
11、体型是一致的,所以含有badh2.1基因插入系列都有BADH基因周围粳稻的DNAT增区域。在籼稻品种中有24个携带等位基因badh2.1,粳稻区域被上游650KB和下游330KB的关键重组位点被扩展,其侧翼区和籼稻的原始扩展单基因表型是一致的(图2B)o这支持了badh2.1等位基因是经过基因渗入籼稻种类的假说。第v组种类携带badh2.1等位基因扩展单倍型和原始粳稻品种一样,含有一个扩展的单基因型,除了FNP和在14、30、69三个位点上的三个特殊多态型(图2B中绿色标注部分)。这三个FNP则翼的多态位点以及像粳稻品种那样的区域,都被检测到在所有的籼稻插入位点携带badh
12、2.1等位基因。来自缅甸单一野生型种类基因badh2.1在后代是1:2:1的杂合表型,并且单基因表型分析确认了携带有badh2.1等位基因的染色体同样含有上述V组的三个多态型。因此,我们能够在野生型杂合品种上追踪badh2.1等位基因的祖先和所有籼稻香味品种来自v组的原始类型。有几个非香味粳稻品种和Ind_GH集群形成团体,这些是由籼稻非香味品种构成(图2A)。这些来自粳稻的非香味品种包含了像籼稻基因组一样包围BADH2基因的区域,并且所有显示重组都回到粳稻原始类型的侧翼区(图2B,粳稻重组)。这为一定数目的包含了BADH2基因的粳稻品种和lnd_GH形成的集群提供了很好的
13、解释。在badh2.1等位基因上,核酸多样性的减少和连锁不平衡的提高。为检查围绕badh2.1基因的选择证据,我们分析了这个242个品种的BADH基因的核苷酸多样性。我们对比携带野生型基因和bdha2.1等位基因的5kb插入系列之间的BADH基因的排列系列的核酸多样性。携带香味基因的badh2.1等位基因和非香味基因品种相比,在多样性方面平均降低了97.4%(表2)。扩展单倍型纯合子(EHH评估了这个可能性:两个随机选择的基因组区域的遗传是相同的,允许功能突变导致遗传距离的增加的连锁不平衡(LD)衰变测量法(25)。在我们的种子资源组,通过比较香味基因(badh2.1)和非香味
15、个品种中的26个系列比对显示8个非同义替换的多态型,其中4个移码诱导缺失多态和其中一个是SNP形成提前终止密码子,所有这些在缩短了的BADH蛋白质中都是公认了的(图4A,表s4)。其他三个潜在功能多态性,包括3-bp的插入,编码区两个不同SNPs.虽然其中的几个多态性仅仅在一个单一插入位点发现并确认,在香味基因插入位点找到4个,这些多态性看上去有某些地理学上的联系(图4B)。迄今为止,我们还不能确定两个插入位点候选功能突变能够为2AP的水平提高做出解释。讨论水稻香味基因的起源。从来自亚洲各地不同的水稻种质资源大范围的遗传和地理上,这项研究展现了BADH基因多样性的深
16、度研究。携带badh2.1等位基因的香味插入基因和非香味基因插入系列相比,显示出核酸多样性的急剧减少以及连锁不平衡的提升,这和badh2.1等位基因强阳性选择是一致的。badh2.1等位基因选择强度和这个报道水稻基因控制谷物多态性特点的报道的相似(如wx,rc,gs3)(26-28)。单体型分析,使我们能够证明badh2.1等位基因在粳稻品种群体遗传背景产生。扩展单体型分析显示粳稻基因组区域的明确基因渗入,在所有籼稻香味基因插入系列中够包含badh2.1等位基因,包括茉莉花品种。所有香籼稻同样拥有被确定为v组亚群的badh2.1等位基因侧翼的三个多态型,表明这些重要的谷物性状
17、等位基因起源于v组亚群(即Basmati巴斯马蒂)并被渗入籼稻品种(即Jasmine,茉莉花)。在69位点多态性的起源以及香味插入V组都是原始的和固定的,所有热带粳稻插入位点都携带badh2.1等位基因。这些表明:(1)badh2.1等位基因可能来自v组和热带粳稻的后代,第五组的两个特定基因多态性(14和30位点,图2B)来自第五组后代的分离,并且基因组区域含有badh2.1等位基因和下游多态位点(69)可能是从v组渗入到热带粳稻中。相同的序列延伸区域两侧BADH基因在V组和热带粳稻插入之间阻止了断点检测重组,这将定义一个从v组到热带粳稻的渗入体系(反之亦然)。从本研究的证据表
18、明,亚洲栽培稻从原始祖先引种驯化后,badh2.1等位基因被选定为一个从头突变,也许粳稻亚群以后的分化会引起等位基因频繁出现在v组以及温带粳稻上难以发现的低频率。在我们收集的280不同的插入系列的来自亚洲的澳普通野生稻/澳野生稻,我们发现仅仅一个来自缅甸的单一位点在badh2.1等位基因是杂合的。这些插入位点的系列分析显示,在v组香味基因品种染色体携带badh2.1等位基因在籼稻DNA序列边缘包含3个显著多态性固定位点。然而badh2.1等位基因被确定在其他来自东南亚的水稻种质中(29-31),很可能这些有代表性的原始等位基因渗入野生品种中并且在栽培稻的附近微弱的生长。等位基因从亚洲
19、栽培稻侵入野生品种已经多次报道和现在认为是一个普遍存在的现象(32.33)。这项研究改进了我们对亚洲栽培稻种类之间基因组联系的理解和进一步明确亚洲栽培稻的进化历程。来自v组的巴斯马蒂品种经常被错误的认为是籼稻品种的一个成员(34-36)。然而来自籼稻和v组的品种广泛的种植在亚洲南部和中部,并有可能延长,其形态是细长谷物粒,研究人员早就注意了这两个品种之间高度的杂种不育现象(37-40)。Glaszmann通过同工酶标记显示为杂交不亲合和提出了一个假说,V组和其他籼稻品种是明显不同的,分组和粳稻品种更接近(21.24)。亚洲栽培稻的基因多样性附加检测是使用叶绿体标记,核酸SSRsf
20、fiSNPs独立决定,V组亚群是一个和粳稻品种关系很近的独特的遗传实体(22,23,41)。我们对这项研究的单体型分析表明V组品种,香型和非香型,和原始粳稻插入系列形成集群,两者都跨度整个BADH基因和8号染色体5.3MB的被研究区域。尽管它的形态相似和地理分布与籼稻重叠,在基因上是粳稻种类的一个成员,这为V组提供了进一步的证据。有趣的是,在南亚V组和籼稻品种的重叠分布区域可能为主要的香味基因进入籼稻品种提供了一个通道。香味水稻的独立起源。水稻品种显示的是提高了2AP的位置,但是缺少任何已知的BADH2勺非功能等位基因,为BADH上的额外香味等位基因的存在提供了可能性(12)。对
21、26个缺少香味品种的分析,在预计改变BADH2蛋白的编码区域找到了8个多态性。就像前面所述,只有全长的BADH2样本,才能产生完整的503-aa蛋白质,能够抑制2AP的生产功能(140).在这个研究中确定的8个多态位点的4个(等位基因badh2.3-2.6),被推测为引起转录提前终止,这将推定去除蛋白质功能和导致香味基因的不复存在。这些所有突变导致BADH2蛋白质在形成催化和/或者底物结合区域的关键残基之前缩短(14)。此外,badh2.7等位基因,被6个澳大利亚品种共有,同样被推测为消除蛋白质聚集区域复制体的缩短。其他3个位点(2.8-2.10),是额外的氨基酸位点(
22、2.8)或氨基酸替代位点(2.9-2.10)。尽管这些香味基因和BADH基因突变位点的联系,进一步的工作是确定这些突变对AP积累程度的影响。BADH等位基因上品种之间携带相同等位基因突变点的地理连系表明香味基因的选择在不同的地理区域、多种情况下是独立的。有趣的是,我们现在发现对高2AP生产率负责的主要等位基因,在水稻是来自于粳稻不同种类,这看起来好像其他的香味基因是来自于其他的籼稻种类一样,比如badh2.7等位基因,他是在几个澳大利亚品种中找到的。这些以及其他的结果表明,V组和澳大利亚系列拥有有用的在水稻改良方面未得到充分利用的等位基因(22,27,47,48)。26
25、水稻亚群之间转移,在早期栽培稻高异原杂交率和物理距离的不同的栽培稻之间得到简化,结果是人口的膨胀和人类的迁徙(42,44-46)。值得注意的是,尽管明显的重要性杂交和基因间的移动,反力量还是维持了不同亚洲种之间的遗传分歧。解决这一悖论,需要对亚群隔离的催成关键因素作进一步的研究,同样更进一步对不同组之间的遗传交换动力学的研究提供方法。材料和方法植物材料。我们的种质库又280种澳普通野生稻和来自38个国家的242中亚洲栽培稻组成。我们同样从先前的研究中获得了26个缺少badh2.1等位基因香味品种(12)。在表S1中是这个研究中用到的插入系列的全部名单。所有未经报到过的亚洲
26、栽培稻都是用SSRs标记检测从而确定他们的亚群。DNA提取,PCR和测序。DNA提取是利用醋酸甲-SDS处理叶组织和处理精种子。badh2.1的标记功能是用种质基因遗传型。对于基因单体型分析,8个位点约700bp的扩增物测序是BADH2基因的编码区域,形成5kb的排列系列。延长单体型分析,24个地区进行测序,跨度BADH2基因上游3.2MB和下游2.1MB范围,形成超过13kb的排列系列。先前描述MITE多态性在在栽培稻同样是遗传的。表5是32个引物序列的全部。康奈尔大学生命科学中心的核心实验室PCR产物是在ABIPrism3700/3100DNA分析仪上纯化和测序的。序
27、列排序是用CodonCode定位仪,末端扩增产物被调整以除去低质量序列。单独和不确定序列在必要的情况下被重新测序。在缺少任何已知的非功能等位基因的BADH插入位点中找到非同义多态,为确定这些他们被重新测序很多次。2AP表型。用改进的方法二氯甲烷萃取2AP(52).化学合成2AP是由日本Dr.T.Yoshihashi提供的(日本茨城,日本国际研究中心的农业科学)以及用来量化2AP样品。每个样品抽提和分析是在六个不同的场合以及至少三个复制的情况下进行。BADH区的单体型和遗传多样性分析。在242个亚洲栽培稻插入位点BADH基因编码区域的八个扩增产物排序被导入TASSEL序提取所有多态
28、型,频率在5%以上,在构建的单体型基因样本中(表si).在20249280位点的高度多态性SSR既没有延长也没有缩短(TA11-14)(TA6-8),这和粳稻品种和籼稻品种分别是一致的,如果等位基因比8个重复序列多则标记“1”少于这标记“0”总的8个基因单体型是从238个品种推导出的,其中4个重组单基因型没有包含在图2A中。Bayesian集群结构被用来分析单基因型和在2个集群中得到的最高的可能性,用于标记粳稻单基因型集群Jap_GH)和籼稻单基因集群(Ind_GH)对于扩展单体型分析,我们在242个亚洲栽培稻中的BADH2基因侧翼测定了24区域,如上所述(表S5)。
29、TASSEI被用来提取5%以上抽样本216多态性的频率。为了减少单倍型数,我们采用了以下标准选择AlPs:粳稻品种和籼稻品种之间必须具有显著的差异(P<0.00003),在这个品种中出现频率高于20%来自16个扩展序列的78个多态型中,FNPMITE多态性达到这个标准,见图2B、和表S3中。用前述的方法(25),242个亚洲栽培稻的BADH2侧翼的24个位点区域的多态性数据被用来计算EHH图1:亚洲栽培稻亚群结构。来自169个核SSRS标记的无根连接树。枝条颜色代表叶绿体单基因表型。自助值(共100个)是表示在分支点,这树清楚地说明了品种群之间的两个主要分支(籼
30、稻和粳稻),这进一步细分为5个水稻亚群:籼稻,澳大利亚,热带粳稻,粳稻温带和V组(芳香)。经许可复制和修改。图2:BADH地区单倍型基因分析。(A)BADH基因单体型。序列读取242个亚洲栽培稻的整个BADH2基因,所有多态性(频率>5%)为串联,用于创建8个基因的单倍型。每个单倍型字母都代表SNP位点的核苷酸选择性。数字表明了一个删除的大小(0为没有删除),每个多态性的相对位置表示沿BADH基因模型,表型的单体型的编号1至8和香味型是对应的以及来自拥有单体型的亚群的插入数。两个基因单体型集群确定:粳稻基因单体型的群集(Jap_GH)和籼稻基因单体型集群(Ind_GH).。蓝细胞代表Jap_GH多态性特点,红色代表lnd_GH细胞的特性。badh2.1FNP描绘灰色/黄色,黄色代表香味等位基因。(B)扩展单倍型。共延长了17种单倍型为BADH26个一致单体型被每个显示表型描述。字母或数字以及颜色所指都和A图一样有(以下是简略缺失:1x_28,1y_12,1z_48)。间断着色表明重组在哪里被发现。第51位,标有星号,代表前面所述的MITE多态位点(10).badh2.1FNP在第52位用深黄色标记出来,“+“是指香味起源基因,“一”指野生型基