实验设计的目的是以较小的工作量和成本高效地获得充足的数据,从中得出科学和统计学意义上有效的结论。了解实验目标、过程以及实验变异性的大小和来源对于设计成功的 siRNA 实验而言均十分重要。本文将描述不同的变异来源以及如何确定您所进行的实验的理想重复样本数量。
在技术资料 14.3 中,我们解释了准确度和精度是实验变异性的组成部分,但彼此之间不相关 [2]。对于 siRNA 实验,科学家通常会运行重复样本以帮助确定准确度和精度。其定义请参见边栏
准确度与精度。重复样本有两种类型:
生物学重复样本是经过相同处理的不同生物样本。示例包括采用同一方案处理的动物、组织、部分器官或细胞培养板孔。
技术重复样本是来自同一来源的多份等份试液,在整个过程中独立运行。
技术重复样本可说明过程的变异性。生物学重复样本可说明群体的变异性,但也受过程变异性的影响。
实验目标是所需重复样本数量和类型的首要决定因素。可以提出的问题包括:
- 这是一项研究检测、筛选检测还是释放检测?
- 该程序将多次运行还是很少运行?
- 已完成多少验证?
收集数据的原因决定了所需数据的质量。额外的技术重复样本将提供关于过程变异性的信息,但不提供关于群体变异性的更多信息。如果样本群体未知或变异性较大,则需要更多生物学重复样本。对于变异性较大的过程或经验不太丰富的技术员而言,增加技术重复样本可能十分重要。多级过程可能需要不同类型的技术重复样本。
例如,siRNA 程序涉及 96 孔板内细胞培养物的转染、细胞裂解和 RNA 分离、cDNA 合成以及最终 RT-PCR 检测以测量特定基因的沉默。生物学重复样本来自 96 孔板的不同孔中相同 siRNA 的转染。技术重复样本可以在 RNA 分离阶段、cDNA 生成阶段或 RT-PCR 程序中获得。在该过程中添加技术重复样本的时间越早,增加的工作量越多、对样本处理量的影响越大、实验成本越高。限制重复样本数量的一种方法是仅在该过程中变异性较大的步骤中添加技术重复样本。对于大多数生物检测,较大的变异性来自样本群体,生物学重复样本的数量通常是较大且较重要的因素。
图 1.4 个代表性群体。群体 A 和 B 的系统和群体变异性较小,样本平均值之间的倍数差异较大。与群体 A 和 B 相比,群体 C 和 D 的数据在平均值周围的分散程度较大,平均值之间的倍数差异较小。
平均值之间的倍数变化越大,所需的生物学重复样本越少。群体变异性越分散,所需的生物学重复样本越多。图 2 根据实验精度和预期生物学差异,给出了所需样本数量的估计值。以下是两个理论示例:
对于图 1 中所述的群体,大约 3 份重复样本即足以检查群体 A 和 B,而需要 7 至 18 份重复样本才能检查群体 C 和 D。
当靶向同一 mRNA 的两个 siRNA 得到的基因表达敲低与基线相差 10 倍且实验变异较低(例如,25%)时,仅需要 3 份生物学重复样本即可获得可靠数字来检测表达的变化。相比之下,如果基因表达敲低与基线仅相差 1.5 倍且实验变异较高(例如,75%),则需要 38 份生物学重复样本来检测表达的变化。
图 2.估计要使用的生物学重复样本的数量。倍数差异是您想要区分的两个群体的平均值之间的差异,实验变异是标准差/平均值 X 100 (%CV)。这些数字基于单侧 t 检验得出,该检验将 α 在正方向上的所有区域关联起来。CV = 变异系数。
在无实验精度或群体变异历史的情况下,应运行至少三份生物学重复样本加两份或三份技术重复样本。随着群体变异性和实验过程的精度变得更加明确,可调整技术和生物学重复样本的数量,以达到所需的数据质量。
了解实验的目的和程序的能力有助于以更低的成本获得更准确的结果。这样做可以使科学家能够更好地确定如何平衡生物学或技术重复样本的数量与增加任一类型重复样本的成本。同时也可提升对数据准确度的信心,并且可确定影响检测精度的因素。
科学参与人员
Ann Hartman • Applied Biosystems, Austin, TX
John Pfeifer • Applied Biosystems, Houston, TX