您现在的位置是：首页 > 工具

当前栏目

数学建模（6）-DNA限制性图谱的绘制

建模绘制数学图谱 dna

2023-09-27 14:28:42 时间

?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /

DNA限制性图谱的绘制

绘制DNA限制性图谱是遗传生物学中的重要问题。由于DNA分子很长，目前的实验技术无法对其进行直接测量，所以生物学家们需要把DNA分子切开，一段一段的来测量。在切开的过程中，DNA片段在原先DNA分子上的排列顺序丢失了，如何找回这些片段的排列顺序是一个关键问题。

为了构造一张限制性图谱，生物学家用不同的生化技术获得关于图谱的间接的信息，然后采用组合方法用这些数据重构图谱。一种方法是用限制性酶来消化DNA分子。这些酶在限制性位点把DNA链切开，每种酶对应的限制性位点不一样。对于每一种酶，每个DNA分子可能有多个限制性位点，此时可以按照需要来选择切开某几个位点（不一定连续）。DNA分子被切开后，得到的每个片段的长度就是重构这些片段的原始顺序的基本信息。在多种获取这种信息的实验方法中，有一种广泛采用的方法：部分消化（the partial digest, PDP）方法。

在PDP中，采用一种酶，通过实验得到任意两个限制性位点之间片段的长度。假设与使用的酶对应的限制性位点有n个，通过大量实验，可得到n+2个点（n个位点加上两个端点）中任意两点之间的距离，共 ?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" / 个值。然后用这个距离来重构n个限制性位点的位置(解不一定唯一，两个端点对应于最长的距离)。若是线段上的点集中所有点之间距离的集合，PDP就是给定求。下图给出了一个例子。

???????? 2??????? 3?????????? 4???????????? 5???? ???????2

???????

?A?????? a????????? b??????????? c?????????????? d?????? B

图1.?? A,B是DNA分子的两个端点。 a，b，c和d是限制性位点。? 通过实验可以得到 ={2,3,4,5,2,5,9,14,16,7,12,14,9,11,7}. 再通过来求，对应于上图的={0,2,5,9,14,16}是一种解。

上述方法要把DNA分子在任意的两个限制性位点处切开，这对于当前的实验技术来说有相当难度，而且，还要对实验数据进行处理，也很复杂。最近研究人员提出了一种新的方法，称为简化的部分消化方法（SPDP）。这个方法与PDP的不同就在于它避免了在任意两个位点切开DNA分子的难题和处理重复数据的困难。仍假设与使用的酶对应的限制性位点有n个。首先DNA分子被复制成n+1份，前n个复制品中的每一个在一个限制性位点处被切开，最后一个复制品在所有的限制性位点处被切开。这样我们分别得到2n个片段长度（称为第一组数据）和n+1个片段长度（称为第二组数据）。在没有误差的前提下，第一组数据中2n个长度可以分成n对，每对的和都等于DNA分子的总长度；第二组数据中n+1个长度的和也等于DNA分子的总长度。 SPDP问题是如何利用这两组数据重构出这n+1个片段在DNA分子上的排列，使得这个排列在n个位点切开后得到的2n个片段长度与实验得到的2n个长度相等。下图给出了一个例子。

?(a)

2?????? 6???????? 1?????? 4?????? 3

(b)

?????????? 2?????????????????? 14

???????????????? 8????????????????? 8

???????????????? 9??????????????????? 7

???????????????????? 13??????????????????? 3

?????????

2???? 1???????? 4?????????? 3????????????? 6

图2.? 这个例子对应的位点有4个。(a) 就是我们希望重构的顺序。 (b)中的前4对为第一组数据，它通过切开一个位点得到，每对长度的和都是16，剩下的为第二组数据，含5个片段长度，它通过切开所有位点得到，它们的长度总和也是16，但实验结果只告知每段的长度，不知道它们在DNA分子上的排列顺序。

现对上述SPDP问题，建立数学模型，并研究以下问题：

（1）???? 设计求解该问题的算法，并评估该算法的效率和效果。对下述2个实例给出答案：

实例1：第一组数据：2，14，8，8，9，7，13，3

第二组数据：2，1，4，3，6

实例2:? 第一组数据：1，14，12，3，7，8，9，6，11，4，12，3，13，2，5，10

第二组数据：1，1，2，1，2，2，1，2，3

（2）??? 讨论在实验中测量片段长度时的误差，将在多大程度上影响算法的效果，当误差到多大程度时，限制性图谱的重构将无法进行。

史上最全 | 基于深度学习的3D分割综述（RGB-D/点云/体素/多目）（下） 3D目标分割是计算机视觉中的一个基本且具有挑战性的问题，在自动驾驶、机器人、增强现实和医学图像分析等领域有着广泛的应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统上，3D分割是用人工设计的特征和工程方法进行的，这些方法精度较差，也无法推广到大规模数据上。在2D计算机视觉巨大成功的推动下，深度学习技术最近也成为3D分割任务的首选。近年来已涌现出大量相关工作，并且已经在不同的基准数据集上进行了评估。本文全面调研了基于深度学习的3D分割的最新进展，涵盖了150多篇论文。论文总结了最常用的范式，讨论了它们的优缺点，并分析了这些分割方法的对比结果。并在此基础上，提出了未来的研究方向。
史上最全 | 基于深度学习的3D分割综述（RGB-D/点云/体素/多目）（上） 3D目标分割是计算机视觉中的一个基本且具有挑战性的问题，在自动驾驶、机器人、增强现实和医学图像分析等领域有着广泛的应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统上，3D分割是用人工设计的特征和工程方法进行的，这些方法精度较差，也无法推广到大规模数据上。在2D计算机视觉巨大成功的推动下，深度学习技术最近也成为3D分割任务的首选。近年来已涌现出大量相关工作，并且已经在不同的基准数据集上进行了评估。本文全面调研了基于深度学习的3D分割的最新进展，涵盖了150多篇论文。论文总结了最常用的范式，讨论了它们的优缺点，并分析了这些分割方法的对比结果。并在此基础上，提出了未来的研究方向。
全都会！预测蛋白质标注！创建讲义！解释数学公式！最懂科学的智能NLP模型Galactica尝鲜 ⛵ 本文浅试Meta开源的大型AI语言模型『Galactica』，带大家体验安装与多场景使用。Galactica被称为“最懂科学的智能NLP模型”，能够预测蛋白质标注！创建讲义！解释数学公式！全都会！

猜你喜欢

78种“我爱你”的说法
我的Android进阶之旅------>如何在多个LinearLayout中添加分隔线
压力测试指标判定
内存分配管理之Largeobjectspace
proteus仿真AT89C51单片机测试试验[无须keil]（1）
高效C++规划
【Shell】常用
oracle_序列、索引、同义词
[LeetCode] 212. Word Search II 词语搜索 II
C++——多维数组动态开辟与释放
Mysql高可用架构
jquery添加元素

相关主题

5G信道建模
背景建模
建模
数仓建模—数据域
研究生数学建模
数学建模笔记
数学建模
数据仓库建模
UML建模
数学建模学习

zl程序教程

当前栏目

数学建模（6）-DNA限制性图谱的绘制

相关文章