将几何形态计量学改造成一种变换网格的方法

   日期:2024-08-23     来源:本站    作者:admin    浏览:164    

  今天,几何形态计量学在组织解剖学定量比较中的典型应用,首先是对同源标记点配置的样本进行标准化,以确定位置、方向和规模,然后通过薄板样条将随后的比较以图形形式呈现,应用于群体平均值、主成分、回归预测或典型变量。尺度标准化的步骤最近受到了批评,认为没有必要,而且确实不合适,至少对生长研究来说是这样。本文主张对定心和旋转进行类似的重新思考,然后用一种不同的策略取代薄板样条插值的结果配置,在每个地标上单独留下无法解释的残量,以简化对整体显示网格的解释,“转换网格”自达西·汤普森1917年著名的阐述以来一直被强调为真正的潜在主题。对于涉及大几何尺度梯度的比较分析,本文主张用我1986年的两点注册(原高尔顿的1907年(Nature 76:617-618, 1907))的一个版本来取代所有三个Procrustes惯例。这两个点的选择与另一个非procrustes问题相互作用,即根据拟合的多项式趋势而不是插值薄板样条变形的坐标系的网格线的可解释性。该论文使用了先前发表的中矢状面颅骨数据的两个例子;由此产生了与这两个经典数据集的解释相关的新发现。最后的讨论表明,目前的几何形态计量学的工具箱,集中在Procrustes形状坐标和薄板样条上,太局限了,不能适应进化和发育生物学的许多解释目的。

  图1是使用几何形态计量学(geometric morphometics, GMM)工具随意绘制的。数据集包括熟悉的“维尔曼八边形”,这些八边形是在20世纪60年代由丹麦解剖学家亨宁·维尔曼(Henning Vilmann)在7至150天的8岁时拍摄的,并在几年后由纽约颅面生物学家梅尔文·莫斯(Melvin Moss)数字化。这个版本的数据是我在2018年的教科书中探索的:18只动物的子集,在所有8个年龄段都有完整的数据(所有8个地标)。图1关注的是7岁和150岁动物的procrustes平均形状的对比(只有平均值,不考虑协方差)。粗线代表年龄为150岁的数据子集;这些浅色线条,是动物7天大时的数据(本文偶尔会将这种配置称为“模板”)。图形的所有面板通过连接这些坐标对的所有或某些线段使通常的形状坐标对的Procrustes图复杂化。在图的左栏中,绘制了所有的地标间段;在右列中,只有引起您注意这个图的原因的子集。在最上面一行中,这些平均位置对应于通常的procrustes注册的形状坐标,只划分出中心、大小和旋转。小组(b)仅限于小组(a)中28个地标间段中的9个,根据该注册,在7岁至150天之间,这些地标间段向任何方向旋转至少8.6。(图形标签将其表示为“0.15弧度”-1弧度是数学家的自然角度度量,即圆弧的范围等于圆的半径的角度。)一个漂亮的图形,但它的特点是太多的信号叠加,不足以作为一个清晰的模式分析。

  图1

  figure 1

  在经过大量分析的实验室大鼠神经颅八边形的维尔曼数据集中出现了意想不到的模式。(左上)地标间段的饱和网络,7天(浅线)和150天(粗线)时八边形的Procrustes平均形状。标志:basion, Opi opisthion, IPP壁间点,Lam lambda, Brg bregma, SES spheno?thmoid软骨联合症,ISS蝶间软骨联合症,SOS spheno?ccipital软骨联合症。(右上)在此年龄比较中旋转至少0.15 rad()的分段的子网络。(左下)相同的非仿射分量的饱和网络,只有相同的Procrustes形状坐标,具有地标数字。(右下)现在,这个形状坐标空间的均匀分量已经被分割出来了,出现了一个相当简单的子网络,明确地显示了最前面的三个地标相对于其他五个地标的相对旋转

  大多数杂波是由于长宽比(高宽比,在左列中很明显)的实质性变化,它旋转了模板的两个较长的对角线(Basion到Bregma, Lambda到SES),相对于该变化的明显主轴(垂直和水平,在此配准中)。但这不是这里的问题,在这里,明显的节段旋转与节段方向无关,而显然主要是位置的函数。因此,我们想要调整图形显示,以消除这种特定的已知效果的影响,即长宽比的变化,以便更好地关注我们在图1b中检测到的生物体两端之间的相对旋转。幸运的是,我们已经知道如何从我们的比较中去除这种不必要的相对垂直压缩的均匀性:求助于Procrustes形状空间的“非均匀”分量,补充均匀变换的子空间(将所有矩形变为平行四边形的那些)。生成的图是最下面一行中的一对。

  毫不奇怪,左下角的图表,图(c),看起来比图(a)更杂乱,因为现在颅顶,而不仅仅是颅底,在不同的年龄之间重叠。但是,一旦对图表进行编辑以抑制所有不太旋转的部分,也会出现一个新的信号,这个信号似乎在之前发表的对这些数据的分析中没有预料到。如图(d)所示,在对年轻人与老年人的统一比较进行标准化后,28个可能的部分中有6个旋转超过0.15弧度。现在这个模式很明显了。连接左边五个地标的四个节段(解剖后,SOS周围到Lam)在生长过程中顺时针旋转(在这个投影中),而右边的三个节段,位于解剖前,逆时针旋转,所有这些都是纵向排列(想想五个集合的质心,而不是最前面的三个质心),这两个方向都不旋转。本文将分割多边形SOS-Bas-Opi-IPP-Lam(图1d左侧的5个地标集合)称为“后五边形”,将其余3个地标(Brg-SES-ISS)称为“前三角形”。

  图2

  figure 2

  对于每一个可能的基线,7岁和150岁的Vilmann平均八边形的两点叠加(Bookstein坐标)。地标编号如图1所示。圈出的地标:基线的两端,记录为(0,0)和(1,0)。淡线,7岁平均值;粗纹,平均年龄150岁

  图3

  figure 3

  改编自Bookstein(1991,图7.3.6)

  通过不同方向的正方形(上)的薄板样条(下一行)进行不同转换的对比形态测量效果图。正方形到平行四边形,网格与正方形的边缘对齐。b同样的,网格现在与正方形的对角线对齐。c正方形到梯形。d几乎一样,网格旋转:正方形到风筝。

  面板(d)中旋转的反对意见与使用段间长度比的替代算法的报告一致。从ISS到SOS,相对于颅底中央段,上颅前后长度(Lam至Brg)明显缩短。没有必要把这个发现限定为“相对于均匀项的隔离”,因为均匀变换不会改变同一方向上的距离比率,无论是共线还是平行。

  这种相对旋转,包括垂直排列的水平生长速度的对比,中央颅底和它上面的颅顶,肯定是143天形状变化的一个特征。但是在GMM工具箱中哪里可以找到它呢?图2从GMM之前80多年的定量风格中恢复了完全相同的报告,通过弗朗西斯·高尔顿(Francis Galton)在1907年为“肖像分类”引入的坐标进行分析。我在这里绘制了这些八边形的每一个可能的两点配准图(仅通过Moss最初将其数字化时的平均坐标来量化)。对于每个备选基线,原始的笛卡尔坐标平均配置被重新定位、旋转和重新缩放,使第一个基线点位于新坐标系的(0,0),第二个基线点位于同一坐标系的(1,0)(图中每个面板中圈出的两个点)。因此,我们改变了普洛克斯特工具箱的每一个步骤——定心、旋转、缩放——同时避免了任何求助于薄板样条来分离均匀项的方法。然而有十幅画清楚地显示了同样的现象,解剖意义上的后五边形地标和前三角之间的相对旋转。每当基线的两端位于同一扇区(此处编号为[8,1,2,3,4],而不是[5,6,7])时,互补扇区的旋转行为是明确的。在对基线5 - 6(第4行第5列)、5 - 7(第4行第6列)或3 - 4(第3行第2列)的分析中,这一点尤为明显,在这些分析中,无论纵横比的整体变化如何,与基线相对的八边形的边界似乎都因相对于基线的旋转而发生了根本的移动。在ISS-SOS和Lam-Brg段的长度变化率之间的差异可能是最明显的,在ISS-SOS基线的面板中,第五行,第四列。

  这样的分析,既优雅又基本,与Procrustes配准和薄板样条的标准GMM工具包没有相同的算法。(对于适用于常规生物识别应用的标准工具包的计算方面的一个很好的概述,见(Claude, 2008)。虽然“几何形态计量学”一词并不局限于Procrustes方法,但今天绝大多数的GMM论文确实是从他们的地标数据的Procrustes转换开始的。两点配准比20世纪90年代的形态计量学合成要古老得多,甚至比三角形分析(“张量生物计量学”,Bookstein, 1984)或双正交网格分析(Bookstein, 1978)还要古老。两种版本都需要关注短期或长期的横断面形式,内部相交,,通过类比形式的变化从一个广场,一个矩形,一个特定的方向(的平方)的比率变化的距离最大或最小交叉角是不变的比率变化的两个距离在这些方向(对角线的平方)是团结和最大化的角度的变化。仔细检查图1d的地标间距离解释,反而参考了在一定间距上平行的距离(上头颅宽度与下头颅宽度),这一变化在Procrustes拟合和两点版本中同样可见,特别是版本7-8(第5行第4列)和3-5(第3行第3列)。在一些更早的应用论文中已经出现了像这样检查平行距离比率的想法,例如Martin(1914)。

  为了直观地理解这里发生了什么,请回到最早的教科书中对薄板样条的介绍(Bookstein, 1991),在那里,像这样的分析,仅限于四边形的地标,例证了我所谓的“纯粹非齐次变换”,意思是没有任何均匀成分的变换。那本书的图7.3.6显示了在当时软件工具的限制下,旋转起始网格对使净弯曲能量最小的正方形变形的纯非均匀分量(这里是唯一的非线性分量)的图形的影响——现在无处不在的薄板样条。

  图3是对该教科书图的修改,旨在阐明不同类型的显著性(长度比和旋转)对有趣的片段的对比。它的四根柱子是不同类型转换的原型,每根柱子都有一个正方形的地标。最上面一行是开始的正方形,两次与页面笛卡尔对齐,两次与页面对齐。下面是相应的分析,并通过普通薄板样条进行了加强,这些样条实际上不是算术报告的一部分。(但这条样条与这里的分析无关,这里只处理标记位置本身,而不是任何间质组织。对图4、5、6、7、8、9、10和11中的间隙渲染进行二次扩展,至少需要6个地标,而不仅仅是这4个;进一步扩展到图17和图19中的三次拟合至少需要10次。)在列(a)中,通过旋转其两条边而不改变其长度,正方形被转换为菱形。并发边之间的夹角是多少?在(b)列中,将相同的变换应用于地标的正方形(换句话说,网格相对于地标旋转,其配置在任何一行中都没有改变)。现在报告反过来了:最大的变化是对角线长度的比例,而它们之间的角度在这里保持不变。这也是列1中的配置的情况,它被网格线的不方便的方向所混淆。

  图1d或图2中的情况对应于图3 (c)或(d)列中的原型。开始的构型仍然是相同的正方形。但在(c)列中,变换改变了两条平行边(图中为水平)的长度之比,而不是像(a)或(b)列中那样垂直,同时保持其他两条边长度之比不变(面板c1中的另一对平行线),同时从根本上改变了它们的角度。这是一个从正方形到等腰梯形的变换。列(d)中的互补变换,几何学家称之为从正方形到风筝的变换,使对角线的长度和角度保持不变,但改变了它们中点之间的关系。现在,它是另一对长度比没有改变的成对边——上V和下V——虽然水平对角线末端的角度几乎没有改变,但垂直对角线末端的角度变化很大,一个增加,一个减少。重申一下,这些报告完全不依赖于任何课程GMM技术,既不是Procrustes也不是薄板样条。

  本文的目的是尽可能地推动这种见解,同时保持其生物数学的基础。(例如,它的多变量分析仅限于我们熟悉的多元回归设置。)特别是,在任何生物理论或生物数学推理的背景下,通常的Procrustes程序的每一步(定心,旋转,重新缩放)都被证明是非常困难的。尺度标准化的步骤最近受到批评,被认为是不必要的,而且实际上是不合适的,至少对于成长研究而言(例如,见Bookstein (2018, pp. 412-414或Bookstein, 2021a)对鲍亚士坐标的辩护。本文主张对定心和旋转进行类似的重新思考,然后用一种不同的策略取代薄板样条插值的结果配置,在每个地标上单独留下无法解释的残量,以简化对整体显示网格的解释,“转换网格”自达西·汤普森1917年著名的阐述以来一直被强调为真正的潜在主题。虽然两点坐标的思想最初是高尔顿在1907年提出的,但本文分析的目标思想,即生长梯度的二次或三次简化或系统发育比较,只有高尔顿的一半历史:它在1967年彼得·斯尼斯(Peter Sneath)关于达西·汤普森(D’arcy Thompson)变换网格的趋势面分析的被低估的论文中处于萌芽状态。

  争论的核心在于接下来的8个数字中的任何一个,它从图2中的28个中选择了8个有趣的基线来扩展分析,包括一个明确的二次回归,平均年龄为150岁的笛卡尔坐标与相同的年龄为7岁的八角形。这些分析完全忽略了标准gmm的工具——没有Procrustes定心,没有缩放或重新定向(任意)选择基线之外,薄板样条只会被忽略——而你将看到的结果是对这种特殊的神经颅形变化的一个一致的总结。组合的图12将8个单独的摘要排列在一起,以综合图13和图14中抽象的信息内容。在这一探索之后,对我的维也纳小组20年前发表的一项颅人源化研究的一些数据的进一步分析将考虑这一方法的一些扩展,并在最后的讨论中将反思这种与当今传统GMM工具箱似乎无关的一些含义,以解释进化或发育形态学的目的。

  图1中推荐的维尔曼增长分析的替代分析可以通过对我选择的基线的一套单独分析的共同发现的提取来叙述,其中一些是八边形的横截面,另一些是它的圆周。要调查的分析在图4、5、6、7、8、9、10和11中列出。这八种复合材料中的每一种都有四个面板。它们具有以下几种不同的功能。

  图4

  figure 4

  这是八个数字中的第一个,它们都具有相同的四面板格式,应用于图2中提供的28个数组中的八个选定基线之一。顶排面板,从左到右:平均笛卡尔坐标的实际变化,薄板样条指向所选基线;普通薄板样条的二次曲线拟合年龄为150岁的平均值,对模板的x坐标和y坐标的一、二次幂及其乘积xy进行回归。最下面一行,左边,二次拟合(不是样条)作为自己的网格。实心圆圈表示观察到的年龄平均为150岁;打开圆圈,从这个回归预测。右下:如文中所述,将网格顶点的显示列表限制在年龄为7的八边形的内部。该图的基线从Basion到Opisthion(地标1到地标2)

  在这八种选择中,左上角是传统的薄板样条,正如许多软件包所提供的那样,它将7天龄动物的笛卡尔坐标的平均八边形扭曲成150天龄动物的相应平均值,从而最小化净弯曲能量(Bookstein, 1991),同时精确地拟合所有地标位置。(所有这8个面板稍后将作为合成图12的一部分收集。)虽然所有这些都是同一对地标配置的样条变形,但它们被绘制到8个不同的坐标网格方向,即左上角面板中一对圆圈点所表示的8个基线选择。这是本文的一个主要观点的图形演示,它纠正了D 'Arcy Thompson的一个错误,他没有考虑网格方向本身的规范。很快就清楚了,不同的网格方向会导致相同变形的不同报告,尽管这种方向本身并不是任何一种客观的生物学参数。(例如,在Procrustes分析的一个版本中,应用于Procrustes平均值的轴是其自身主成分的轴;在Bookstein (2018, p. 409)的符号中,这是一个条件,即所谓的j矩阵的所有六行都是标准正交的,仅仅是为了简化结果代数。那么,如果一个特定的方向是用于一些图形报告文学,它是如何指定或优化?当Procrustes方向本身与生物体没有关联时(毕竟,它是由构型中包含的一系列地标决定的),当它不能与任何可定性观察到的东西相关联时,除了在双边对称形式的例外情况下,人们不能说“将起始网格与Procrustes软件返回的方向对齐”。由于GMM的发现需要根据组成GMM数据库的地标坐标进行交流,因此引用网格方向的最简单方法是引用一些地标对。图4、5、6、7、8、9、10和11演示了从28个可能的选项中选择8个不同的地标对的情况。

  第二种标准化已经应用于这些上面板,尽管它只在下一行图形的边界中是明确的:在图形标题中圈出并命名的参考地标对被放置在笛卡尔坐标(0,0)和另一个笛卡尔坐标(1,0)上,从而也指定了距离单位。当然,这就是图2中已经探讨过的两点坐标系(Bookstein, 1986)。需要这种类型的规范,以便在相同的8个数字的右上方面板中生成表示,这些表示是用于派生几何映射的薄板样条,即“增长拟合”。在这里,变形网格的x坐标是150天平均值的基线标准化八边形顶点在7岁平均值的两个坐标上的回归预测的x坐标,以及它们的平方和叉乘(即每个on的回归),同样也是-坐标。这些回归中的每一个都包含五个预测因子,加上一个常数,仅适用于八种“情况”(八个地标的相关坐标,x或y),因此只有两个误差自由度;它们并不是真正的回归,而几乎是插值,因为地标数是如此之小。在这些右上方的网格中,在左上方的面板中可见的局部弯曲(实际上与这些平均地标配置的配对相关的弯曲)显然有些减弱,但仍然存在难以用语言描述的弯曲。

  在所有这8个图中,左下方是比预测值的薄板样条(右上方)更合适的二次拟合表示:初始场景的所有网格线的计算变换隐含(但没有绘制在左上方)为年龄-7配置平均值上的正方形网格,即根据指定的基线对居中和定向。我们现在清楚地看到每个回归,作为所有预测值的变形网格。(就像上面的面板一样,这八个版本都收集在图12中。)特别是150岁的地标的观测值再次由填充点的成对x和y坐标表示,而来自7岁数据的预测值则是附近的开放圆圈。因为这是一个二次回归,每条网格线在代数上都是一条抛物线(尽管有些曲线很浅,与直线难以区分,我们将会看到)。这是本文另一个主要观点的图形演示:与Sneath(1967)一致的是,转换网格可以通过像这样有意简化的最小二乘拟合来最有效地报告。

  最后,右下角的面板将把这个网格限制在左上角面板的7岁八边形的内部。这是图形中唯一值得经验关注的部分,因为薄板样条向外部的延伸在代数上被要求迅速向线性方向下降(见Bookstein, 1991),而相应的多项式外推拟合对最高阶项的权重越来越高,因此没有生物学意义。在这些受限制的图的相应扩大的尺度上,有更多的空间来显示每个地标的预测位置和观测位置之间的残差,包括基线对本身。(回想一下,左上角的图中没有这样的残差——薄板样条完全符合每个指定的地标,没有误差。)图4、5、6、7、8、9、10和11中的8个截断坐标网格变形的例子提供了八边形从一边到另一边的不同程度的弯曲,以及相对于它们的平行线的不同程度的旋转。在对这种或任何一对地标构型的最终分析中,优选的坐标网格将是这些网格线导致最简单的模式报告的坐标网格。在这里,这将是在风琴的轮廓内几乎是直线延伸的优势,然而它们可能在八边形上旋转。我在结束语的第一部分再回到这个问题,即追求报告的简洁性。

  然后,考虑本系列的第一个图,图4,这是从Basion到opisthion的基线分析-一个完全包含在图1d的后五边形隔室中的短的标记间段,因此可能会启发我们关于那里存档的旋转。前标记三角形和后标记五边形之间的旋转基本上与图1中传统GMM入路和图2中与该基线对应的面板(即第1行第1列的面板)所显示的相同-实际上,在本系列的所有八个图形中都是相同的。在图4中,基线Basion到Opisthion(中矢状大孔轴线),形式的方向从图1中的Procrustes惯例旋转。薄板样条(左上面板)有趣的是,在后面的五个地标组件,SOS周围到Lam,由样条渲染的内部似乎几乎是仿射的(所有网格细胞大小和形状相同),除了IPP附近,同样的,对于前组件Bas-SES-ISS也几乎是仿射的。增长拟合(右上面板)显然将IPP拉到了图的左边。如图1所示,以及在早期论文(例如,Bookstein, 2017)中所阐述的,该点参与了一个特定的焦点过程,在图1中更现实的解剖设置中向上取代它。因此,图4右上面板的拟合并没有显示IPP变化与实际数据中存在的相邻变化的偏差。

  下一行的任何一个面板都显示了拟合的地标(开圆圈)与观测到的平均150天位置(实圆圈)的密切程度。表格内部的水平网格线(右下面板)主要是直线,而它们在该图上的方向从上到下的渐变比左上类似图(基于完全详细的数据记录的薄板样条,设计上不利于任何低维总结)更平滑。这个输入的网格线方向的稳定旋转得到了另一个网格线方向的平缓曲率的补充,这个曲率在左上角明确的薄板样条中不那么明显——这里出现的转换是分段的,一个接近线性的系统用于后五边形,另一个用于前三角形,通过二次回归平滑为模板端到端(网格的顶部到底部)的连续梯度。在这个坐标系中)。为了将基线长度保持在1.0,不需要二次拟合——通常在每一端都有回归残差。

  图5显示了从同一后五边形到基底到顶间点的不同基线的相同分析。再一次,二次拟合(下一行)显示了大量的残差,这次只有一个基线点(IPP)。在变形的网格中,两个系统的线都是弯曲的,这使得解释起来更加困难。

  图5

  figure 5

  从Basion到Interparietal点,地标1到地标3的基线同图4

  图6是第一个涉及跨成分基线的图,Basion(从后五边形)到Bregma(从前三角形)。起始网格大致从它在这个系列的第一个位置旋转(即,在7岁平均值中,Basion-Opisthion和Basion-Bregma段之间的角度约为)。再一次,下一行的面板告诉我们,最初的垂直网格线(沿着Lambda-ISS或IPP-SOS的线)通过二次拟合转换成不同方向的接近直线的铅笔,而最初正交系统的线以一种将在图13中详细介绍的方式轻轻地弯曲。在两个基线点上,二次回归的拟合误差都不大。在这个系列的每一张图中,右下方修剪过的网格上的单元格大小的近似均匀性向我们保证,在中心异速生长模型(如Bookstein (2021a))中,依靠到质心的距离是合理的默认值。实际上,在这个图的尺度中,实际的150岁质心与7岁质心的二次趋势变换之间的距离仅为0.054个单位。

  图6

  figure 6

  从Basion到Lambda,从里程碑1到里程碑5的基线也是如此

  从IPP到SOS的基线图7与图6的分析非常接近,因为两个基线,IPP - SOS和Bas-Brg在7岁模板中几乎相同。主要的区别是拟合误差的大幅增加,这是由于已知地标3 IPP在一个特殊因子上被强烈加载,而不与配置的其余部分共享。尽管如此,下一行的网格仍然非常类似于上图的网格,对于这一基线:与IPP-ISS平行的线(这里是基线)保持直线,但从一端到另一端旋转,而正交线则略微弯曲。

  图7

  figure 7

  从顶间点到Spheno?ccipital关节联合症,标志3到标志8的基线也是如此。每个面板大致是图6中相应面板的旋转,其基线约为这一个

  让我们更快地浏览一下这个四面板方案的其余版本。在图8中,基线Lambda-SOS,两个系统的网格线在每一个面板的下一行是平缓弯曲的(虽然旋转从一端到另一端的原始八边形是清楚的,如果他们一直保持直线)。基线点的拟合误差在量级上是中等的,部分原因是由于需要适应IPP的偏差而扭曲了Lambda的拟合。

  图8

  figure 8

  从Lambda到Spheno?ccipital关节联合症,标志4到标志8的基线也是如此

  图9显示了图1前分量的基线Bregma-SES在两个网格系统中的平缓曲线。二次拟合的误差同样适中,尽管这些变形的网格线有曲率,但图1d中如此明显的旋转非常清楚。图10中的基线Bregma-ISS具有相似的拟合误差和相似的网格线曲线。最后,对于ISS-Bas基线,图11大致是图5中分析的旋转,其中基线(Bas-IPP)大致位于此处的基线。

  图9

  figure 9

  从Bregma到Spheno?thmoid关节联合症的基线也是如此,标志5到标志6

  图10

  figure 10

  从Bregma到蝶间缝合线的基线也是一样,标记5到标记7

  图11

  figure 11

  从Spheno?thmoid关节联合到Basion,标志6到标志1的基线也是如此

  图12以一种更有利于报告文学的协议取代Procrustes旋转的方式总结了所有这些分析,允许一些可解释性标准出现:该协议将标本的重新定向与他们的变形报告的最终简化联系起来,通过参考从模板的方形网格变形的特定坐标线。我们已经看到,如果相应的地标间段本身大约位于模板中,则基线分析有时可以成对进行,如果它们靠近八边形的质心则更好。更微妙的是,形态学比较可能导致一个地标配置的部分相对旋转的报告,最好不是用薄板样条,而是通过选择一个特定的基线来突出所讨论的旋转,就像这里的图6或7,通过使一组网格线保持直线,即使它们被旋转。(例如,在图6中,右下角的面板比左上角的面板更具可解释性,尽管信息内容实际上是相同的。)图12中的薄板渲染图,列1和列3,都证实了图1中已经检测到的相对旋转,但似乎没有提供太多直观的可访问性。相比之下,二次拟合显示(第2列和第4列)的易读性差异很大,其中一些确实很有见地。似乎最有帮助的是第二行中对基线Bas-Lam或IPP-SOS(两个方向恰好几乎垂直)的分析,它们似乎比标准GMM分析在显示生长过程潜在有意义的梯度方面要好得多。

  图12

  figure 12

  图4、5、6、7、8、9、10和11的左上和右下面板的概要,基于28个可能的两点基线中的8个。显然,其中一些选择会导致比其他选择更简单的报告。由于薄板样条与其目标的相似变换是协变的,所以这里的所有样条(列1和列3)除了网格方向和间距之外都是相同的。但是,与第2列和第4列相关的回归对不同地标的权重不同(特别是,根本没有对基线的两端进行加权),因此这些网格可以在比基线方向本身更多的方面发生变化

  图7中的分析表明了我在图13中强调的一种情况,通过简单的技巧,将二次拟合的域扩展到经历翘曲的7岁地标配置的边界之外,如左上角所示。在这里,黑点是年龄-7岁的平均配置,而四个开放的磁盘是控制点,它们将驱动双线性地图作为整个场景的解释出现。这里的右上图仅仅通过在相同模板坐标系中向左的新坐标域上对其进行评估来扩展先前的网格化变换,即进入这些动物的枕骨大孔上方一段距离的空白空间,图7的水平网格线似乎是收敛的。我们看到,沿着基线和所有平行于该方向的网格线的变换的近似线性持续存在,远远超出了比较的实际解剖极限。图1d中显示的明显旋转嵌入在一个更大的重新定向系统中,该系统可能被视为连续的而不是分段的,或者,用更有暗示意义的语言来说,是分级的而不是模块化的。

  图13

  figure 13

  对IPP-SOS基线的二次拟合的图形扩展产生了对增长现象的惊人的重新解释。左上方,方形笛卡尔网格延伸到基线注册模板的左侧。填充点:平均年龄7岁。开圆:模板坐标系中将要进行双线性变换的四边形的角。右上方为图7中拟合的二次趋势的对应版本。右下:将拟合的二次趋势简化为双线性映射,将起始四边形(左上的开放圆圈)的所有平行边的比例样条发送到目标四边形(右下面板中的开放圆圈)的相同比例样条。

  尽管它们在旋转,但变形坐标网格线的近似直线性和均匀间距表明几何解释为双线性地图。图14将以教科书的姿态展示这种解释;在图13的底部,我把它想象成一个相对旋转的线条模式,这些线条不是抛物线,而是在两个坐标系中都是绝对直线的。这样的地图需要两个控制点的四边形,在左上角(用于开始的正方形网格)和目标形式(右下角面板)显示为开放的圆圈。图中第二和第三面板之间的匹配让我非常高兴:确实,这种特殊的六参数回归可以用这里抽象的三参数版本来很好地表示。图1d的旋转完全是由颅顶和颅底之间的长度不相称造成的,在这个生长间隔内,颅顶和颅底保持近似平行。图4、5、6、7、8、9、10和11中的大多数网格出现曲线,主要是(尽管不完全是)坐标系选择不当的产物。Bookstein(2023)非常详细地研究了这种低维总结的充分性的代数索引;在这里,足够注意的是,适合是相当不错的。(但忽略那种强烈的印象,即在实际的小腿外有一种非生理距离的某种描述性中心。这只是目标四边形各边成角的代数产物;根据位置的细节,这个点可能在附近或中间的任何地方,但远在生物体之外。)

  图14

  figure 14

  图3 (d)列的两种备选方案。图13右上方的地图更接近于双线性地图(最右面板),而不是投影地图(中央面板)。

  图14描绘了两种典型的四边形变换,前面的分析将与之匹配。每一种都是图3中柱(d)薄板样条的替代;对于本文的示例,其中一个将证明比另一个更现实。更熟悉的地图是投影,中央面板,将每条直线映射到另一条直线上。但是这种映射实质上改变了这些变形网格线与边界风筝相遇的点的间距。在扩展的二次拟合本身中没有出现这种间隔,如图13所示。观察到的二次拟合的另一种更好的匹配是图中右侧面板中的家族原型,我在Bookstein(1985)中详细讨论过的双线性地图。双线性映射脚注3将一个四边形映射到另一个四边形上,如下所示。模板四边形内部的每个点(x, y)是两条连接相对边的线的交点,每条线以相同的比例划分这对边。该映射取(x, y)到两条线的交点,这两条线以相同的比率划分目标中的同源边对。对于正方形到风筝的经纱,这种双线性选项可以写成a。

  图14中的投影要求将模板的上等腰三角形映射到风筝水平对角线上方的空间,这需要对其垂直坐标进行相当大的压缩;双线性变换在这里施加的压缩要小得多,代价是在变形过程中弯曲水平对角线。经过适当的旋转后,这些面积变化比率的可变性的衰减似乎与图4、5、6、7、8、9、10和11中所有二次拟合的图形相匹配。投影图将所有直线映射到其他直线;双线性映射,一般来说,只有从相对边连接匹配的等边的线。如图14所示,变形对起始菱形的水平直径产生不同的翘曲(虚线)。投影(中间面板)将这条曲线变为一条直线;双线性图(右面板),到抛物线产生一个不太极端的减少,模板细胞的面积超过这个直径。由于正方形和风筝的共同对称轴,在最右边的方格中还有另一组直线——垂线——但这第三组直线在一般情况下不存在,因此在“双线性”中使用“bi”,因此我没有在这里画出它们。

  最后一次回到图1d中的方案,将神经颅八边形分解为两个不重叠的组件,我们看到该图确实过于简化了那里的情况。后五边形的所有边缘的旋转跳跃到观看者的眼睛掩盖了一个事实,即除了其中一个部分之外,所有这些部分都改变了它们的长度。同样,前面的“三角形”Brg-SES-ISS也没有刚性旋转——它从SES到ISS的边缘缩短了,也没有其他两个旋转得那么远。任何关注这两个“组成部分”的报告都缺乏参考它们之间的坐标空间,其中Bas-Brg基线和IPP-SOS基线分析的旋转线(图12,第2行,第2列和第4列)似乎比相应薄板样条的不规则性(第1列和第3列)更好地捕捉了沿颅底和沿颅顶的前后位长度变化之间的不一致性。

  “Vilmann在没有Procrustes GMM的情况下分析7- 150天的生长”一节的Vilmann分析利用了实验动物形态学所能提供的最佳研究设计:用相同的机器在固定的发育年龄序列上对近亲繁殖的动物进行成像。(这种研究设计被认定为实验室进化研究的巅峰之作已经有一个世纪的历史了——最早可以追溯到1922年的普兹布拉姆。)应用GMM的大多数数据结构都没有很好地平衡。本文的最后一个例子是一对比较,每一个在设计上都更加典型,它们共享一个20地标配置方案。这些数据是从Weber和Bookstein(2011)第4章中分析的29种形式中挑选出来的,这些形式源于Philipp Gunz(当时在维也纳大学)为Bookstein等人(2003)的生长分析而数字化的更大CT扫描样本的计算机正中状面切片。最初的分析明确地依赖于今天最常用的GMM工具包:Procrustes分析,结果形状坐标的主要成分,以及薄板样条的可视化。脚注4

  在2003年同源数字化的标本中,大多数是智人,而四个是尼安德特人的命名标本(Atapuerca, Kabwe, Guattari和Petralona),两个是潘人的标本,每个性别一个。在目前的重新分析中,我平均了18个成年智人(其中一个,姆拉德伊茨,是一个古老的标本)和4个尼安德特人,作为一个单独的群体。作为第三个“群体”(出于教学目的,作为比较的比较),我选择了雌性成年黑猩猩,因为成年雄性黑猩猩表现出更多的异质性,这将使我的最终图形在几何形状的某些方面变得如此极端。当然,这些样本比今天用于相同比较的任何数据资源都要有限得多。声称目前报告的计算是有效的实证结果是不合理的;我的目的是演示一种替代基于Procrustes和样条的GMM的方法。

  图15的左面板将这20个地标命名为原始CT坐标中智人样本的平均位置,这些位置距离塞拉-纳西恩方向不远。在右边的面板中,这个配置是由雌性黑猩猩和尼安德特人平均的相同的二十个点的配置补充的,所有这些都是在两点转换(Bookstein坐标)之后,把所有三个ANS(其中两个是群体平均值)放在(0,0),把所有三个内部Lambda放在(1,0)。显然,这个坐标系统已经被旋转,平移,并从左边的面板缩放,但是这些步骤都不是按照普洛克斯特的方法进行的。

  图15

  figure 15

  人格化示例的地标配置,“骷髅人格化示例”部分。(左)在Bookstein等人(2003)的成年智人子样本的原始数字化坐标平均值上打印的20个地标的缩略名称。上颌中切牙间骨间隔下尖,鼻前棘,鼻前棘顶,鼻前棘底,枕骨大孔前缘矢状中点,BrE, BrI外、内Bregma,矢状缝最外、最内、矢状缝最内交点,CaO视神经管交点,视神经管两个标志与中矢状面连接的弦交点,CrG胆道嵴,胆道嵴后底点,FCe盲孔,正中矢状面盲孔前缘,FoI切口窝,正中矢状面后缘正中矢状点,Gla glella,正中矢状面额最前端点,InE, InI外外侧和内外侧,矢状面中枕骨最突出突起,LaE, LaI外外侧和内外侧;矢状和小矢状缝合线最内外交点,鼻尖,鼻骨最高点在矢状正中面,鼻眼,鼻大孔后缘矢状正中点,鼻后棘,鼻棘最后点,鼻梁,鼻间缝合线最低点在矢状正中面,蝶鞍,鞍背顶部,鼻间缝合线,蝶基底缝在矢状正中面。(右)Bookstein坐标到平均成年智人和尼安德特人样本以及单个成年雌性黑猩猩的ANS-LaI基线。地标是由多线智人-智人追踪的。尼安德特人-潘人来澄清他们的身份

  首先考虑图16中的分析,它在设计上与Vilmann系列的四个面板中的三个相呼应,图4、5、6、7、8、9、10和11,但在这种情况下,只针对一个选定的基线,从ANS到LaI,如图15的右面板所示。(对一个大致垂直的基线进行分析,Opi-BrI,得出基本上相同的图表。)图16中的比较是从图15中智人的平均点数与尼安德特人的平均点数进行的比较。在这两个Homo的平均值中(以及即将到来的单个成年雌性Pan标本中),基线穿过靠近Sella的颅底,大约是其长度的一半。从18个人的平均值到4个尼安德特人的平均值的薄板样条变形,在图的左上角,显示了预期的神经头盖骨萎缩和外植头盖骨扩张的对比,特别是沿着上颚;颅底作为所谓的“半移区”介入。正如右上方的图所示,这个网格在某种程度上是由类似的网格跟踪的,这些网格是尼安德特人在智人坐标上的二次回归的相同标志的拟合值。这个二次回归,在前面的维尔曼例子中已经证明了很多次,显示了它在中心分离矩阵上的大部分拟合失败(在左下方的图中,开放的圆圈和它们填充的邻居之间的差异)。在右下角可能有一个例外,两个离子的配对在分离和方向上都被重新排列。如图15所示,这种重排主要是由于内外部信息的过度变化。

  图16

  figure 16

  对比智人与尼安德特人平均20个地标配置的三个网格图,与ANS-LaI基线。(左上)传统薄板样条网格将智人平均变形为尼安德特人。(右上)从相同的平均智人到尼安德特人构造的二次回归拟合的变形薄板样条渲染(对x和y坐标的一次和二次幂以及它们的乘积xy进行回归)。(左下)二次回归的明确网格。实心圆,观察到尼安德特人的平均两点坐标;开放的圆圈,合适的位置。这比图7中Vilmann神经颅八边形的生长拟合更符合双线性

  图16左下方的最终二次趋势网格与相同点轨迹(右上方)的薄板样条有显著不同。事实上,这个拟合网格看起来非常像图14中右边网格的旋转,双线性变换在变形后留下了两个特定的直线族,而它们的方向在图中旋转。在这个大尺度下,这些姊妹物种的中矢状颅骨的比较基本上是平滑的——在二次分析下,半轴区中的点与它们的预测位置几乎没有什么不同。特别是,右上方面板中的模块化含义在左下方的二次拟合网格中完全被抹去,表明取而代之的是一个近似的空间过程,该过程均匀渐变,没有自然边界胚胎学或其他。这一分级与尼安德特人的神经头盖骨相对于面部比智人小的观察结果是一致的,而且也有一些相对的旋转。

  图17通过三次拟合而不是图16中的二次拟合来分析相同的比较。(具体来说,这个拟合模型是尼安德塔人平均的20个x坐标中的每一个,然后是20个y坐标中的每一个,作为9项的线性组合,二次回归只使用了这些预测因子中的前5个。)这些立方体网格在其驱动数据的限制之外显示出奇怪的行为(在Sneath 1967年的例子中已经清楚地显示出奇怪的顶点),因此在Vilmann对“Vilmann 7- 150天生长分析不使用Procrustes GMM”部分的阐述中,我又扩展了一个面板,右下角,将网格修剪到实际目标配置所占区域的内部(这里是尼安德特人的平均值)。图16中呈现的直线现在在相同的轴向区域上显示为s曲线,当然,新的拟合,对9个预测因子的回归,必须比图16中基于9个预测因子中的5个更接近。(注意,二次映射不能产生拐点,比如三次拟合的s曲线。)但是神经头盖骨和植颅之间的大小比的变化仍然很清楚,沿着上颚的方向延伸和从前到后、从尾到颅的相对旋转也是如此。

  图17

  figure 17

  尼安德特人坐标的三次回归也是一样,九个预测因子而不是五个。左上、右上和左下面板如图16所示。在右下方,一个放大版的网格(左下方)被修剪到实际尼安德特人平均水平的内部

  将智人与我们的远亲雌性黑猩猩进行比较,情况就大不相同了。与图16类似的二次分析可以在图18中找到,但它看起来不再完全像图14的双线性映射。相反,我们遇到了转换的一个强大的局部特征,即顶板区域的明显旋转和平坦化,这可以在顶部行的薄板样条渲染中看到(左侧为实际形状坐标;在右边,二次拟合),同样在网格表示的二次拟合在左下角。引人注目的是,这一分析的残差似乎并不比智人样本与尼安德特人样本的比较大,图16,然而样条的平坦化也被这个二次拟合清楚地检测到,它的系数要少得多(而且矩阵反演步骤要低得多,而不是)。图16左下面板的双向线性显然已经不再适用于全局,而这里的轴向区似乎仍然没有多个模块之间的自然边界。变形保持平滑渐变,除了局部,在顶板区域。

  图18

  figure 18

  Bookstein et al.(2003)数据库中平均智人与单个雌性黑猩猩的对比同图16。

  然而,当我们将算法从二次(五项)拟合切换到三次(九项)拟合(图19)时,由于每个坐标增加了四个自由度,分析中没有任何本质变化。拟合点的薄板样条(右上图)除了在相同的不一致顶骨区域外,与上图中的样条没有太大变化,虽然这里的三次拟合导致原始方案的每个角落外推网格的病变(左下图),但它对实际解剖结构内部的限制(右下图)显示网格线,忽略它们的曲率,实际上与图16左下角智人与尼安德特人的对比非常吻合。因此,我们从图形上证实,顶叶区域的形状差异确实是局部的。换一种说法:在对智人平均20点构型和单雌性潘的20点构型之间关系的扭曲分析中,10参数的二次拟合(图18)和18参数的三次拟合(图19)传达了同样的信息:一个相对连续的变形梯度正好穿过轴向区。他们也同意,顶叶的情况(标志Opi到LaE)与这种大规模的梯度不一致。从Bregma开始,图17和图19的右下面板的不同主要在于这些网格线段的旋转强度;但是在这个任意边界的后面,顶叶标志参与了两个比较之间不相称的重组。

  图19

  figure 19

  智人与潘族女性使用立方工具的对比图同图18。左下角的网格,对于立方体拟合,是正确绘制的,即使它看起来像鲸鱼

  因此,我们再次看到,就像在Vilmann增长的例子中一样,一种避开所有标准Procrustes步骤和通常的薄板样条的方法能够更好地理解形态现象,在这种情况下,通过多项式拟合而不是薄板插值来更好地理解形态现象。

  在达西·汤普森的《论成长与形式》(Thompson, 1917)中,这一概念最早的正式出现就已经很清楚了,评论文献通常是从这里开始的(尽管像阿尔布雷希特·德·勒这样的肖像艺术家更早地想到了这一点)。该方法的终点不应该是统计的,而应该是图形的,衍生的报告应该是几何的,而不是统计的,最终到达生物物理或其他形态动力学的终点。Thompson (1961, p. 275)这样说:“一个复杂图形的变形可能是一种容易理解的现象,尽管图形本身必须不被分析和定义。”这一传统的主要困境在其发展的前60年里已经受到了很好的批评,正如我在布克斯坦(1978)的第5章所回顾的那样。无论每个里程碑点的位置定义得多么清晰,都没有补充的修辞来报告转换网格的有意义的特征,以表达它们的配置与有意义的生物对比的比较。在对这个问题的经典阐述中,最好的是1967年Sneath的论文,这篇论文努力将里程碑分析的代数(在前样条时代)与数字分类学的推理结合起来,但最终没有成功。然而,D 'Arcy Thompson会对图13中的网格感到高兴,而以Procrustes风格、图1a或样条风格、面板4 (a)到11 (a)来展示相同的信息,对他来说根本没有用。一个更现代、更独特的转换研究传统是通过微分同态演算来解决这个问题的(例如,参见Grenander & Miller, 2007),它根本没有必要参考地标,而是基于图像内容的整个领域,灰度甚至彩色,跨越感兴趣的器官。这种方法在人脑图像的神经学应用中似乎特别有用。然而,这种对比的方法超出了我在这里的Procrustes批判的范围。

  图7或图13中的分析表明,通过在讨论中注入一个新的主题,即在模板上定位起始网格的解剖学基础,可以更新Thompson在该领域的原始关注点,即网格本身的解释,从而更深入地利用变形图形和研究者对非笛卡尔坐标系统本身如何在其视觉主导特征中变化的先验意识之间的相互作用。因此,生物数学应该以两种见解的汇合开始:一是某些形态领域可能适用于某种功能上可解释的大规模模式分析,另一个是关于几何语言的直觉,通过这种直觉,感兴趣的模式可能被量化。对于亨宁·维尔曼来说,这种翻译始于这样一种认识,即啮齿动物的神经头盖骨的生长是形态计量学探索的一个合理领域,它的中矢状面包含了足够的关于生长和功能的信息,不仅在他自己的范围测量中值得几何化,而且在对同一数据集(包括我自己的几个数据集)的众多中间多元调查中也值得几何化,还有“不使用Procrustes GMM分析Vilmann 7- 150天增长”一节的新奇之处。但是,考虑到这两个公理,应用研究的最终结果将不是对替代统计的探索,而是对替代图形的探索:不是对各种线性组合的调查,而是对各种网格渲染的调查。有关绝对尺度变化的相关信息(如在生物力学方面的解释),可以通过在印刷过程中简单的放大嵌入到任何这些网格图形中,或者可以通过对齐文本嵌入到转换网格的界标段或线素上。在这种大规模比较的背景下,旋转是渲染澄清的工具,而不是数字化的一个讨厌的变量。

  图4至图11中的二次回归都使用了相同的五个预测因子列表。这种一致性使得这里的渲染图,不像图1下一行的方法,保留了转换网格的统一组件,在那里我们可以看到它是如何与这些大但有限的梯度相互作用的。但是这两个坐标轴x和y对应的方向在不同的基线之间是不同的,并且基线点不受回归的影响。因此,两点配准固定的坐标并不完全固定在回归中——在网格图中,它们可以在一定程度上从实心圆转变为拟合圆。

  由此产生的数据流揭示了我们所说的“最佳旋转”是什么意思,就像在本文的两个例子中一样,一个器官的不同部分在比较兴趣时似乎相对于另一个旋转。本文推荐的多个两点配准作为Procrustes算法的替代品,其作用本身并不是任何形式的“发现”,而仅仅是一种方便,一种规范地标笛卡尔坐标的简单方法,以便选择合理的多项式趋势可以拟合,每一个都以合理的均衡加权方式。它们的优势在于,与Procrustes方法不同的是,它们不止一种。Procrustes方法优化了与进化或发展GMM分析的最终目的无关的数量(里程碑位移的平方和),这不是最小化平方和或奇异值分解或分类,而是对观察到的形式差异,其原因或其对生物体的后果的似是而非的生物学假设。

  那么,我们需要的推理引擎的逻辑就不是可操作的Procrustes算法本身,而是几乎总是完全错误的模型(null模型,纯粹的相似性转换)的最小二乘拟合。相反,我们需要E. T. Jaynes的数值推理方法的逻辑(例如,Jaynes, 2003):明确承认我们不知道的东西——在一些定量经验推理的数据驱动约束列表中缺失的东西。(我最近在古地震学的不同背景下回顾了这一逻辑,古地震学是大地震的历史——见Bookstein, 2021b。)Procrustes分析中缺少的是,在其他事情中,承认方向约束的选择会影响最终的报告:我们所寻求的是能够最好地澄清最终发布的图的方向。此外,不管这个方向问题,在每一个GMM背景下,我们已经知道没有“正确”的注册,因为没有“正确”的地标列表——在任何区域旋转或重新缩放的情况下,不同的地标或半地标列表导致不同的Procrustes注册,并且形状比较的经验报告必须适应这种特定形式的无知。这就是网格的全部目的——将我们的注意力从地标数据本身转移到中间的空间,这是生物过程实际发生的地方。

  指定要考虑的方向选择的特定协议可能与正在研究的定量形态学推断无关。(回想一下,在本文中,基线配准中固定的两个点并没有被拟合趋势固定——配准根本不是网格报告的推论组成部分。)方向可以指定为可用配对中的任何标记间段,或任何同源边界对齐,甚至是特定的力向量,如肌肉负荷或重力垂直-或可能所有这些。无论选择何种方向,全局变形的研究者都会得到这里的方法,即根据工作流结束时的最终图判断,选择至少一个令人满意的方向。在3D中,人们可以通过类似于基线的一系列所谓的“基面”来进行处理——通过质心附近的大型地标三角形,同样地寻找清晰度和冗余性。但在其他情况下,取向问题可能与解释非常相关。这里的例子都是处理全局趋势的,但图18和图19暗示需要一个适合局部特征的变形工具。这样的工具同样需要在网格计算之前旋转笛卡尔坐标系,但通常是不同的,例如,Bookstein(2000)或Bookstein(2014,图7.19)中的折痕模型。

  选择一个特定的笛卡尔坐标系来报告一个拟合的多项式网格,如图4到11以及后来的图16到19所示,结合了生物识别报告的两个不同的可量化方面:变形网格的简单性,以及目标配置的地标处残差的大小(和分布)。本文同意达西·汤普森(D’arcy Thompson)的观点,将第一个目的置于第二个目的之上,在此暂停一下解释原因是恰当的。从心理测量学中借用一个概念是有帮助的,这个概念是一个宇宙的概念,任何心理测试的测量,无论长或短,都构成一个有限的子样本。心理测量因子分析的目的是通过基于可用项目子样本的仔细概括来探索该宇宙的特征。GMM在这里提供了一个清晰的类比,在可能的地标位置的宇宙和它们任意组合成有限配置的更大宇宙的概念中-跨越标本样本的匹配点列表,任何计数,任何位置分布,其中“匹配”可以指通过几何或图像内容对点的任何操作特征。任何特定的配置构成了一个有限的,通常是任意的样本,一个单一的模板几何从这个巨大的宇宙的可能性。(除了这些有限列表的组合,还有其他接近形态计量学的方法:例如,在弯曲的半地标上,(Srivastava和Klassen, 2016),这种方法可能比GMM在植物学中的应用更好,也许在浮游有孔虫的研究中也是如此。)汤普森将类似的东西付诸实践,他随意地在线条上画出曲线,而不太尊重任何单独的点对。斯尼斯更仔细地处理了他的“h点”的概念,这些点的精度是不确定的,但同样地,他也没有注意到这些点本身的不确定性。

  在这样的背景下,由于没有关于GMM数据集实际几何的基础理论(尽管我们经常对样本采样方面有充分的了解),任何诸如“准确性”这样的概念都必须非常仔细地形式化。(正式的“数据理论”概念是真实存在的;我借用了另一篇心理测量资料的标题——库姆斯(Coombs, 1964)。统计学的一个分支就是这样做的,这个分支通常被称为“空间统计学”,从中得出两个概念是有帮助的。一种是克里金的实践,它是根据地图上任何有限点样本的测量性质来预测地图上任何地方的定量性质。(碰巧的是,传统的薄板样条实际上是克里格的一个例子:肯特和马尔迪亚,1994年。)另一个是金块效应的概念,它是预测方差的组成部分,比如那些来自原始数据不可约的测量误差的预测。(因子分析的文献也有类似的形式,即任何测量的“唯一方差”,与其他替代数据无关。)关于这个一般领域的一个很好的参考是Kent和Mardia(2022),并且这些想法已经被Mardia等人(2006)注入到生物医学图像分析的文献中。图7或图19的目标类似于任何其他生物特征回归分析的目标:准确地估计潜在的有意义的数量——不是重现实际数据,而是适当地可视化驱动它的可解释模式,并适当考虑到所考虑的理论可能产生的外生错误。回到几何形态计量学,图4中填充点和开放圆圈之间的差异并不比回归线或曲线接近但不完全通过测量数据点或高智商青少年在学术能力测试中错过一两个简单问题更不利。

  心理测量学的问题最类似于本文寻找一个好的笛卡尔坐标旋转的问题,这个问题实际上指的是同一个词:因子旋转问题,reretion和J?reskog(1991)对生物学家进行了很好的回顾。在Bookstein(2017)中,我试图使用这些相同的Vilmann八角形作为演示数据集,将该领域的基本操作之一,变最大值旋转导入GMM。变量最大化旋转试图最大化一组与因素相关的项的方差——将尽可能多的这些相关性发送到。本文的等效方法是尝试最小化变形网格线的曲率,最终由拟合的二次或三次多项式的系数得出。这种显式优化本身很可能是研究的主题。

  当GMM被用作后续生物探索的假设来源,而不仅仅是分类或面部识别的实践时,它的作用更像是因子分析,或者某些机器学习实验室中的神经网络处理器:对所有可观察到的效果的某些潜在原因进行原则性猜测。回到GMM,薄板样条的两个众所周知的变化,它倾向于外推一个结构内部的小位移的不比例,而在结构的凸壳外放松到线性,算作错误,而不是特征-见Bookstein (2021a)的讨论。修正这两个普遍存在的困难是本文探讨的多项式网格的一个作用(例如,对于间隔很近的地标,回归会减弱相邻的差异,而不是向外传播它们)。这些回归残差的误差平方和对后续的evo-devo工作并不重要,重要的是它们在产生丰富的新假设方面的作用,这些新假设可以从相应网格的简化外观中得到。在人源化示例中,导致我们更喜欢三次网格(图19)而不是二次网格(图18)的原因不是多项式拟合的净残差平方和(对自由度进行了校正),而是观察结果的可靠性,即一个网格比另一个网格更适合顶骨。

  对于模块化语言的解释来说,这个问题也是一样的:不是根据先前假设的平方和问题,而是关于产生新的、更好的假设的问题,例如,在各种实验设计下,为声称的模块之间的边界的现实寻找证据。因为任何非嵌套模块的内部同时也是其他模块外部的一部分,所以从人格化的例子中可以看出,“模块化”的形态测量学方面,无论其确切的形态发生定义是什么,都不是地标坐标的问题,而是坐标网格线的问题,特别是在被称为模块间边界的附近。图17和图19证实,在这些数据资源的范围内(仅成人形式,没有生长系列,只有20个标志),没有图形证据表明颅底作为颅脑和面部之间的分离基质,尽管它们在功能上有明显的差异,但强有力的证据表明,该标志方案的整个前三分之二从五个顶骨标志,Opi到LaI和LaE分离。在二次拟合(图18左下)或三次拟合(图19右下)进行跨属比较时,很明显地控制了网格的右下角。虽然第二个数据示例的经验意义已经过时,但由于所有这些分类群的样本累积的进步,考虑转换网格本身可能从关于形态发生控制过程的里程碑数据中形成推论的实践应该从当前的GMM工具包转移到这些更综合的调查工具中。

  几何的两个分支的结合使我们得到了图13中对图7中网格的双线性解释,但这另一个工具箱并不在目前教授给生物数学家的工具箱之列。薄板样条的核心与我们试图理解的生物过程不太相似,但多项式拟合的代数(这里主要是双线性地图的具体外观,使两支坐标线在变形后均匀分布,即使它们旋转)确实获得了汤普森为分析而布置的生长梯度的许多经典外观。然而,比扩展坐标系统思想更重要的是扩展形态测量数据的领域,以包括除地标点以外的经验实体。图13中对网格的描述根本没有提到任何地标——这里的简单注释(特定网格线家族的双线性重组,而其余的线)更多地属于这个八边形的内部(横切面的方向,或者,如果你愿意,在这个方向上,横跨轮廓左右两侧的点的配对),而不是它的任何边界描绘细节。尽管该边界是示例的唯一数据源。因此,从根本上说,这一发现例证了一种生物内部匹配的语言,即沿着一条共享曲线上的点对某些解剖实体进行配对。像这样的配对在任何正式方面都不像地标。

  因此,尽管本文的第一个例子是从一个有趣的GMM衍生图(图1d)开始的,但它最终以GMM未知的空间扩展修辞(图13)形成化,但汤普森章节的任何读者都可以访问,正如图14中通过适合一些大学水平几何文本的类似图形解释的那样。这个逻辑顺序可以颠倒过来:从同样的教科书开始,试图找到生物学上的例子来说明它们。例如,我们已经习惯了极坐标(最近在中心异速测量的研究中,Bookstein, 2021a),但是双极坐标或共焦坐标(Bookstein, 1981, 1985)以及其他(实际上)同时相对于两个原点或两个轴系进行坐标的方案呢?坐标系的范围比今天的GMM自动依赖的笛卡尔坐标系要宽得多。我的双正交网格(Bookstein, 1978)已经超越了这种可能性,尽管不是以统计上可行的方式,通过它们的单轴和三轴奇点的形式,对应于“柠檬”和“星形”脐带,这是Koenderink(1990)等高级论文的主题。从20世纪初开始,几何数学就允许我们讨论许多不同扩展结构的坐标:不仅是点,还有线、面、圆和许多其他形式。首先,(Hilbert & Cohn-Vossen, 1931/1952),然后,在更当代的调查中,(Porteous, 2001)或(Glaeser, 2012)。

  因此,短语“几何形态计量学”中的“几何”一词需要扩大其含义,而不是当前关注的以GMM的多变量为中心的方面,或者实际上是基于将地标点作为逻辑上独立的数据元素进行分析的任何版本。当用笛卡尔坐标差的平方和的最小值来计算标本之间的“普洛克斯塔斯特距离”时,它只是生物学家所知的“相似性”的反义词——更为微妙和繁杂的概念的一个没有理论依据的代表。而今天的GMM将Procrustes形状坐标视为其自身位置坐标空间中的笛卡尔对(或三元组)的列表,而不参考任何明确的特征来描述它们的相互关系(例如图1的地标间段)如何在构型比较中实际变化。早在1917年,达西·汤普森(D ' arcy Thompson)就正确地认识到这一点:“这种比较过程,”他写道(Thompson, 1961, p. 271),“在一种形式中认识到另一种形式的明确排列或变形,而不是对原始'类型'或比较标准的精确和充分的理解,属于数学的直接领域。”

  “识别变形”的几何并不局限于单独指向笛卡尔轴的点的几何。汤普森本人在他的画中明确提到了变形网格线的外观。例如,对于与Mola的比较,他写道:“我已经将[Diodon的]垂直坐标变形为一个同心圆系统,将其水平坐标变形为一个曲线系统,这个曲线系统近似地暂时类似于一个双曲线系统”(Thompson, 1961, p. 300)。正是这些曲线的形态,而不是它们上面的地标,才是从算术到理解的桥梁。换句话说,变形的基本语言,即我们报告形态比较作为变形的语言,必须基于可变形图像组件的多种基本类型的术语表,而不是脱节的地标。这些选项确实很广泛,其中包括我们在图1中已经看到的在不同距离或方向上点对到其他点对的变化,以及三角形到其他三角形的变化,正方形到任何四边形(矩形、平行四边形、梯形或其他形式)的变化,内部点相对于不变边界的位移,圆到椭圆,椭圆到任何其他简单封闭曲线,直线到其他直线,直线到任何其他开放曲线,在小范围内具有方向和位置的线素(对于识别这种结构的样条,参见Bookstein & Green, 1993),或附近的平行曲线对任何弯曲的带,沿着它们的共享长度跟踪变化的序列。所有这些都出现在生物识别的例子中;每个都对应不同的报告几何语法。例如(这是对我们的姊妹学科神经形态计量学的另一种认可),线素本身为被称为扩散张量分析的方法总结了图像数据,该方法追踪和总结了人类大脑中的线路模式。

  正如我希望你已经从这篇论文的数字中怀疑到的那样,薄板样条并没有被设计成在这个问题上有任何特别的帮助。其函数形式主要是一个条件的总和,r是每个网格点的距离的每个里程碑式的模板,所以它没有机械收集引用两个或两个以上的地标在同一时间,但必须回归线性多变量统计的非生物对称性为此(这部分扭曲,例如,只是维旋转配置的笛卡尔坐标然而他们到达这一点,而相对翘曲只是相同坐标的不同维度旋转)。不,变形方面的定量形态计量学比较的要素必须是我们的变形图的整个坐标系,我们提取的特征必须是指那些变形的线和区域的特征,无论是端到端还是截断到特定地标子集附近。任何有资格推动像汤普森这样旨在简单描述单个复杂标本之间关系的计划的几何报告,都必须从更复杂的基本实体开始,而不是从离散的地标点的位置开始。从图1中配对的界标间段开始寻找这样的解释,立即导致本文两个例子的基本方面,它们没有参考公式,也没有任何量化,除了坐标的平方或立方以及这些幂的乘积,这些幂使我们能够参数化以平行线开始的几乎平行曲线族。

  通过一个新的工具箱,它有意抛弃Procrustes定心、Procrustes缩放和Procrustes定向,并淡化薄板样条的作用——今天GMM的整个核心,因为它在常规使用中一直被黑盒化——我们可能能够更好地实现GMM的主要目标,即对形态变化及其原因或结果的定量理解,通过诉诸更多样化的几何形式,一些古老的,一些相对新颖的。这种方法的可能性有几个含义,一些是对形态的实际分析,另一些是对进化科学研究生课程的方法组成部分。今天的GMM习惯于借用其工具的几何方面过于集中于矩阵代数和线性多元分析。正如Peter Sneath很久以前在他关于趋势面分析的论文中所怀疑的那样,还有其他的几何实体,比如这里处理二次和三次二元多项式的几何实体,它们更清楚地说明了研究者的视觉本能,特别是在定向现象方面。(例如,查看Sneath(1967)的面板1d,脚注5,其中显示了在比较Homo与Pan时面部和脑壳之间的相对旋转,类似于图18中的情况,然而,没有“头骨人源化的一个例子”部分所利用的坐标优化。)可以为更多的对象分配坐标,而不是单独的离散点(或半地标):例如,网格线应该有自己的坐标(图4至11),地标间段也应该有自己的坐标(图1)。

  同样,GMM在其发表的渲染图中依赖薄板样条的方式夸大了它们对生物生物学的重要性。样条是一种插值图,然而,鉴于我们的地标列表实际上是多么的任意,当它通过近似图来解释时,生物学解释通常会更深入、更好。因此,插值样条在研究周期中的实际作用可能会更早,一直回到最终渲染风格选择之前,以便为应该利用哪种几何语言进行最有效的传播提供指导。在那个早期阶段,插值样条对于寻找主要是局部的组成过程是很好的辅助工具,但在类似的全局报告中表现不佳,正如Sneath在1967年已经知道的那样,多项式分析可以做得更好。这两种可能性都可能出现在报告中,如图4所示。展示了薄板样条,它揭示了IPP的局部变化,以及二次网格,它更好地总结了整体形式的变化(在这两种情况下,忽略了GMM的Procrustes方面,而倾向于此处推荐的不同方向优化)。

  图1d中的发现对本文来说并不陌生。在之前对Vilmann数据的许多GMM研究中,早就应该提到亚解剖结构的旋转,由于我们目前的传统过于对称的数据总结,如Procrustes距离,主成分分析和插值样条,这种说法可能无意中被抑制了。是时候让生物数学的形态学方面回到它在生物几何感官中的根源了——有机体的功能空间可能“知道”它自己的形式吗?为了重建数据和解释之间的相互作用,使用更广泛的几何形式,而不仅仅是“点”(或它们的“模块”)和“变形”。图17和图19所示的三次回归方法也不是什么新方法;我直接从Sneath(1967)那里抄来的。Procrustes方法特别粗心地将方向视为一个讨厌的变量而不予考虑,这使我们的研究领域忽视了这样一种可能性,即相对的物种内部方向可以像相对范围(比例)一样,作为洞察和解释的信息渠道。为了恢复并扩展这种对称性,我们需要放弃标准的Procrustes工具,转而支持同时明确考虑多个方向的探索,就像异速测量研究至少从那时起就考虑了多个尺寸测量一样(Blackith & re老友,1971)。更一般地说,为了理解转换网格,我们必须扩展我们对实体类型的理解,这些实体可以从点到更扩展的结构具有坐标。只有这样,我们才能相信我们的图表能够为“繁复的、嗡嗡作响的混乱”(W. James)提供直接实用的总结,这是我们称之为进化-发展的达尔文现象的光谱。

  摘要

  介绍

  没有Procrustes GMM的Vilmann 7- 150天生长分析

  《头骨人族化》中的一个例子

  讨论

  数据可用性

  笔记

  参考文献

  致谢

  作者信息

  道德声明

  搜索

  导航

  #####

  下载原文档:https://link.springer.com/content/pdf/10.1007/s11692-023-09607-2.pdf

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行