第72章 让我先把数据存了(1 / 3)
不过,无论孙玉月给他准备了什么样的惊喜,化合物的光学反应总不会骗人,司徒捷报写好的算法也不会骗人,那只有可能是那两个样品配错了。
是不是……配溶液的时候出了些什么问题?
毕竟如果点板出现问题,也只会有单独的几个离群值,不会让整个数据集都偏离。
程岳搓搓头皮,思索着,毕竟其他十个未知氨基酸已经顺利的检测出来了,没有必要再重做一遍。
实在不行的话,要不然发论文的时候,就把这两个未知氨基酸拿掉吧……不过,这绝对不是他的性格。
又或者,换一种化学计量法。
改用lda(lineardiscriminateanalysis,线性判别法?
程岳现在用的主成分分析法,计算的时候先只导入所有的数据,采用矩阵变换的方式,给每个采集参数设定比重,让数据与数据之间的点尽可能的分离,完成分离之后再引入每个数据的名称,名称相同的数据成为一个数据集。
而线性判别法,则是在开始导入数据的时候,一并导入了每个数据的名称,数据集已经形成,而这时候的矩阵变换,设定每个参数的比重,就要考虑到两个方向了,除了让数据集与数据集之间的距离尽可能大之外,还会让数据集之内每个数据点之间的距离尽可能缩小,所以线性判别法往往会给出比主成分分析法看起来更好看的数据——
数据集小,分离度高。
而程岳之所以从一开始选择了主成分分析法,是因为这个方法还能勉强手算,而线性判别法则只能靠计算机软件来计算,当时条件不允许。
虽然如果是检测未知物,原理上来说未知氨基酸和对应的已知氨基酸,应该完全相同的,更应该使用主成分分析法。
因为,主成分分析法先分离,再圈出数据集,这样的话完全一样的数据就会重叠在一起。
而,线性判别法先圈出数据集,再试图分离这些数据集,所以反而会有可能为了分离完全相同的两个数据集,采用一些原本占比不那么重的采集参数,给他们更大的比重,强行使数据集分离,而失去了原本的化学和统计意义。
不过,既然目前没什么更好的方向了,不如试一试线性判别法吧。
实在不行,再考虑去掉两个奇怪的未知氨基酸,十个未知物已经足够发论文了。
程岳想着想着,又重新燃起了斗志。
实验就是这样的嘛,什么都有可能,做几年也不出结果的实验比比皆是,自己已经算很顺利了。
突然,他感受到脖子一阵凉意,忍不住瑟缩了一下,回头看才发现是一脸开心的司徒捷报。
“岳哥!”