譬如有人告诉你说,1,4,5的
学科相类似,属于第一组的学科,2,6,7是属于第二组,
3,8,9是第三组,而且这三组的学科有相关, 你这样描述这些数据,好不好呢?
这个模型在做什么呢?
这个模型是根据你刚才输进去的矩阵S, 然后你刚才画的图,模型
然后它就会算出一个再生矩阵,尽量找一些数字令到你刚才的模型呢
能够产生一个再生矩阵SIGMA, 这个SIGMA呢跟你输进的矩阵S呢是越接近越好。
要是这个真的是很接近你刚才输进的矩阵S呢, 我们说这个模型就是可以验证了。
在验证的过程呢, 它要会告诉你,你刚才所画的图,
你刚才所提出的模型里面的路径的大小,譬如第1,第4,第5课跟你这个第一组
的关系是强还是弱呢,第2,6组,7组跟第2组的关系是强还是弱呢?
然后每一组之间的关系是大还是小呢?它都会告诉你。
我们再来看这个程序一次。
这是你开始搜集这些数据了,你做了一些研究,
那么你的研究呢,这是有一个矩阵S,我们说很 多研究最后的结果都是一个相关矩阵的,
是开始的分析的起点呢是一个相关矩阵S, 那么你就画一个图形,这个图形
是右上角那个图形,一个模型,就是你说它们的关系应该是怎么样?
然后电脑呢则会根据你画的模型
计算里面一些路径。就是给你那个图了, 里面的路呢它只会填进这些数字,
它找一些什么数字呢?是一套最好的数字。令到你产生这个矩阵SIGMA呢,
这个SIGMA跟你输进的矩阵S呢相距最小的。
我们再来一次。它输进呢是一个矩阵S,
这是研究的结果。然后你还要自己提出一个模型,也就说哎我这个图是这样。
一个图出来。然后这个图呢, 它只电脑呢就会找一些数字,
这些比如 .73啊,.69啊,.65啊这些数字。令到
它所产生的矩阵呢SIGMA, 这个SIGMA是什么呢?是根据它里面填的数字
大小产生的一个矩阵SIGMA,这个SIGMA有什么条件呢, 这个SIGMA就跟你输进的矩阵的S最小的。
要是这个最后这个SIGMA跟这个S的矩阵 两个相差真的很小很小呢,那么你画的图就正确了。
或者你所提出的模型就真的能够代表数据了。
要是你所最后算出来的SIGMA跟那个S呢
相距很远很远呢,那我们说你画的图,你所提出的模型呢就不对了。
这个数据里面的S呢关系呢就不能够用于那个图代表了。
我们再来看一次。我们输进的矩阵呢就是S,
然后你就画一个这个图给他们,那给电脑的时候呢,
你是没有这些数字的,不知道里面的数字的。
你只有一个图的,但据这个图呢, 电脑就算了,算了些什么呢?
就算里面的数字出来了。
里面这些数字, 要根据这些数值呢,它
只产生一个矩阵,这个是我们的SIGMA了, 下面的SIGMA了。下面这个是
S了,矩阵S。那么这个SIGMA跟这个图有什么关系呢?
熟悉数学的人都知道了。从第1到第4课的关系,
1到第4课的关系,.50,
1到4课的关系呢,是.73,
乘以.69出来的,
就是.50,为什么要.73,为什么要.69呢? 因为
.73 乘以 .69呢就等于 .50,.50跟你输进的
原来的数据.50最接近。就是1到4的关系。
所以它就找一些数字,一些value出来, 令到它乘起来,越接近原来的.50,
这个是最好了。你会就是追问,那么乘出来.50
有很多种组合方法啊。
那怎么样 为什么是.73
为什么.69呢,只是要配合其他位置也是很好了。我们再来看
1跟6的关系。1跟6的关系呢,
这是原来是.07的。1跟6的关系,
1跟6的关系呢,那么它直接带一些数字了,那几个乘出来.07那原来是
.73,
乘以.19,然后再乘以
.68, 乘出来呢是.10的。
.10就跟.07有一点距离了,那么你会问,
为什么这
.73 .19
跟 .68 为什么不减低一点点令到我们乘出来刚好是.07,
不是更加好吗?这是对的。要是我们将三个数的
其中一个减低一点点,那么乘出来刚好是.07,就能够
产生原来的.07的关系了。
不过要小心,我们随便将其中一个减低一点点呢, 其他的地方不吻合又会增多了。
所以.73,.19,
.68呢是最好的一套数字了。
我们改动其中任何一个呢,都会令到我们其他的吻合又差一点了。
这是互相牵引的。改动一个,就整个 相关里面的很多位置呢,都会被改动的。我们再来一次。
这次我们输进去的只是一个相关矩阵S了,
这个S什么呢,是根据研究做出来的相关来的。
那么我们说一般研究结果呢只是一个S矩阵了。
然后你再提供给电脑呢,是你自己想的关系是怎么样,你有一个图的。有一个模型的。
那么电脑呢就根据你这个图呢,就
载一套数字我们叫parameter,载一套parameter。
这套parameter是怎么找出来呢,它们是希望 尽量跟你这一套数据越接近越好了。
你本来某一个位置.50的,它们尽量就是放一些parameter进去,一些数字进去,- 参数进去
令到它产生出来是越接近.50越好。
它有没有办法令到百分之一百吻合呢?是不能够的。
因为它将某一个数字要改大,令到它能够这一部分吻合呢,
它另外一些部分呢,则会差距就会大了。
因为它互相牵引的。所以它只可以找它一套数字。
令到这两个S跟SIGMA的距离总和是越小越好了。
但是一般情况呢是没有办法百分之一百吻合的。
好了,那么这个模型是对还是错呢?这个模型能不能够
代表S里面的关系呢?我们说要是 找到最后那个SIGMA跟S的距离
要是很小呢,我们就说这个SIGMA跟S很小呢,我们说你这个模型就能够
代表数据里面S里面的关系了。
要是我们所提出这个模型最后算出来这些参数所产生的SIGMA
最后跟S还是有很大的距离呢,我们说你所提出的模型就错了。
你将这些科目分类就错了。譬如我们提出另外一个分类法,这1,2,3是一组, 4,5,6一组,7,8,9一组我们这样分类。
这样分类我们发觉呢,我们尽量找一套最好的参数呢
所产生的SIGMA呢距离S是很远很远的。
所以我们的结论就说什么呢,你这一个模型 不能够代表S里面的关系的。