葡萄酒与酿酒葡萄理化指标与质量关系分析A题(总36页)
-CAL-FENGHAI.-(YICAI)-Company One1
-CAL-本页仅作为文档封面,使用请直接删除
承诺书
参赛队员 (打印并签名) :
题目 葡萄酒与酿酒葡萄理化指标与质量关系分析 关键词 t检验、Q型聚类分析、主成分分析、葡萄酒质量、理化指标
题目
摘 要
葡萄酒的品尝是一门学问。本文通过两组品评员对红葡萄酒(27个样本)与白葡萄酒(28个样本)的评分表入手,根据酿酒葡萄与葡萄酒的理化指标的内在联系,运用t检验、Q型聚类分析、主成分分析等方法,深入讨论酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响。
对于问题一:通过每组样本的总得分算出红葡萄与白葡萄的样本总方差,每组对应数据运用t检验进行统计。结果为T1=<,且P1=>;T2=<,且P2=>。所以两组品酒员对红葡萄酒、白葡萄酒的评价结果均无显著性差异。且第一组的方差比第二组大,所以第二组的结果更可信。
对于问题二:通过建立Q型聚类分析模型,以酿酒葡萄的理化指标和葡萄酒的质量为标准来对酿酒葡萄进行分类,用类平均法来求相似性度量得到红葡萄、白葡萄分级图。
对于问题三:对红葡萄与白葡萄共有的理化指标进行相关性分析,根据他们之间的相关系数,根据各个指标建立典型相关系数表,同时画出相关系数大的指标的关系图。
对于问题四:根据对葡萄与葡萄酒的理化性质的分类,并将其对应于对葡萄酒的外观、香气、口感和整体评价的影响,由第三问知道他们之间存在线性关系,则利用多元回归模型将他们拟合出一个线性方程,进而找出他们的联系,从而得出可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
关键词 :t检验、Q型聚类分析、主成分分析、葡萄酒理化性质、多元线性回归
一.问题重述
本次研究对象为两组红葡萄酒与白葡萄酒, 葡萄酒的主要质量指标为专业性评酒提供了依据,葡萄酒的主要质量指标大体可分为感官指标和理化指标两大类。尤其是感官品评,是目前国内外鉴定葡萄酒品质的主要手段。本论文从三大感官指标项目入手,分别是外观分析、香气分析、口感分析。其中每个项目中有几项指标。外观分析
包含澄清度和色调;香气分析包含纯正度、浓度和质量;口感分析包含纯正度、浓度、持久性和质量。理化指标主要指酒精含量(酒精度)、酸度和芳香物质浓度【1】。 每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
在研究葡萄酒的质量时,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系【2】,我
们需要研究葡萄酒和酿酒葡萄检测的理化指标与葡萄酒和葡萄的质量之间的关系。
综上所述,我们需要解决以下问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二.符号说明和模型假设
符号说明
n
样品数 方差 自由度 均值 标准差
S2 df
xj sj
模型假设
1、假设所选取的样本值真实可信。本文引用数据、资料均真实可靠。
2、假设全部品酒员符合品评葡萄酒的要求且在品评当天表达正常且真实的分数。 3、假设整个建模过程中忽略计算误差。
4、两组品酒员在评分时不会受另一组的影响。
5、假设二级指标的信息可以再一级指标中反映出来。
三.模型的建立与求解
1
问题分析
该题主要利用题目中的附件一的数据来进行求解,观察图表可以知道对葡萄酒的评分算得满分为100分,其中包括有十个评分项目,那么我们将品酒员给的十个项目分数相加来表示品酒员对这个酒样品的评价标准,这样每一个样品都有十个数据,然后两组之间对应样品号的数据就可以进行t检验,从而确定两组对同一个样品评价有无显著性差异,从而可以通过建立这个分组对应样品进行t检验的方法来解决第一小问。求得两组评价都无显著性差异之后,要确定评价结果的可信度我们可以通过比较方差来得出结果。
建模求解
首先对数据进行处理:
(1)求各品酒员对各样品的总分并排序形成矩阵; (2)求t;
(3)查t(df)和t(df),以便后面与t进行比较; (4)结合P与比较,判断是否有显著性差异; 求解过程:
t1212(x2n21x1)(x2x2)(x2(如果n212成立)1x1)(x2x2)nn2(1n1)121n2n(n1)用matlab编程运算得到红葡萄酒两组之间评价结果的t检验如下:
t1=[ ]
求t1的平均值得T1=<,且P1=> 所以两组品酒员对红葡萄酒的评价结果无显著性差异。
同理,对白葡萄酒的评价结果数据进行计算,t检验结果如下: t2=[ ]
求t2的平均值得T2=<,且P2=>
所以两组品酒员对白葡萄酒的评价结果无显著性差异。 Matlab运行结果如图一:
2
1)(
图一
因为两组的评价结果无显著性差异,那么对于可信度的问题可以用各品酒员对各个样品的评价结果的方差来求解。 求解方差:
1S((xix)2) (2)
n2在matlab中直接利用var函数进行方差的求解即可得出结果:
图二 3
由图分析可得,无论是对红葡萄酒还是对白葡萄酒的评价结果,所得到第一组的方差比第二组大,所以第二组品酒员对酒的评价结果比较稳定,可信度也比较强,那么第二组的结果更可信。
模型二建立:
通过建立Q型聚类分析模型,以酿酒葡萄的理化指标和葡萄酒的质量为标准来对酿酒葡萄进行分类,聚类分析是用数量化的方法描述事物之间的相似程度,而酿酒葡萄的理化指标和葡萄酒的质量就是几个用来判定样品之间相似程度的变量。如果每一个样品可以用十几个变量来描述的话,则在一个空间中变量可以看作这个空间的维数,每个样品就是这个空间的点,所以他们之间的相似程度就可以用他们之间的举例来体现了。
记各样品为w1,w2,......wi,每个样品的相关变量记为v1,v2,......vi;如果使用绝对值距离来测量点与点之间的距离,即使用短距离法来测量类与类之间的距离,这里使用欧氏距离法来计算,即
d(wi,wj)vikvjk,(n为每个样品的变量数) (3)
k1n用类平均法来求类与类间的相似性度量
D(Gi,Gj)1n1n2xqG1xPG2d(x,xqp),(其中i,j(1,2...n),n1n2n) (4)
然后再根据他们的距离长短即可得到分类结果。
求解:
用matlab计算如图三所示: 红葡萄分级结果:
4
图三
分类结果如下:
表 一 :红葡萄分四类 类别 样品号 第一类 2、3、9、23 第二类 4、5、6、7、10、12、13、14、15、16、17、18、19、20、21、22、24、25、26、27 第三类 1、8 第四类 11 表 二 :红葡萄分五类 类别 样品号 第一类 10 第二类 4、5、6、7、12、13、14、15、16、17、18、19、20、21、22、24、25、26、27 第三类 2、3、9、23 第四类 1、8 第五类 11 表 三 :红葡萄分六类 类别 样品号 第一类 20、26 第二类 4、5、6、7、12、13、14、15、16、17、18、19、21、22、24、25、27 第三类 10 第四类 2、3、9、23 第五类 1、8 第六类 11 同理对白葡萄进行分级:
5
图四
分类结果如下: 表 四 :白葡萄分四类
类别 第一类 样品号 2、3、4、5、9、10、12、14、17、19、20、21、22、23、24、25、26、28 第二类 第三类 第四类
表 五 :白葡萄分五类
类别 第一类 第二类 第三类 6、7、15、18 1、13 2、3、4、5、9、10、12、14、17、19、20、21、22、23、24、25、26、28 第四类 第五类
表 六 :白葡萄分六类
类别 第一类 第二类 第三类 第四类 第五类 第六类
6
17、22 2、3、4、5、9、10、12、14、19、20、21、23、24、25、26、28 6、7、15、18 1、13 8、11、16 27 样品号 8、11、16 27 样品号 1、6、7、13、15、18 8、11、16 27 .建立模型
找出酿酒葡萄与葡萄酒相同的理化指标【3】,进行相关性分析。
酿酒红葡萄与红葡萄酒对应的有十五个共同的理化指标,分别是:花色苷、单宁、总酚、总黄酮、白黎芦醇、反式白黎芦醇苷、顺式白黎芦醇苷、反式白黎芦醇苷、顺式白黎芦醇苷、DPPH半抑制体积、色泽L*\\a*\\b*\\H\\C。
对酿酒红葡萄的15个共同的理化指标分别进行编号为x1、x2、x3.......x15;对葡萄酒理化指标编号为x16、x17、x18.....x30。 第一步:对原始数据进行标准化处理
首先建立酿酒红葡萄理化指标与红葡萄酒的原始数据矩阵,即xij=[x1 x2
x3....x30],
i[1 27];j[1 30]。
然后对数据矩阵进行标准化处理,处理方式为
xijxj~ xijsj (5)
其中xj、sj分别表示矩阵xij每一列的均值和标准差。
第二步:求它们两两变量之间的相关系数。具体的相关系数见附件二。 表 七:选取典型的相关系数靠前的各个指标建立的典型相关系数表 红葡萄酒的理化性质 相关系数 酿酒 葡 萄 相关系数 酿酒葡萄 花色苷 单宁 总酚 总黄酮 白藜芦醇 反式白藜芦醇苷 花色苷 单宁 总酚 总黄酮 反式白藜芦醇 顺式白藜芦醇 DPPH自由基 (色(色泽) 泽)b*(D6C(D655) ) < < < < < 7
< < < < < < < < < < < < < < < < < < < < 顺式白藜芦醇 DPPH自由基 (色泽) L*(D65)
< < < < < < < < < < < < < < < < < < 同理找出白葡萄与白葡萄酒之间的共同指标,然后计算他们之间的相关系数矩阵,表八:选取典型的相关系数靠前的各个指标建立的典型相关系数表
白葡萄酒的理化性质 相关系数 酿酒 葡 萄 相关系数 酿酒葡萄 单宁 总酚 总黄酮 反式白藜芦醇苷
单宁 总酚 总黄酮 顺式白藜芦醇 (色泽)H(D65) < < < < < < < < < < < < 则由红葡萄相关系数表可得,红葡萄的理化性质与红葡萄有四个相关性比较大的因素:选定为花色苷,单宁,总酚和总黄酮;画出他们之间的关系图如下:
图五 图六
8
图七 图八
同理由白葡萄相关系数表可得,白葡萄的理化性质与白葡萄有四个相关性比较大的因素:选定为单宁,总酚和总黄酮;画出他们之间的关系图如下:
图九 图十
图十一
则可以得到红葡萄中的花色苷,单宁,总酚和总黄酮与红葡萄酒的理化性质呈正比关系,白葡萄中的单宁和总黄酮与白葡萄酒的理化性质呈正比关系,而白葡萄中的
9
总酚与白葡萄酒的理化性质大致呈反比关系。则可以得到葡萄与葡萄酒的理化性质大致有线性关系。
红葡萄和红葡萄酒的理化性质对葡萄酒质量的影响
1.外观
以x1,x2,...,x6为全部自变量,采用小二乘法拟合一个多元回归模型得到葡萄酒
ˆ1a1*x1a2*x2...a6*x6式子,要求ˆ1,得到如y的质量评分的外观部分ya1,a2,...,a6的秩,可以通过建立多元回归模型来求得,求解过程如下:
ˆ18.9440.0003*x10.0419*x20.0615*x30.0010*x40.1124*x50.0518*x6 (6) y表九(t检验值):
t t的检验值 常量 t1 t2 t3 t4 t5 t6 这个回归模型的复判定系数 R2=
图十二
2.香气
首先将红葡萄与红葡萄酒的各种芳香物质进行并列建立矩阵,然后用相应样品的均值填补缺失值。,求出它们与红酒质量评分中香色部分的相关系数。
如下表1所示是选取相关系数靠前的几个芳香物质。(其他具体相关系数见附件三)
10
表十:相关系数表 (E)-变量 3,7-二甲基-2 相关系数 变量 相关系数 壬酸乙酯 十二乙酸乙酯 正十二烷酸 乙酸辛酯 丁二酸二乙酯 2-甲基-1-丙醇 异山梨糖醇 正十三烷 乙酸正丙酯 丙酸乙酯 反式-4-癸烯酸乙酯 对这些变量按表中顺序进行编号分别为x1、x2、x3......x12;
以上述所有变量为自变量,采用最小二乘法拟合一个多元回归模型,有:
ˆ19.84360.0522x10.5588x20.0262x30.1185x40.0615x50.0366x60.1964x7 y0.1630x80.0374x90.0286x100.0598x110.1157x12 (7)
这个回归模型的复判定系数R2= 调整复判定系数R2=, 模型的标准剩余差为 对各个参数的t检验的结果见表2 表十一:t检验值 t 常t1 t2 t3 t4 t5 t6 量 t检验量 所以这个模型的t检验和F检验都符合。
3.口感
t7 t8 t9 t10 t11 t12 ˆ2a1*x1a2*x2...a6*x6 y(8)
ˆ225.74690.013*x10.0113*x20.0165*x30.1856*x40.0187*x50.2416*x6y(9)
表十二:t检验值
t t的检验值 常量 t1 t2 t3 t4 t5 t6 11
这个回归模型的复判定系数 R2=
图十三
4.整体评价
ˆ2a1*x1a2*x2 (10) yˆ38.03630.0098*x10.0001*x2 (11) y
图十四
表十三:t检验值
T 常量 t1 t2 12
t的检验值
这个回归模型的复判定系数 R2=
白葡萄和白葡萄酒的理化性质对葡萄酒质量的影响: 1.外观
以x1,x2,...,x5为全部自变量,采用小二乘法拟合一个多元回归模型得到葡萄酒
ˆ1a1*x1a2*x2...a5*x5式子,要求ˆ1,得到如y的质量评分的外观部分ya1,a2,...,a5的秩,可以通过建立多元回归模型来求得,求解过程如下: ˆ15.81360.0195*x1-0.0133*x20.1205*x30.1063*x40.8350*x5 (12) y表十四:t检验值
t t的检验值 常量 t1 t2 t3 t4 t5 这个回归模型的复判定系数 R2=
2.香气
下面用上述同样的方法处理白葡萄和白葡萄酒的芳香物质与其香味的关联。
13
如下表是其所选取的相关系数靠前的几个芳香物质。(其他具体见附件4) 表十五:相关系数表 邻苯二甲二甘2-己(E)-2-甲辛酸乙酸1-辛变量 酸二醇单乙醇 烯酸2-已基-1-丙酯 庚酯 醇 异丁乙醚 乙酯 烯醛 丙醇 酯 相关 系数 3,7-二甲7-甲2-苯2-甲基-苯乙氧基辛酸乙酸乙基1-庚癸酸变量 基己2,6-醇 十一甲酯 戊酯 乙酸醇 甲酯 酸 辛二碳烷 酯 烯酸甲酯 相关 系数 对这些变量进行编号分别为x1、x2.....x20
以上述所有变量为自变量,采用最小二乘法拟合一个多元回归模型,有:
1-辛醇(酒) 十六烷酸乙酯 ˆ20.60831.8018x10.2563x25.1510x30.0087x42.3484x53.4607x60.0602x73.1688x8y-0.4660x90.3822x101.0979x110.2865x120.3310x130.2535x141.2084x150.0137x16 -0.1041x170.0433x181.4956x190.0644x20 (13) 这个回归模型的复判定系数R2=
模型的标准剩余差为
对各个参数的t检验的结果见表4 表十六:t检验值 t 常数 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t检 验量 t t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t检 验量 14
所以这个模型的t检验和F检验都符合.
3.口感
ˆ233.64660.0614*x10.0014*x2-0.071*x30.3359*x4-0.1112*x5 (14) y表十七:t检验值
t t的检验值 常量 t1 t2 t3 t4 t5
这个回归模型的复判定系数 R2=
图十六
4.整体评价
ˆ39.10720.0057*x1-0.0014*x2 (15) y表十八:t检验值
t t的检验值 常量 t1 t2
这个回归模型的复判定系数 R2=
15
图十七
由此得到葡萄与葡萄的理化性质与葡萄质量的外观、香气、口感和整体之间都存在一个线性关系,则可以得出用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
四.模型分析:
检验
优点:用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著,主要用于样本含量较小总体标准差σ未知的正态分布资料。
局限性:需已知一个总体均数;当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设。当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0。因为,其不显著结果的原因有可能是样本数量不够拒绝H0 ,因此,结论不能绝对化。 Q型聚类分析
优点:可以综合利用多个变量的信息对样本进行分类;分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果;聚类分析所得到的结果比传统分类方法更细致、全面、合理。
16
局限性:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。
主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差- 协方差结构。 优点:利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息;它通过计算综合主成分函数得分,对客观经济现象进行科学评价;它在应用上侧重于信息贡献影响力综合评价。
缺点:当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确;命名清晰性低。
多元线性回归:充分表现出一个变量受多个变量的影响的情况。 优点:线性回归分析法在分析多因素模型时,更加简单和方便
缺点:有时候在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了在使用因子试忽略了其多样性和不可测性,使得回归分析在某些情况下受到限制而导致结果不准确。
参考文献
[1]蔺红苹,邱翠婵,刘嘉玲《自酿葡萄酒的卫生指标和理化指标的检测》,湛江
师范学院学报 ,2010 年6 月第31 卷第3 期
[2]王金甲,《基于理化指标的葡萄酒质量的可视化评价研究》,《燕山大学学报》,第34卷第2期,2010年3月;
[3]彭德华,《影响葡萄酒质量的主要因素分析》[J] ,《中外葡萄与葡萄酒》,2004,5,40-44;
[4]程相,陈家旭,吴文鑫,《应用多元统计分析葡萄、葡萄酒理化指标与葡萄酒质量的相关性》,厦门大学信息科学与技术学院,厦门 361005
17
附录
(显著性差异的检验)
clear; Clc; x=load(''); x1=x(1:27,:); x2=x(28:end,:); n=length(x1); for i=1:n
s1(1,i)=(sum((x1(i,:)-mean(x1(i,:))).^2)+sum((x2(i,:)-mean(x2(i,:))).^2))/(10*(10-1)); t1(1,i)=(abs(mean(x1(i,:))-mean(x2(i,:))))/(sqrt(s1(1,i))); [h1(1,i),p1(1,i)]=ttest2(x1(i,:),x2(i,:),,0); end y=load(''); y1=y(1:28,:); y2=y(29:end,:); m=length(y1); for i=1:m
s2(1,i)=(sum((y1(i,:)-mean(y1(i,:))).^2)+sum((y2(i,:)-mean(y2(i,:))).^2))/(10*(10-1)); t2(1,i)=(abs(mean(y1(i,:))-mean(y2(i,:))))/(sqrt(s2(1,i))); [h2(1,i),p2(1,i)]=ttest2(y1(i,:),y2(i,:),,0); end T1=mean(t1); T2=mean(t2); %红葡萄酒检验结果 c1=; %t(18,)=,df=18 c2=; %t(18,)=,df=18 for i=1:n C1(i)=c1; C2(i)=c2; end X1=1:n; subplot(2,1,1);
plot(X1,t1,'o r-',X1,C1,'b-',X1,C2,'g-'); title('红葡萄酒的t检验结果');
18
legend('t值','t(df)','t(df)'); xlabel('红葡萄酒的样品号'); ylabel('t值'); %白葡萄酒的检验结果 subplot(2,1,2); for i=1:m C1(i)=c1; C2(i)=c2; end X2=1:m;
plot(X2,t2,'o r-',X2,C1,'b-',X2,C2,'g-'); title('白葡萄酒的t检验结果'); legend('t值','t(df)','t(df)'); xlabel('白葡萄酒的样品号'); ylabel('t值');
(可信度) clear; clc;
X=load(''); Y=load(''); K=27;
x1=X(1:27,:);
x2=X(28:end,:); y1=Y(1:28,:); y2=Y(29:end,:); n=length(x1); m=length(y1); a1=var(x1'); a2=var(x2'); b1=var(y1'); b2=var(y2'); t1=1:27; t2=1:28; subplot(2,1,1);
plot(t1,a1,'r',t1,a2,'b');
legend('第一组红葡萄酒方差','第二组红葡萄酒方差'); xlabel('红葡萄酒样品号'); ylabel('方差'); subplot(2,1,2);
plot(t2,b1,'r',t2,b2,'b');
legend('第一组白葡萄酒方差','第二组白葡萄酒方差');
19
xlabel('白葡萄酒样品号'); ylabel('方差');
(红葡萄分级)(需要进行数据导入) clc;
x=mean(hong,2); gj=[gj,x]; gj=zscore(gj); y=pdist(gj);
z=linkage(y,'average'); dendrogram(z);
title('红葡萄分级结果'); for k=4:6
fprintf('划分成%d类的结果如下:\\n',k) T=cluster(z,'maxclust',k); for i=1:k
tm=find(T==i);
tm=reshape(tm,1,length(tm));
fprintf('第%d类的有%s\\n',i,int2str(tm)); end if k==6 break end
fprintf('**********************************\\n'); end
(白葡萄分级)(需要进行数据导入) x=mean(bai,2); gj=[ww,x]; gj=zscore(gj); y=pdist(gj);
z=linkage(y,'average'); dendrogram(z);
title('白葡萄分级结果'); for k=4:6
fprintf('划分成%d类的结果如下:\\n',k) T=cluster(z,'maxclust',k); for i=1:k
tm=find(T==i);
tm=reshape(tm,1,length(tm));
fprintf('第%d类的有%s\\n',i,int2str(tm)); end if k==6
20
break end
fprintf('**********************************\\n'); end
(红葡萄的相关系数求解) gj=hongzong; gj=zscore(gj); r=corrcoef(gj); w=r(16:end,1:15); k=ones(100,2); t=1;
for i=1:15 for j=1:15 if w(i,j)> k(t,:)=[i,j]; t=t+1; end end end
k=ones(t,3); t=1;
for i=1:15 for j=1:15 if w(i,j)>
k(t,:)=[i,j,w(i,j)]; t=t+1; end end end
(白葡萄的相关系数求解) gj=baizong; gj=zscore(gj); r=corrcoef(gj); w=r(15:end,1:14); k=ones(100,2); t=1;
for i=1:14 for j=1:14 if w(i,j)> k(t,:)=[i,j]; t=t+1;
21
end end end
k=ones(t,3); t=1; for i=1:14 for j=1:14 if w(i,j)>
k(t,:)=[i,j,w(i,j)]; t=t+1; end end end
data=xx; %红葡萄外观拟合 k1=data(:,1:7); [n,m]=size(k1);%样本数 y1=k1(:,1);
x1=[ones(n,1),k1(:,2:end)];
[b1,bint,r,rint,stats]=regress(y1,x1); %stats(4)返回的是残差的样本方差 subplot(3,1,1); rcoplot(r,rint); title('红葡萄外观拟合'); r21=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x1'*x1); %计算X'*X的逆矩阵 tm=diag(tm); %提出逆矩阵的对角线元素
rmse=sqrt(stats(4)); %计算剩余标准差(残差的样本标准差) t1=b1./sqrt(tm)/rmse ; %求t统计量的值 %红葡萄口感拟合 k2=data(:,8:14); [n,m]=size(k2);%样本数 y2=k2(:,1);
x2=[ones(n,1),k2(:,2:end)];
[b2,bint,r,rint,stats]=regress(y2,x2); %stats(4)返回的是残差的样本方差 rcoplot(r,rint); title('红葡萄口感拟合'); r22=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x2'*x2); %计算X'*X的逆矩阵
22
tm=diag(tm); %提出逆矩阵的对角线元素
rmse=sqrt(stats(4)); %计算剩余标准差(残差的样本标准差) t2=b2./sqrt(tm)/rmse; %求t统计量的值 %红葡萄的整体拟合 k3=data(:,15:17); [n,m]=size(k3);%样本数 y3=k3(:,1);
x3=[ones(n,1),k3(:,2:end)];
[b3,bint,r,rint,stats]=regress(y3,x3); %stats(4)返回的是残差的样本方差 rcoplot(r,rint);
title('红葡萄整体评价拟合'); r23=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x3'*x3); %计算X'*X的逆矩阵 tm=diag(tm); %提出逆矩阵的对角线元素
rmse=sqrt(stats(4)); %计算剩余标准差(残差的样本标准差) t3=b3./sqrt(tm)/rmse ; %求t统计量的值
data=xx; %白葡萄外观拟合 k1=data(:,1:6); [n,m]=size(k1);%样本数 y1=k1(:,1);
x1=[ones(n,1),k1(:,2:end)];
[b1,bint,r,rint,stats]=regress(y1,x1); %stats(4)返回的是残差的样本方差 subplot(1,1,1); rcoplot(r,rint); title('白葡萄外观拟合'); r21=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x1'*x1); %计算X'*X的逆矩阵 tm=diag(tm); %提出逆矩阵的对角线元素
rmse=sqrt(stats(4)); %计算剩余标准差(残差的样本标准差) t1=b1./sqrt(tm)/rmse ; %求t统计量的值 %白葡萄口感拟合 k2=data(:,7:12); [n,m]=size(k2);%样本数 y2=k2(:,1);
x2=[ones(n,1),k2(:,2:end)];
23
[b2,bint,r,rint,stats]=regress(y2,x2); %stats(4)返回的是残差的样本方差 rcoplot(r,rint); title('白葡萄口感拟合'); r22=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x2'*x2); %计算X'*X的逆矩阵 tm=diag(tm); %提出逆矩阵的对角线元素
rmse=sqrt(stats(4)); %计算剩余标准差(残差的样本标准差) t2=b2./sqrt(tm)/rmse; %求t统计量的值 %白葡萄的整体拟合 k3=data(:,13:15); [n,m]=size(k3);%样本数 y3=k3(:,1);
x3=[ones(n,1),k3(:,2:end)];
[b3,bint,r,rint,stats]=regress(y3,x3); %stats(4)返回的是残差的样本方差 rcoplot(r,rint);
title('白葡萄整体评价拟合'); r23=stats(1); %提出复判定系数
ad_r2=1-(1-r2)*(n-1)/(n-m-1); %计算调整复判断系数 f=stats(2); %提出F统计量
tm=inv(x3'*x3); %计算X'*X的逆矩阵
tm=diag(tm); %提出逆矩阵的对标准差(残差的样本标准差) t3=b3./sqrt(tm)/rmse ; %求t统计量的值 角线元素 rmse=sqrt(stats(4)); %计算剩余
%求红葡萄芳香物质的相关系数的程序: gj=hongfanxiangting; gj=zscore(gj); r=corrcoef(gj); r=r(:,129); r=abs(r); [B,IX]=sort(r)
%求红葡萄芳香物质多元回归模型程序 x=hongfanxiangting; x1=x(:,54); x2=x(:,107); x3=x(:,37); x4=x(:,14); x5=x(:,75); x6=x(:,7);
24
x7=x(:,91); x8=x(:,125); x9=x(:,102); x10=x(:,127); x11=x(:,60); x12=x(:,103); y=x(:,129);
data=[x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 y]; [n,m]=size(data);m=m-1;
x=[ones(27,1),data(:,1:12)]; y=data(:,13);[b,bint,r,rint,stats]=regress(y,x) r2=stats(1)
ad_r2=1-(1-r2)*(n-1)/(n-m-1) f=stats(2) tm=inv(x'*x); tm=diag(tm);
rmse=sqrt(stats(4)) t=b./sqrt(tm)/rmse
%求白葡萄芳香物质的相关系数的程序: gj=baifanxiangting; gj=zscore(gj); r=corrcoef(gj); r=r(:,129); r=abs(r); [B,IX]=sort(r)
%求红葡萄芳香物质多元回归模型程序 x=baifanxiangting; x1=x(:,126); x2=x(:,97); x3=x(:,89); x4=x(:,58); x5=x(:,80); x6=x(:,77); x7=x(:,21); x8=x(:,94); x9=x(:,65); x10=x(:,93); x11=x(:,101); x12=x(:,110); x13=x(:,116); x14=x(:,81); x15=x(:,49);
25
x16=x(:,18); x17=x(:,106); x18=x(:,84); x19=x(:,95); x20=x(:,118); y=x(:,129);
data=[x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 y]; [n,m]=size(data);m=m-1;
x=[ones(28,1),data(:,1:20)]; y=data(:,21); [b,bint,r,rint,stats]=regress(y,x) r2=stats(1)
ad_r2=1-(1-r2)*(n-1)/(n-m-1) f=stats(2) tm=inv(x'*x); tm=diag(tm); rmse=sqrt(stats(4)) t=b./sqrt(tm)/rmse
26
因篇幅问题不能全部显示,请点此查看更多更全内容