发布网友 发布时间:2022-04-25 14:31
共1个回答
热心网友 时间:2023-10-09 06:12
数据不正态是非常常见的问题,很多人一旦发现数据不正态,往往第一反应是寻求变换,常用的就是Box-Cox变换。如果还不行,就直接上非参数了。我的意见是先等一等,弄清不正态的原因再说。数据不正态的表现形式根据我个人的经验和认识,数据不正态大致有以下一些原因:数据本来就不应该是正态的如可靠性研究中,数据基本上是服从指数分布或韦伯分布的;在设备维护中,也不服从正态分布;一个城市也不可能是正态分布的;居民可支配收入也是严重右偏分布;客户满意度调查中,如果是分打分,通常会集中在分,而分是截尾的,不可能有大于分的,因此它也不可能是正态的。如果明确知道样本数据所代表的总体本来就不是正态分布的,可以考虑寻求变换,通常都会找到恰当的变换参数。但有些数据也不一定能够变换成功,如分辨力很低的数据数据的取值很少,如像客户满意度调查这样的截尾数据,这时可以采用非参数检验来进行分析。