看板Statistics
标 题Re: [统计] 相关系数的问题
发信站成大计中BBS (Wed Oct 26 11:20:19 2005)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!nckubbs
※ 引述《[email protected] (www)》之铭言:
: ※ 引述《[email protected] ()》之铭言:
: : 如果是比较两条 p.d.f. 曲线, f(x) 与 g(x), 可考虑
: : ∫(f(x)-g(x))^2 dx (*)
: : 这是模仿 density estimation 中的 IMSE (integrated
: : mean squared error) 准则的指标. IMSE 是
: : ∫E[(f*(x)-f(x))^2] dx 其中 f*(x) 是 f(x) 的估计量
: : 但前项指标 (*) 其实也是数学上的 Eculidean-norm 或
: : 2-norm.
: : 另一可考虑的拍标是 Kulback-Leibler divergence
: : ∫ln(f(x)/g(x)) f(x) dx
: : 其中对数在 information theory 习惯是取 2 为底,统计
: : 上则习惯取自然对数.
: 如果原始资料是离散的数值,并不具备有像f(x)般的函数曲线,
: 那麽要如何使用KL divergence来衡量两个数列的相似度呢?
: 例如,我有两个数列分别是 A: 3,4,6,,9,10,22,16,17.. (共m个)
: B: 7,9,25,21,13,17,... (共n个,且 m!=n)
: 谢谢 :)
既非该指标假设情况, 为甚麽要用该指标?
若要用, 请先用密求曲线(函数)去描述资料.
请从最前面的讨论开始看; 请参考密求何计的书籍或论文.
--
统计专业版需要你! 不论你是统计高手或初学, 是统计专业或应用领域人才, 欢迎光临!
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
批踢踢实业站 telnet://ptt.cc Statistics (统计学及统计软体版)
--
㊣Origin:《
成大计中 BBS 站 》[bbs.ncku.edu.tw] 来源:[140.116.52.117]