作者ffaarr (远)
看板Wikipedia
标题几个条目平均品质的数据
时间Thu Nov 17 19:21:32 2005
仅取内部琏结前20名板本作比较。同样是到十月底的资料。
一、平均每个条目的内部琏结数:
1、德语23.4
2、希伯来语 23.0
3日语21.5(较旧的资料)
4英语 20.6
5捷克语 20.5
6中文 19.2
7法语 18.8
8西班牙语 18.4
9荷兰语 17.2
10匈牙利语15.4
11俄语 15.0
12挪威语14.7
13芬兰语 14.3
14义大利语 14.2
15葡萄牙语 13.4
16加泰隆尼亚语 13.2
17波兰语 12.6
18瑞典语 11.5
19世界语 11.5
20丹麦语 10.9
值得一提的是条目仅数千条的越南语 平均内部琏结数居然有28.2。
二、每个条目的平均编辑数:
1英语23.4
2德语 23.2
3希伯来语17.6
4中文 16.8
5荷兰语 16.7
6日语 15.8 (较旧的资料)
7法语 15.6
8西班牙语15.1
9芬兰语 10.8
10匈牙利语10.5
11俄语 10.1
12丹麦语 9.9
13波兰语 9.8
14世界语 8.8
15义大利语 8.6
16捷克语 8.6
17葡萄牙语 8.5
18瑞典语 8.3
19加泰隆尼亚语 8.3
20挪威语 8.1
三、平均每条目字节数
1 希伯来语 4315
2俄语 3665
3 捷克语 3555
4 德语 3108
5 日语 2895
6 英语 2729
7西班牙语 2722
8 中文 2647
9法语 2605
10匈牙利语 2582
11义大利语 2162
12芬兰语 2149
13荷兰语 2110
14加泰隆尼亚语 2025
15波兰语 1933
16葡萄牙语 1849
17挪威语 1648
18世界语 1513
19丹麦语 1353
20瑞典语 1235
最多的又是越南语,达到 5192。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 211.74.7.89
1F:推 FlyinDeath:中文的字节怎麽算?又不是拼音文字... 11/18 13:22
2F:推 ffaarr:一个汉字是三个字节 11/18 15:41
3F:→ ffaarr:字节数是比蝇不公平的,我怀疑西里尔字母也是一字母3字节 11/18 15:42
4F:→ ffaarr:所以俄语、捷克语会这麽多,希伯来字母也可能很类似 11/18 15:43
5F:推 andyjy12:字节是什麽阿?是指一般说的"词"或英文中的"字"吗? 11/19 00:35
6F:推 ffaarr:是指一个「码」,如英文是一个字母一码,3个码代表一个汉字 11/19 08:34
7F:推 andyjy12:多谢 11/19 12:26
8F:→ andyjy12:那如果统计方法是用标点符号的数量呢?该不会有语文不用 11/19 12:28
9F:→ andyjy12:标点符号吧.... 11/19 12:29
10F:推 ffaarr:大概没办法,因为中文用全形,西文用半形,是不同的东西 11/20 21:59
11F:→ ffaarr:电脑大概没办法判断出来 11/20 22:00