Nekaj statistike o slovenskih crkah. (Vec se je s tem ukvarjal Primoz Jakopin, glej COBISS.) Vseh znakov: 3.806.201 Povprecna dolzina besede: 4.660946 0 0.080403 A 1 0.015459 B 2 0.005973 C 3 0.011166 "C 4 0.027519 D 5 0.083074 6 0.001512 7 0.012892 8 0.008142 9 0.073951 10 0.035728 11 0.030049 12 0.038402 13 0.028437 14 0.050200 15 0.072431 16 0.027010 17 0.040549 18 0.039723 19 0.007918 20 0.035094 21 0.015742 22 0.031359 23 0.016234 Z 24 0.004661 "Z 25 0.170272 presledek 26 0.036097 poljubno lo"cilo Entropija: Hp(2) je entropija pogojnih verjetnosti, da ``crki sledi crka'' Hv(1) = H(P) = \sum p_i log p_i: H(L) = lim_{n \to \infty} H(P^n)/n, kjer je P^n mno"zica vseh n-teric od "cistipisa Hp(1) = 4.242929 Hv(1) = 4.242929 Hp(2) = 3.456424 Hv(2) = 3.849674 Hp(3) = 2.998617 Hv(3) = 3.565987 Hp(4) = 2.493384 Hv(4) = 3.297836 Hp(5) = 2.089925 Hv(5) = 3.056253 Hp(6) = 1.764919 Hv(6) = 2.841030 Hp(7) = 1.416528 Hv(7) = 2.637530