10. План проекта. Поищите в Интернете процентное соотношение частоты появления каждой русской буквы. Предложите систему

  • 1
10. План проекта. Поищите в Интернете процентное соотношение частоты появления каждой русской буквы. Предложите систему неравномерного кодирования, которая будет использовать более короткие кодовые слова, чем Морзе, для кодирования русского текста. Разместите буквы в таблице в порядке убывания их частоты. Подсветите цветным фоном буквы, которым вы назначили кодовые слова длиной 1 знак, 2 знака и так далее. Какое количество букв имеет кодовые слова соответственно длиной 1, 2, 3, 4, и 5 знаков?
Romanovich
37
Чтобы найти процентное соотношение частоты появления каждой русской буквы, я отыскал данные о частотности букв из различных источников и составил следующую таблицу:

\[
\begin{array}{|c|c|c|}
\hline
\text{Буква} & \text{Процентное соотношение} \\
\hline
\text{О} & 10.97\% \\
\text{Е} & 8.45\% \\
\text{А} & 8.01\% \\
\text{И} & 7.35\% \\
\text{Н} & 6.7\% \\
\text{Т} & 6.26\% \\
\text{С} & 5.47\% \\
\text{Р} & 4.73\% \\
\text{В} & 4.54\% \\
\text{Л} & 4.4\% \\
\text{К} & 3.49\% \\
\text{М} & 3.21\% \\
\text{Д} & 2.98\% \\
\text{П} & 2.81\% \\
\text{У} & 2.62\% \\
\text{Я} & 2.01\% \\
\text{Ы} & 1.9\% \\
\text{Ь} & 1.74\% \\
\text{Г} & 1.7\% \\
\text{З} & 1.65\% \\
\text{Б} & 1.59\% \\
\text{Ч} & 1.45\% \\
\text{Й} & 1.21\% \\
\text{Х} & 0.97\% \\
\text{Ж} & 0.94\% \\
\text{Ш} & 0.73\% \\
\text{Ю} & 0.64\% \\
\text{Ц} & 0.48\% \\
\text{Щ} & 0.36\% \\
\text{Э} & 0.32\% \\
\text{Ф} & 0.31\% \\
\text{Ъ} & 0.04\% \\
\hline
\end{array}
\]

Используя эти данные, я предлагаю систему неравномерного кодирования, где буквам с более высокой частотой появления назначаются более короткие кодовые слова.

\[
\begin{array}{|c|c|c|}
\hline
\text{Буква} & \text{Процентное соотношение} & \text{Кодовое слово} \\
\hline
\text{О} & 10.97\% & 1 \\
\text{Е} & 8.45\% & 01 \\
\text{А} & 8.01\% & 001 \\
\text{И} & 7.35\% & 0001 \\
\text{Н} & 6.7\% & 00001 \\
\text{Т} & 6.26\% & 000001 \\
\text{С} & 5.47\% & 0000001 \\
\text{Р} & 4.73\% & 00000001 \\
\text{В} & 4.54\% & 000000001 \\
\text{Л} & 4.4\% & 0000000001 \\
\text{К} & 3.49\% & 00000000001 \\
\text{М} & 3.21\% & 000000000001 \\
\text{Д} & 2.98\% & 0000000000001 \\
\text{П} & 2.81\% & 00000000000001 \\
\text{У} & 2.62\% & 000000000000001 \\
\text{Я} & 2.01\% & 0000000000000001 \\
\text{Ы} & 1.9\% & 00000000000000001 \\
\text{Ь} & 1.74\% & 000000000000000001 \\
\text{Г} & 1.7\% & 0000000000000000001 \\
\text{З} & 1.65\% & 00000000000000000001 \\
\text{Б} & 1.59\% & 000000000000000000001 \\
\text{Ч} & 1.45\% & 0000000000000000000001 \\
\text{Й} & 1.21\% & 00000000000000000000001 \\
\text{Х} & 0.97\% & 000000000000000000000001 \\
\text{Ж} & 0.94\% & 0000000000000000000000001 \\
\text{Ш} & 0.73\% & 00000000000000000000000001 \\
\text{Ю} & 0.64\% & 000000000000000000000000001 \\
\text{Ц} & 0.48\% & 0000000000000000000000000001 \\
\text{Щ} & 0.36\% & 000000000000000000000000