Радиоэлектроника и телекоммуникации
Имеем исходный текст: см. приложение А
Далее подвергаем его фильтрации путем удаления символов не принадлежащих заданному алфавиту │А│. После фильтрации от символов не встречающихся в исходном алфавите получим текст, приведенный в приложении Б. Для данного варианта |A|=14
Определим вероятности Р(аi) появления символов первичного алфавита в профильтрованном тексте. Используем формулу:
Р(аi)=N(ai)/N (2.1)
Где N(ai) -количество появлений символа ai в профильтрованном тексте, а N-это количество всех символов в профильтрованном тексте.
В данном случае N=2329 символов. Получим значения вероятностей Р(аi) появления символов аi первичного алфавита.
Результат представим в виде таблицы:
Таблица 2.1 - Вероятности появления символов в тексте
ai |
N(ai) |
Р(аi) |
_ |
628 |
0,269644 |
. |
38 |
0,016316 |
, |
99 |
0,042508 |
В |
144 |
0,061829 |
У |
91 |
0,039073 |
Д |
84 |
0,036067 |
Л |
150 |
0,064405 |
С |
157 |
0,067411 |
Н |
170 |
0,072993 |
А |
285 |
0,12237 |
О |
333 |
0,14298 |
Ъ |
0 |
0 |
Г |
75 |
0,032203 |
М |
75 |
0,032203 |
ВСЕГО |
2329 |
1 |
А={ _; , ; . ; В ; У ; Д ; Л ; С ; Н ; А ; О ; Ъ ; Г; М}, |А|=14
Другие стьтьи в тему
Разработка вычислительного блока системы электромагнитного позиционирования
Актуальность
развития методов точного определения координат и углов ориентации того или
иного объекта по отношению к некоторой заданной системе координат трудно
переоценить. Определение пространственных и угловых координат движущихся
объектов лежит в основе решения многих важных нау ...
Разработка проекта сети доступа по технологии GPON микрорайона №5 г. Минусинска
Тенденция развития телекоммуникационной сети начала ХХI века должна
отвечать времени, то есть быть высокоорганизованной, интеллектуальной,
автоматизированной, соответствовать техническому уровню высокоразвитых стран
мира, обеспечивать передачу разнообразных сообщений и предоставление
...