Сравнение поздравительных речей Путина, Лукашенко и Турчинова на День Победы – Alexander Matrunich: notes about paragliding, genealogy and data analysis

Сравним речи, которые произнесли руководители России, Белоруссии и Украины 9 мая 2014 года.
Сделаем это с помощью визуализации текстов в виде облака слов.

Облако слов со сравнением частот слов в речах Путина, Лукашенко и Турчинова

Как интерпретировать график? Размер шрифта, которым изображено слово, показывает относительную частоту, с которой данное слово встречалось в речи. Цвет показывает, в речи какого из президентов данное слово занимает наибольшую долю. Например, слово «победа» (и его формы) встречалось у Лукашенко 5 раз, у Путина – 3, у Турчинова – 5. Понятно, что слово должно попасть или к Лукашенко, или к Турчинову. Но у Лукашенко слово «победа» занимает 0,89% от массива учтённых слов, а у Турчинова – 2,8%, соответственно оно попадает в украинскую часть графика.

У Лукашенко много слов с маленьким размеров шрифта – это значит, что он говорил больше, чем остальные спикеры, размер словаря его выступления больше, и на каждое слово у белорусского президента приходится меньшая относительная частота. Действительно, у Лукашенко зафиксировано 562 слова, у Путина – 229, у Турчинова – 177.

Чем схожи выступления спикеров? Это можно проверить с помощью облака сходства. Здесь приведены слова, которые встречались одновременно у всех трёх выступающих. Чем больше размер шрифта, тем выше средняя доля встречаемости слова.

Облако сходства текстов выступлений Лукашенко, Путина и Турчинова на День Победы

При подготовке из текстов выступлений были удалены стоп-слова (предлоги и пр.), а оставшиеся слова были приведены к исходной словоформе с помощью программы MyStem от компании Яндекс. Поскольку определение первичной словоформы происходит в автоматическом режиме без учёта контекста, некоторые слова преобразованы некорректно. Например, слово «дуг» в речи Путина в оригинале звучало как «Дуге». Обработка данных произведена в среде статистической обработки данных R. Более подробно о создании графиков в виде облака слов можно ознакомиться в публикации Обработка естественно-языковых текстов в R: облако слов.

Источники информации

Турчинов поздравил украинцев с Днем Победы: полный текст обращения. Информационное Агентство 112.ua
Владимир Путин присутствовал на военном параде в ознаменование 69‑й годовщины Победы в Великой Отечественной войне. Администрация Президента РФ
Выступление Президента Республики Беларусь А.Г.Лукашенко на церемонии возложения венков к монументу Победы. Пресс-служба Президента Республики Беларусь

Alexander Matrunich on Reverse Engineering Tempest Weathermeter Bluetooth Logs2026-03-29
Hey! As I understand the compass readings are coming not from the device but from the smartphone. The first bytes…
Aaron on Reverse Engineering Tempest Weathermeter Bluetooth Logs2026-03-29
Hey thanks for sharing this! Was super helpful. Curious if you've figured out the compass encoding of the first two…
Gramps инструкция на русском — Инструкции для вас on Gramps: приложение для исследований и анализа в генеалогии2025-05-24
[…] Источник […]
Генеалогические онлайн-сервисы для семей с корнями в России, Украине и Белоруссии | Alexander Matrunich is here on Gramps: приложение для исследований и анализа в генеалогии2022-09-06
[…] выглянуть за пределы своего генеалогического огорода Gramps и расширить подходы к изучению семейной истории с […]
Alexander Matrunich on Свободный софт для социологических исследований2022-02-10
Дела давно минувших дней: десять лет назад что ли :) Видео точно не было, а текст, наверно, не сохранился. Если…