Визуальная диагностика простой линейной регрессии с ggvis

Продолжаю тему с однофакторым регрессионным анализом в R. Теперь мне интересно применить инструменты визуализации, доступные в R-библиотеке ggvis, для диагностики регрессионной модели. Здесь же мы применяем перенаправление с помощью функции %>%.

Напомню, что я использую данные, сопровожающие книгу An Introduction to Statistical Learning with Applications in R. Подготовка данных и построение модели было произведено в . . . → Читать далее: Визуальная диагностика простой линейной регрессии с ggvis

Однофакторный линейный регрессионный анализ в R

На основе книги An Introduction to Statistical Learning with Applications in R авторов Gareth James, Daniela Witten, Trevor Hastie и Robert Tibshirani. Бесплатная копия книги в PDF-формате, или заказ бумажной копии книги на Amazon.

library(ISLR) library(ggvis) library(dplyr)

Подготовка данных

Работаем с массивом Auto из пакета ISLR.

# Загружаем массив Auto в . . . → Читать далее: Однофакторный линейный регрессионный анализ в R

Что такое грамматика графики ggplot2 (ч.3)

Вы открыли продолжение статьи об основах ggplot2. Читайте начало в

Что такое грамматика графики ggplot2 (ч.1) ggplot2: сопоставления, визуальные средства, статистические преобразования и слои Подписи осей графика в ggplot2

Снова вернёмся к начальному графику из первой части:

fig <- ggplot(data = cars, aes(x = speed, y = dist)) + geom_point() fig

Что такое грамматика графики ggplot2 (ч.2)

Продолжение. Читайте начало в Что такое грамматика графики ggplot2 (ч.1)

Читайте продолжение в Названия элементов графика ggplot2: название графика, осей, легенд

Визуальные средства и геометрические объекты

Визуальные средства для отрисовки геометрических объектов типа «точка» (point) — это расположение по горизонтали (x) и вертикали (y), цвет границы (colour) и цвет заливки (fill), размер (size), форма (shape), . . . → Читать далее: Что такое грамматика графики ggplot2 (ч.2)

Оптимизация расходов на услуги сотовой связи (черновик)

Однажды я организовывал в Пскове опрос пешеходов, целью которого было выявить, какой из ряда планируемых тарифов сотового оператора больше нравится респондентам. После пары дней работы мои интервьюеры взвыли: с их точки зрения никакой существенной разницы между вариантами не было, хотя респонденты уверенно совершали свой выбор.

Управленческая проблема

Я задался вопросом, схожим с тем, который мучил . . . → Читать далее: Оптимизация расходов на услуги сотовой связи (черновик)

Сравнение поздравительных речей Путина, Лукашенко и Турчинова на День Победы

Сравнение речей президентов России, Белоруссии и Украины с помощью облака слов

Сравним речи, которые произнесли руководители России, Белоруссии и Украины 9 мая 2014 года. Сделаем это с помощью визуализации текстов в виде облака слов.

Облако слов со сравнением частот слов в речах Путина, Лукашенко и Турчинова

Как интерпретировать график? Размер шрифта, которым изображено слово, показывает относительную частоту, с которой данное слово встречалось в речи. Цвет . . . → Читать далее: Сравнение поздравительных речей Путина, Лукашенко и Турчинова на День Победы

Обработка естественно-языковых текстов в R: облако слов

Обработка естественно-языковых текстов (Natural language processing) – это одна из областей, в которых применяется R.

В этой публикации вы познакомитесь с базовыми инструментами анализа, основанного на данных о частоте встречаемости слов. В частности, мы рассмотрим функции из расширений tm и wordcloud: подготовим текстовые документы для частотного анализа и сделаем на их основе облако слов.

Материалом . . . → Читать далее: Обработка естественно-языковых текстов в R: облако слов

Опубликованы слайды выступления “Язык R: анализ и визуализация данных”

Что такое грамматика графики ggplot2 (ч.1)

Начало. Продолжение в

ggplot2: сопоставления, визуальные средства, статистические преобразования и слои Названия элементов графика ggplot2: название графика, осей, легенд Что такое ggplot2 и ggvis

ggplot2 – это расширение языка R, предназначенное для визуализации данных. Для создания графики ggplot2 использует систему абстрактных понятий: массив данных, визуальные средства, геометрические объекты, сопоставление переменных из массива визуальным средствам, . . . → Читать далее: Что такое грамматика графики ggplot2 (ч.1)

Выборка частей массивов data.frame с помощью [квадратных скобок] в R

Функция [ (квадратная скобка) в R служит для отбора отдельных элементов или наборов элементов из векторов, списков (list), матриц и массивов (data.frame). Разберём, как это делать в data.frame.

Возьмём для примера массив “amis” из пакета “boot”.

library(boot) data(amis)

В массиве содержатся результаты эксперимента по оценке влияния предупредительных дорожных знаков на скорость . . . → Читать далее: Выборка частей массивов data.frame с помощью [квадратных скобок] в R