Ошибка при поиске выбросов для алмазов набора данных

Вопрос задан: 8 месяцев назад Последняя активность: 8 месяцев назад
up -2 down

для кода ниже, я получаю сообщение об ошибке:

boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x,
        diamonds$y, diamonds$z)
boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, 
        diamonds$y, diamonds$z)$out
outliers <- boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, 
                    diamonds$y, diamonds$z, plot = FALSE)$out diamonds[which(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, diamonds$y, diamonds$z %in% outliers),]
Newdata <- diamonds[-which(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table,
                           diamonds$x, diamonds$y, diamonds$z %in% outliers),] 

ошибка

Ошибка, в котором (алмазы $ карат, бриллианты $ глубина, бриллианты $ таблица, бриллианты $ х,:     неиспользованные аргументы (бриллианты $ х, бриллианты $ у, бриллианты $ г% в% выбросов)

r

1 ответ

up 0 down

Ниже приведен пример решения: Сначала мы выбираем наши столбцы, представляющие интерес

subset_df<diamonds[,which(names(diamonds)%in%c("carat","cut","depth","x","y","z","table"))]

Далее, мы определяем, что определяет выброс. Я установил, что любое значение больше чем 5.

outliers<-subset_df[which(subset_df$z>=5),]  

Наконец, мы делаем наш boxplot.

boxplot(outliers)

Non-Выпадающие: Я бы с ggplot2 по причинам предпочтения.

non_outliers<-subset_df[which(subset_df$z<5),]
boxplot(non_outliers)

НОТА:

Учитывая данные от ggplot2, Вы можете рассмотреть вопрос о dplyr а также ggplot2 для «гладкого» процесса (мнение, основанное).