R Диаграмма рассеяния


Графики рассеяния

Из главы «График» вы узнали , что эта plot()функция используется для построения графика чисел относительно друг друга.

«Точечная диаграмма» — это тип графика, который используется для отображения связи между двумя числовыми переменными и отображает одну точку для каждого наблюдения.

Ему нужны два вектора одинаковой длины, один для оси x (горизонтальный) и один для оси y (вертикальный):

Пример

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Результат:

Наблюдение в приведенном выше примере должно показать результат проезжающих мимо 12 автомобилей.

Это может быть неясно для тех, кто видит график впервые, поэтому давайте добавим заголовок и различные метки, чтобы лучше описать точечный график:

Пример

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Результат:

Напомним, что наблюдение в приведенном выше примере является результатом проезжающих мимо 12 автомобилей.

Ось X показывает, сколько лет машине.

Ось Y показывает скорость автомобиля, когда он проезжает мимо.

Есть ли связь между наблюдениями?

Кажется, что чем новее машина, тем быстрее она едет, но это могло быть совпадением, ведь мы зарегистрировали всего 12 машин.


Сравните участки

В приведенном выше примере кажется, что существует связь между скоростью автомобиля и возрастом, но что, если мы нанесем наблюдения и на другой день? Расскажет ли нам точечная диаграмма что-то еще?

Чтобы сравнить график с другим графиком, используйте points()функцию:

Пример

Нарисуйте два графика на одной и той же фигуре:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Результат:

Примечание. Чтобы иметь возможность увидеть разницу в сравнении, вы должны назначить графикам разные цвета (с помощью colпараметра). Красный представляет значения дня 1, а синий — дня 2. Обратите внимание, что мы также добавили cexпараметр для увеличения размера точек.

Заключение наблюдения: Сравнивая два графика, я думаю, можно с уверенностью сказать, что они оба дают нам один и тот же вывод: чем новее автомобиль, тем быстрее он едет.