单变量 的意思是 "一个变量"(一种数据)
例子;路程时间(分钟):15、29、8、42、35、21、18、42、26,变量是路程时间,
例子:小狗的体重,你称量小狗体重的结果是:2.5、3.5、3.3、3.1、2.6、3.6、2.4,变量是小狗的体重,
有很多方法去使用单变量数据:
求中心值:用 平均值、中位数 和 众数,求数据的分散程度:用 范围、四分位数 和 标准差,画图:例如 柱形图、饼形图 和 直方图,
双变量 的意思是 "两个变量",就是有两种数据,
在双变量数据中,你可以比较两组数据:
例子:冰淇淋店记录了每天的冰淇淋销量与当天的气温,两个变量是 冰淇淋销量 和 温度。
这数去 12天的记录:
冰淇淋销量与气温 | |
温度 °C | 冰淇淋销量 |
---|---|
14.2° | ¥215 |
16.4° | ¥325 |
11.9° | ¥185 |
15.2° | ¥332 |
18.5° | ¥406 |
22.1° | ¥522 |
19.4° | ¥412 |
25.1° | ¥614 |
23.4° | ¥544 |
18.1° | ¥421 |
22.6° | ¥445 |
17.2° | ¥408 |
这是数据的 散布图:
在图上很容易看到温暖的天气 与 较大的冰淇淋销量有关联,但并不是绝对的关联,对于双变量数据,我们有兴趣的是比较两组数据并寻找其中的关系,我们可以用列表、散布图、相关性、最优拟合线和常理来帮助我们分析。
.