与数据分析相关的实验experiment经常有哪些步骤?
SAT有的数据分析的题目里会涉及到一些实验的细节,对此不熟悉的同学常常会引发紧张情绪。在这里,我把实验的基本步骤简单介绍一下,作为对大家有用的知识背景。
实验的目的:通过实验来探知一个假设(hypothesis)是否正确。
实验的步骤:
(1)说明实验要验证的假设,同时要给出关键的定义以防误解。(这一步学生可以不用太多在意,因为考试的时候会在题目中把这个背景一带而过)。
(2)Literature Review(这个是把历来相关问题的文献调查一遍,一是确认自己不是重复做研究,二是找到他们所遗漏的问题,作为未来研究的方向和突破口。这一步学生也可以略过,因为我们的数学题目中不会涉及这一个环节)
(3)Experimental Design。实验设计可以有很多种方法,但是所有的方法必须要保证实验结果可以放之四海而皆准,因此,就是要保证实验个体在很多性质上都是具有代表性的。
比方说,有的实验给出男女参加人的比例或者参加人的种族(race)、民族(ethnicity)、文化背景(cultural background)、家庭经济背景(SES)、家庭文化教育背景(family educational background)等信息,其目的就是展现实验参加人对于人群的代表性。
这些与参加人有关的杂七杂八的信息叫做demographic data。这部分内容可以说的很琐碎,但是其目的就是证明代表性(representativeness)。
再比方说,实验说了用了某种方法来取样(sampling),取样的方法千奇百怪,但是其服务的目的都一样,保证所取的样本对于其所针对的目标群体(target population)具有代表性。
因此,学生们经常看到的词是随机取样(random sampling),这种取样方式是所有取样方式中最基本最常见的。
(4)Experimental Group vs. Control Group, 实验组和参照组。所谓参照组,就是不施加以实验的变量,静静地搁置在一旁的组。他们的存在就是为了通过比较看看实验介入变量所起到的作用。
比方说,要知道一种药是否能减肥,就给实验组(experimental group)吃这种药,给参照组(control group)吃长得一个样子的糖丸,然后实验期一过,通过两组的数据的对比,看看这种被实验的减肥药是否有效。
(5)数据分析Data Analysis。这个部分是我们的重点,因为涉及到了具体的计算。题目会先说到数据采集Data Collection,这个步骤注意数据的代表性就行了,因此题目也许会说到random等关键词,通过对上文(3)的学习,学生也知道了这一点。而数据的具体分析计算才是我们的重点,是数学的真正考点。
(6)Results & Discussion。这个部分就是结果。在数学考试中,一般会让学生求出结果而不是直接给出结果,所以,这个部分我们不必过于在意。对于Discussion, 它的真正含义是说出这次实验的疏漏和不足,以期在未来得到改进。