1. 首页 > 人物杂谈

求合格率的抽样平均误差(样本率的抽样误差)

  求合格率的抽样平均误差(样本率的抽样误差)、本站经过数据分析整理出求合格率的抽样平均误差(样本率的抽样误差)相关信息,仅供参考!

  编辑导语:问卷调查因其成本低、匿名性高、效率高而被广泛应用于用户研究。那么如何做好问卷调查呢?本文从调查方法、调查数据等方面深入分析了如何做好问卷调查工作。想了解问卷调查的童鞋推荐阅读。

  在过去的问卷调查中,一些学生总是问两个关键问题:

   Q1。“做一个问卷调查需要多少目标用户?”

   Q2。“调查的目标用户很难接触到。只有X份问卷就够了吗?”(问卷数量较少,不到100份)

  一般来说,用户研究员的建议是,根据调查中要回答的问题,至少可以收集到384份有效问卷。有条件的话,可以增加问卷的收集量。那么“384”这个数字是怎么出来的呢?问卷的回收是否一定要达到这个标准?如果达不到这个标准,会对调查结果产生什么影响?要回答这些问题,我们首先要知道什么是问卷调查。

  一、问卷调查1。问卷调查适用场景问卷调查是指调查人员使用统一设计的问卷,向选定的调查对象了解情况或征求意见的调查方式(来自百度词条“问卷调查”)。与其他用户研究方法相比,问卷具有低成本、高匿名性和高效率的特点,因此被广泛应用于研究中。

  问卷的适用场景包括收集受访者的个人信息,了解他们的观点、态度和行为等。通过一系列精心设计的问题,问卷可以帮助研究者达到发现、评价和预测的研究目的。

  图1问卷调查的适用场景

   2.普查和抽样调查根据不同的抽样原则,问卷调查可分为普查和抽查。

  普查是指对所有目标群体的调查。比如想知道北京居民的收入水平,就需要通过普查的方式调查北京所有的居民。是的,你没有看错。是“全北京居民”。严格来说,不能有任何疏漏。

  这样做的好处是每个人都可以被调查,收集到的信息非常全面,不会有偏差。然而,缺点是显而易见的。巨大的工作量需要大量的人力物力,研究周期也很长。目前我国人口普查采用这种方式,全国各地的调查员挨家挨户进行核查。由于人口普查费时费力的特点,这种方法在实际调查中很少使用,比较常用的方法是抽样调查。

  抽样调查就是从所有的目标群体中选取一部分人,根据这部分人的调查结果来估计和推断整个群体的情况。所有的目标群体称为总体,部分被选取的人群称为样本。继续上面的例子,我们想知道北京居民的收入水平。通过抽样调查,我们只需要从北京市民中选取一部分人进行调查。在这里,所有的北京居民都是整体人口,部分选取的居民是样本。根据对居民的调查结果,可以推断出北京居民的收入水平。

  这样做的好处是方便快捷,只需要调查几个人就能猜出整个群体的情况。但是,它的缺点也非常明显。因为不能涵盖所有的研究对象,所以研究结果会有一定程度的偏差。

  图2人口普查和抽样调查的区别

  如何保证抽样调查的可靠性,减少结果的偏差?有必要减少样本的代表性误差。

  二。代表性误差上一部分我们已经知道,抽样调查的目的是“窥一斑而知全豹”,即从调查的目标人群中抽取样本,利用样本的调查结果来推断总体情况。推断结果的可靠性取决于样本是否具有代表性,样本的调查结果能否推断到总体。所以代表性误差是指从样本数据推断到整体数据所产生的误差。代表性误差主要受抽样方法和样本数量的影响。

   1.抽样方法的随机性。抽样的随机性要求总体中的每个个体都有平等的机会被选中,没有偏见或主观性。如果不能保证抽样方法的随机性,就会导致抽样样本出现偏差,从而导致错误的调查结论。

  一个典型的案例是关于火车票难买的调查:记者想知道春运是否难买火车票,于是随机选择了一辆春运高峰列车进行采访。采访结束后,记者发现火车上的乘客都已经买了票,因此他得出结论,春运高峰时的火车票很容易买到。这个调查的破绽在于记者选取的调查样本存在问题,存在较大偏差。记者只调查了买票的群体,遗漏了不买票的群体,所以结论是错误的。

  图3抽样偏差推断错误的研究结论。

  随机抽样主要有四种方式:简单随机抽样、整群抽样、分层抽样和系统抽样。目前平台上的研究大多采用简单的随机抽样。目标人群确定后,将调查问卷推送给这些用户。图4简要总结了四种方法的操作流程及其各自的优缺点。具体内容这里不详述,有兴趣的同学可以自行深入学习。

  图4随机抽样的四种方式

   2.除了抽样方法的随机性,调查样本的数量也会影响代表性误差。样本量越大,代表误差越小,抽样调查结果越接近总体结果。

  为了更好地理解样本量对结果的影响,我们用一个案例来说明:

  一个学校有5000名学生,一次英语测试5000名学生的平均分是76.4 (100%)。按照抽样调查的思路,可以从5000名学生中随机抽取一部分学生,用他们的测试结果来猜测整体情况。如图5所示,样本量越大,结果越接近总体平均值76.4。

  图5样本量和调查结果

  因此,问卷调查对样本量的要求本质上是为了保证结果的可靠性,即使调查结果更接近整体真实情况。虽然样本量越高,调查结果会越接近真实情况,但出于回收成本的考虑,也需要控制样本量上限,减少不必要的人力物力浪费。

  三、样本量的确定方法说了这么多理论内容,却没有回答最关键的问题。研究建议的384个样本量是怎么来的?在这一部分,我们将回答这个问题,通过了解三种确定样本量的方法,进一步明确如何确定问卷调查所需的样本量。

   1.这种经验值估计的方法是最简单粗暴的,完全是由研究者过去的经验决定的,样本量的多少也有很大的差异。有人以30为标准,有人以50为标准,有人以100甚至300为标准.你看,这种拍脑袋的估计不仅无法做到统一,更重要的是缺乏理论依据,其科学性难以保证。

   2.公式计算利用计算公式(公式见图6),可以得到问卷调查所需的样本量。其中n代表样本量;z代表置信度的统计量。统计检验一般设定95%的置信水平,对应的统计量为1.96。置信水平越高,结论的可靠性越高。p代表选项的可能性,在考察中可以取0.5;e代表采样误差,一般为5%。抽样误差越小,结论可信度越高。

  经过计算,结果是384份,所以一般建议根据研究中要回答的问题,有效问卷至少要有384份,这是保证研究结果可信度的最低要求。需要注意的是,有时候研究会有精准细致的要求,比如看全国数据中某个城市或某个地区的研究成果。如果你想回答如此详细的问题

   3.检验有效性分析随着统计学的发展,严谨的学术研究对样本量的计算提出了更精确的要求。通过试验力分析,研究人员可以更准确地计算出所需的样本量。简单来说,在样本量、效应量、显著性水平(Alpha)和检验功效这四个统计量中,知道三个就能推断出另外一个。

  具体使用场景有两种,一种是研究前计算样本量;另一种是在研究结束后计算研究的效果量。有些软件已经能够提供相应的计算功能(比如G*Power)并且有很好的可视化显示。

  图7G *按功率绘制的所需样本容量曲线

  四。结论问卷调查具有低成本、高匿名性和高效率的特点,被广泛应用于用户研究。样本的代表性是问卷调查结果可靠性的关键因素。通过随机抽样,增加样本量,可以提高样本的代表性,得出更接近真实总体情况的调查结论。34份有效问卷是确保调查结果可靠性的最低样本量要求。如果不能保证回收金额,在得出结论时应考虑偏离真实情况的风险。条条大路通罗马,好的研究方法才是能达到目标和解决问题的方法。

  作者:艾路尼,微信官方账号:壳牌KEDC

  本文最初由@壳牌KEDC发布。每个人都是产品经理。未经许可,禁止复制。

  题目来自Unsplash,基于CC0协议。

  更多关于求合格率的抽样平均误差(样本率的抽样误差)的请关注本站。

本文由发布,不代表新营销立场,转载联系作者并注明出处:https://www.newmarketingcn.com/gywm/250646.html

留言与评论(共有 0 条评论)
   
验证码: