置信度是一个统计术语,表示您在测试中达到了预先设定的某个概率水平。我们希望尽量减少治疗之间感兴趣的指标差异随机的可能性。
例如,在置信度为 95% 的测试中,观察到的差异是随机概率的只有 5%。
以下是一些可能对测试的置信度产生负面影响的有效性威胁的例子。WhatsApp 数据库
- 样本失真效应——当您的手机样本太小而无法确定测试的 95% 置信水平时,就会发生这种情况。
足够的样本量取决于您现有的成功率。例如,如果您衡量销售线索的数量,并且您的典型成功率是每 100 次通话 2 次,那么拨打 500 次电话将比仅拨打 200 次电话更能估计您的真实线索率。
现有的成功率越低,您需要打电话给越多的人才能获得有效的测试。
另外,也可以使用小样本量,但需要注意的是,在基于对样本池的信心较低的情况下做出业务决策时,您的风险承受能力如何。
- 名单污染效应——您不能用同一份名单进行新的测试或治疗。每次测试的名单都必须是最新的。例如,如果您需要 500 个联系人来实现有效性,您就不能两次呼叫 250 人的名单。
- 历史效应——当测试时间过长时,就会发生这种情况,因此处理之外的影响更有可能扭曲结果。使用 A/B 测试,您可以避免这种情况,因为两个测试同时运行。尽量缩短测试时间。我们更喜欢一到两周。
- 选择效应——当测试对象分布不均匀时,就会发生这种情况。例如,一种治疗方法在一份从未被调用过的名单上进行测试,另一种治疗方法在一份一个月前的名单上进行测试。
- 渠道选择效应– 在电话销售中,您的渠道不是按点击付费广告或网站,而是打电话的人。渠道一致性对于确保测试有效性至关重要。
在网站上,你可以完全控制价值的呈现方式。阿联酋电话号码而电话则无法做到这一点。但是,你可以通过以下方式使它们更加一致:
- 为呼叫者提供详细的脚本以供遵循。
- 培训他们如何使用脚本。
- 对所有通话进行录音,并聆听至少 50% 的通话,营销个性化,您的战略的重要组成部分以确保每次通话的语调和语调相似。
将每一次测试都视为一次胜利。
即使测试导致转化率较低,您仍然没有浪费时间或金钱。您只是更接近了解什么有效。事实上,有时我们从失败的测试中学到的东西比成功的测试更多。