哥伦比亚广播公司新闻战场追踪节目回归,解释选民的想法,并在2024年竞选期间定期提供各州总统选举的详细快照。除了我们在特定一周内在关键州进行的具体民意调查外,战场追踪地图还包括我们在每个州的最佳估计和总统竞选评级。这包括我们广泛调查的州和我们调查的选民较少但有很多其他数据的州。向下滚动到最后可以看到CBS新闻最新的战场状态估计(你也可以将鼠标悬停在地图上查看估计)。
战场追踪者到底是什么,这些数字是从哪里来的?以下是你需要知道的五件事。
我们采用逐州的方法来描述竞选和衡量公众舆论,因为总统是在选举团中赢得的,而不是通过全国普选赢得的。事实上,正如2016年提醒我们的那样,过分依赖全国民意调查可能会产生误导。
Battleground Tracker着眼于每个州,专注于最具竞争力的州。我们将每个候选人目前的支持率转化为选举人票记分牌。我们逐州调查的方法也让我们了解到美国不同地区的选民对今年的候选人、国家问题和地方事务的看法和感受。
虽然在全国范围内调查选民是战场追踪器的一个组成部分,但这不仅仅是你的典型民意调查。这真的是一个大数据项目。我们将民意调查、选民档案(来自L2数据公司(CBS新闻使用L2公司来处理选民档案)、美国人口普查数据和历史趋势结合起来,以清楚地了解每个州的情况。
以下是数据告诉我们的:
通过我们的民意调查,我们知道不同类型的选民支持哪些候选人。我们的民意调查的样本量比一般的民意调查大得多,有数万人参加。
从选民档案和美国人口普查数据中,我们知道每个州和县有多少像他们这样的人,以及他们的投票率历史;
我们知道每个州以前的选举结果,这使我们能够将2024年的预测固定在最近的历史上。
我们的模型使用多层回归和后分层(向下滚动查看更多详细信息)结合了所有这些数据。这种技术的一个特点是,我们利用全国各地的趋势来了解特定州的情况。例如,如果我们发现西南地区的西班牙裔选民的支持发生了变化,我们就会利用这些信息更精确地估计西班牙裔选民居住的具体州。这同样适用于许多其他类型的选民。这项调查让他们告诉我们他们在想什么,我们把他们的想法映射到每个州有多少人居住。
在2018年、2020年和2022年取得成功的基础上,我们与全球民意研究公司YouGov合作进行数据收集和建模。
我们告诉你今天的种族状况,解释原因以及可能发生的变化。在第一次投票之前,我们充分预测了事态的发展,因此我们将在未来几个月定期更新一切。
与选举预测不同的是,我们综合了目前收集到的所有数据,估算了每位候选人目前的支持率。例如,如果我们估计拜登总统在一个州的支持率为49%,误差幅度为3个百分点,我们有信心他今天的支持率在46%到52%之间,而不是说最终结果会在这个范围内。
这里没有任何东西可以解释前瞻性的不确定性——例如,没有关于经济变化或戏剧性辩论的东西。我们完全期待在第一次投票之前的行动,所以我们会在整个秋天定期更新一切。如果竞争变得更加激烈,今天倾向于一个政党的竞选可能会被重新归类为一场摇摆不定的竞选。
这就引出了一些场景。接下来,“战场追踪者”将为大选可能如何展开提供看似合理的场景。我们将使用统计模拟和调整我们模型的一些假设的组合来实现这一点,从而产生一系列可能的结果。
这里有一个例子。要弄清楚的最具挑战性的事情之一是投票率:谁真的会去投票?建模谁可能投票是一个长期的挑战,对假设很敏感。
在我们的基线模型中,我们根据选民告诉我们的计划和他们所在州的历史模式来估计哪些选民会投票。在我们的场景中,我们将稍微改变模型的参数,以探索在以下情况下可能发生的情况,例如,大量选民呆在家里(可能是因为害怕生病),或者通过邮件投票的人数激增(考虑到对这次选举的强烈兴趣,也可能发生这种情况)。我们将在稍后的活动中推出我们的场景,所以请回来查看它们!
虽然我们采取了不同于传统民意调查的方法,但战场追踪者是基于政治科学、调查研究和统计学领域的严格方法。此外,在过去几年里,我们在哥伦比亚广播公司新闻频道(CBS News)采用类似模式的记录也很好。
我们的2018年模型表现得特别好,稳步跟踪民主党在关键比赛中的进步,以及最终在美国众议院的蓝色浪潮。事实上,我们的高投票率情景准确地估计了最终的席位分配,当时历史性的投票率推动了民主党的胜利。
我们在2020年的准确比赛收视率是基于类似的模型。我们估计,民主党在大选日之前已经建立了领先优势,但共和党可能会随着晚些时候的投票率激增而赶上来。我们认为倾向民主党的每个州最终都投给了拜登,而我们认为倾向共和党的每个州都投给了特朗普。在六次掷硬币中,特朗普赢了四次,拜登赢了两次。
最近,这种方法使我们能够准确地估计2022年的中期选举。我们的模型始终指向共和党在众议院的微弱优势,而不是许多其他分析人士预期的红色浪潮。
如果你想了解更多关于我们使用的数据和统计模型,并且不介意一些术语,那么继续阅读……
首先,我们调查了全国成千上万的登记选民,并确保在战场州抽取更大的样本,我们预计这些州的竞争会更激烈。为了估计的目的,我们问的最重要的调查问题是他们投票的可能性有多大,以及他们今天会投票给哪个候选人。
然后,我们确定人们的投票意向与他们的年龄、性别、种族、教育程度、过去的投票、居住地等特征之间的关系。每个选民都有一个特定的组合,我们称之为“个人资料”。例如,一个可能的侧写是一名45岁的亚裔女性,拥有大学学位,四年前投票给拜登,住在宾夕法尼亚州阿勒格尼县。改变这些特征中的任何一个,你都会得到一个不同的配置文件。我们对调查数据进行了多水平回归——一种对不同变量之间的关系进行建模的方法——以估计每个特定背景下有多少选民打算投票给每个主要候选人。回归包括上述选民特征,以及州和地区的影响(“多层次”中的水平)。
下一步是估计每个选民档案中有多少人居住在每个州。为此,我们使用了美国人口普查数据和选民文件的组合,其中包括非常细粒度的选民计数,例如选区。在每个州,我们将给定概况的选民总数乘以具有该概况的选民选择候选人的比例(“后分层”步骤)。汇总一个州的所有选民资料,我们最终得到该候选人在全州的投票份额。在缅因州和内布拉斯加州这两个按国会选区授予选举人票的州,我们也估计了候选人在每个选区的支持率。