Google搜索分析如何比主管部门更早地检测出COVID-19口袋

嗅觉缺乏-是COVID-19症状



根据来自伦敦国王学院(King's College London)COVID-19症状应用程序的250万用户的数据,被诊断出患有这种疾病的用户中有三分之二都报告了失眠症。同时,只有五分之一没有这种疾病的人报告了相同的症状。 同时,每天都有成千上万的人转向Google,以回答为什么他们突然停止闻到气味的问题。 搜索词“我不能闻到”与COVID-19感染数之间有相关性吗?是的,存在这种相关性。















这项研究表明,与失眠症相关的搜索几乎可以完美匹配纽约,新泽西,路易斯安那州和密歇根州的暴发。由Bill Lampos和UCL的一组科学家建立的



模型显示,Google搜索预测在长达两周的时间内检测到的COVID-19病例数会增加。其中最能说明问题的查询是关于失眠症的查询。



因此,与失眠症有关的搜索可以帮助预测COVID-19的爆发。但是从这些查询的分析中获得的数据可以防止此类爆发吗?



这取决于您获得所需数据的速度。如果您打算使用此信息来主动应对未来的爆发,则需要实时数据。



6月5日,休斯敦在与失眠症相关的搜索字词中首次超过纽约。



根据CDC的报告,感染后两天到两周之间会出现COVID-19症状。这意味着您只有14天的时间根据您的搜索字词进行操作。同时,您需要了解在Google Live中确切输入了“我听不到”的人的确切位置。而且,当此类请求进入搜索引擎时,您需要找出有关此问题的信息。



此外,您需要知道有多少人向Google提出了类似的要求。而且它不应该是粗糙的,也不应该是聚合的数据(例如Google趋势中的数据)。



实时获取此类数据和准确数据的一种方法是在Google AdsGoogle的在线广告平台)中购买关键字“我闻不到”



接下来,您需要为失眠症制作一个简单的广告(或者更好的是,使用信誉良好的失眠症信息源)。最后,剩下的就是在地图上选择一个位置,您希望从该位置接收请求“我不能闻到”的数据。



然后,该广告将出现在搜索结果页面上,以供搜索“我闻不到”的任何人使用。将针对在广告所针对的世界中输入的查询执行此操作。



无论Google用户是否点击了此类广告,Google Ads都会收到有关广告展示次数的信息。搜索会话一小时后,这些数据将可用。



这是一张图表,显示了从4月23日开始在美国250个人口最多的城市中搜索“我不能闻到”的情况。 y轴显示搜索会话数。





搜索“我不能闻到”字样的次数



之所以有该数据,是因为从4月23日开始,我在Google Ads中购买了关键字“我不能闻到”,并将定位广告投放到250个美国城市居住人数最多。



也许,这个时间表很难理解。让我们在美国地图上显示相同的数据。





使用美国地图显示的“我不能闻到”的搜索次数在



这里您可以看到4月下旬和5月初的“我不能闻到”的搜索主要来自纽约和芝加哥。在这段时间内,这两个城市受到COVID-19的打击最大。



此外,您可以看到6月份,德克萨斯州休斯顿和达拉斯的指标正在增长。 6月5日,休斯敦首次在与失眠症相关的搜索中领先于纽约。自6月13日以来,休斯敦在美国250个人口最多的城市中,对此类请求的要求最高。



以下是这些图,您可以在其中比较6月前三周在休斯敦的失眠搜索次数和COVID-19阳性检测的次数。





积极的COVID-19测试和Anosmia搜索



我想指出的是,任何需要花费几个小时才能弄清楚Google Ads的人都可以复制这些实验。



我开始购买与失眠症相关的关键字,因为我想更多地了解隔离区中的人们。



但是经过数周的实验,我意识到可以使用这种数据挖掘方法来收集有关数据处于“隔离区”的区域的信息。



因此,购买关键字并将广告定位到某些国家/地区的公民可以帮助您了解哪些国家/地区的当局对他们的公民(或世界)说谎。顺便说一句,这不仅适用于COVID-19,而且适用于任何其他主题。例如,看一下这项研究。



政府隐藏了死亡人数,这是100%正确的。他们很难掩饰多少。他们长期以来完全控制着数据,结果使我们无法访问有关正在发生的事情的独立信息。



坦桑尼亚反对派ACT-Wazalendo政党领袖Zitto Kabwe









自5月8日以来,坦桑尼亚是东非国家坦桑尼亚的COVID-19病例报告了509例COVID-19感染病例。从那以后,没有新的病例报道。



有关失眠症的搜索查询分析与检测到的COVID-19感染病例数相关,甚至可以预测该指标。厌食症是COVID-19的最常见症状。所有这些意味着我们应该期望在坦桑尼亚,如果自5月8日以来确实没有新的病例,他们将很少寻求有关失眠症的信息。



但是,在坦桑尼亚政府停止报告新的COVID-19感染病例的同一周,该国与贫血症相关的搜索中排名世界第二



即将出现来自实地的消息表明医院拥挤,夜间埋葬。



批评者指责坦桑尼亚政府没有向公众通报这种疾病传播的真实范围以及该疾病导致多少人死亡。



为了根据坦桑尼亚人的数据查看真实情况,自坦桑尼亚政府沉默以来,我购买了“我无法闻到”的关键字,并将搜索目标对准了整个坦桑尼亚。



这是坦桑尼亚所有地区的热图。





坦桑尼亚对“我不能闻到”的查询的分析



结果表明,从2020年5月8日至31日,坦桑尼亚讲英语的居民平均每天进行93次查询。



Google Ads的功能之一是您不能在此处向浏览器语言设置为斯瓦希里语的用户投放广告。大约12.15坦桑尼亚人使用这种语言,每1英语说一次。请记住,Google拥有该国约5.1%的设备中的数据。



结果,事实证明,坦桑尼亚每天实际搜寻失眠症的人数实际上接近每天1824次。 Google不允许至少披露94.9%的广告活动数据,因此我将找到的搜索会话次数乘以19.61,以便大致估算该国实际发生的情况。



为了进行比较,在5月8日至5月31日期间,纽约记录了3251例失眠症。在同一时间,报告了18143例感染病例。搜索会话与感染的比例看起来为1:5.5。



在芝加哥,同一时期的比率为1:4。



在哥伦比亚特区,该比例为1:1.96。



在我定位的美国大部分城市中,确诊的COVID-19病例数超过了搜索量1.75-6倍。



自5月8日以来,坦桑尼亚每天大约进行1,824次失眠症搜索。



确切的结果是不可能的,但是,在美国,我没有考虑到与嗅觉相关的更加模糊的要求,例如“嗅觉丧失”(“ loss ofodor”)。此外,与特定设备上的Google数据相比,我不确定用户的哪些数据。



但无论如何,我估计在五月份,坦桑尼亚的每日COVID-19实际病例数可以用一个小的四位数表示。



也许这个数字更少。但这肯定不等于零。



以下是Google数据如何帮助抵抗COVID-19的问题。



应用于我们对COVID-19人数的短期预测的方法,可以称为“播航”,是使用Google搜索引擎观察到的疾病传播情况。这是一种工作技术,已由Bill Lampos的模型证明。



但是这种技术可能会失败。 Google Flu Trends是第一个也是最著名的naukasting工具,在启动三年后就停止了工作。他无法帮助预测2013年流感流行的高峰。



“但是,可以得出的最有用的结论不是对搜索数据的分析是不可靠的,” Sam Gilbert写道。他补充说:“这是对其他方法的补充,而不是替代。”



我正在看的另一种模式是伦敦帝国学院Imperial College London)维护的。该模型估计到2020年4月29日至5月26日这四个星期中,坦桑尼亚的实际感染人数为24689。



分析Google搜索数据可能是观察情况的宝贵线索,不仅限于官方数字。



即使事实证明,对与失眠症相关的搜索查询的分析也无法帮助预测COVID-19的传播,但我认为我们无需屈服于Google Flu Trends平台失败后出现的情绪。



现在不是时候对悲剧感到悲观了。事实是,如今,人们比以往任何时候都更倾向于使用Google,告诉搜索引擎他们没有告诉别人的事情。现在,我们比以往任何时候都需要最好的工具来突破隐藏的信息,并通过捕获有关人们的思想,恐惧,希望(或症状)的信息来了解所讲的内容。



如果当局试图隐藏数据,试图向本国公民或整个世界隐藏真相,那么为了防止我们在这里谈论到什么,他们将不得不完全阻止Google。这并不是因为人们可以使用Google查找客观信息,而是因为Google的搜索分析可以为那些不愿使用官方数据的人指明研究方向。



“如果广告有助于寻找某些问题的答案,那么它就不再是广告。”这是一个口号,可以帮助我的同事更好地了解他们在做什么。尽管他们对自己实际上是商人感到不满,但他们还是出于商业目的使用Google Ads(以便向人们出售他们不需要的商品和服务)。



当您向Google询问有关新运动鞋的评论,或向搜索引擎询问有关当前隔离情况或突然出现的奇怪症状时,从技术角度来看,SERP上出现的第一件事就是,广告。



而且,这是对问题的答案。而且,事实上,还有更多。



您是否打算使用本文介绍的搜索查询分析技术来学习任何东西?






All Articles