Google搜索使用“ vs”一词会怎样?

发生在您身上的事情是:您在Google上搜索内容,然后在搜索词后输入“ vs”,希望搜索引擎会自动为您提供与您所需内容类似的内容?





在搜索词后输入“ vs”



这已经发生在我身上。



事实证明,这很重要。这是一个技术是,寻找替代的东西的时候,可以节省大量的时间。



我发现如果将该技术用于查找有关技术,某些开发和他们想了解的概念的信息,那么该技术之所以如此有效的3个原因:



  1. 学习新事物的最好方法是找出与已知事物相似的新事物,新事物或与已知事物有何不同。例如,在出现在“ vs”之后的句子列表中,您可以看到一些有关其的内容:“啊,事实证明,我要找的东西已经很熟悉了。”
  2. — . , , .
  3. «vs» — , Google , - -. «or», - -. , «or», Google , - .




在处理bert或请求时,Google会提供有关芝麻街的建议。bert vs查询为提供了有关Google BERT的提示,



这让我开始思考。但是,如果我们在输入“ vs”之后搜索并建议谷歌在搜索结果后加上“ vs”,该怎么办?如果您重复几次,该怎么办?如果是这样,您可以获得相关查询的良好网络图。



例如,它可能看起来像这样。





半径为25的bert查询的自我图



这是一种非常有用的技术,可用于创建反映相似实体之间关系的技术,发展或想法的思维导图。



我会告诉你如何建立这样的图。



自动从Google收集“ VS”数据



这是一个链接,您可以使用该链接从Google获取有关XML自动补全的建议。此功能似乎不适合一般用途的API,因此在此链接上可能不会太繁琐。



http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=<search_term>


URL参数output=toolbar表明我们对XML格式的结果感兴趣,gl=us设置了国家/地区代码,hl=en允许我们指定语言,并且构造q=<search_term>正是我们需要获得自动完成结果的条件。



对于参数glhl使用国家语言的标准两个字母的标识符



让我们通过从查询开始搜索来尝试所有这些tensorflow



工作的第一个步骤是指所指定的URL,使用描述查询以下结构:q=tensorflow%20vs%20整个链接如下所示:



http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=tensorflow%20vs%20


作为响应,我们将接收XML数据。



与XML做什么?



现在,您需要根据一组特定条件检查自动完成的结果。有了适合我们的产品,我们将继续努力。





检查结果



I在检查结果时,使用以下条件:



  • 推荐的搜索查询不得包含原始查询文本(即- tensorflow)。
  • 该建议不应包含以前认为合适的请求(例如- pytorch)。
  • 该建议不应包括“ vs”几个词。
  • 找到5个匹配的搜索后,将不考虑其余搜索。


这只是“清理”完成从Google收到的搜索查询的建议列表的方法之一。我有时还会看到从列表中仅选择一个单词推荐的好处,但是这种技术的使用取决于每个特定的情况。



因此,使用这组标准,我们得到了以下5个结果,每个结果都分配了一定的权重。





5结果



下一次迭代



然后,对这5个找到的建议进行与原始搜索查询相同的处理。使用单词“ vs”将它们传递给API,并再次选择5个满足以上条件的自动完成结果。这是以上列表的这种处理的结果。





查找已找到的单词的自动完成结果您



可以通过检查尚未检查的列中的单词来继续此过程target



如果对此类单词搜索进行大量迭代,则会得到一个很大的表,其中包含有关查询和权重的信息。此数据非常适合图形可视化。



自我图



我在本文开头向您展示的网络图是所谓的自我图,在我们的案例中是为查询而构建的tensorflow自我图是一个图,其所有节点都与该节点有一定距离tensorflow该距离不得超过指定距离。



节点之间的距离如何确定?



首先让我们看一下完成的图。





对于具有22半径的tensorflow查询的自我图是



连接查询的边缘的重量AB我们已经知道了。这是自动完成列表中推荐的等级,范围是1到5。要使图形无向,您可以简单地添加两个方向上的顶点之间的连接权重(即fromAB,如果存在这样的连接,fromBA)。 。这将使我们的边缘权重介于1到10之间



。因此,将使用以下公式计算边缘长度(距离)11 — 。我们在此处选择11是因为最大边缘权重为10(如果两个建议都出现在彼此的自动完成列表的最顶部,则边缘将具有该权重)。结果,请求之间的最小距离将为1。



图形顶点大小(大小)和颜色(颜色)由相应请求出现在建议列表中的情况的数量(计数)确定。结果是,峰越大,提出的概念越重要。



所考虑的自我图的半径为22。这意味着您可以从顶点开始tensorflow,走不超过22的距离来满足每个请求。让我们看看如果将图的半径增加到50,会发生什么。





半径为50的tensorflow查询的自我图



事实证明很有趣!此图包含从事人工智能工作的任何人都需要了解的大多数基本技术。此外,这些技术的名称在逻辑上进行了分组。



而所有这些都是基于一个关键字构建的。



如何绘制这样的图形?



我使用了蓬勃发展的在线工具来绘制这样的图形



该服务使您可以使用简单的界面来构建网络图和其他图。我认为对于那些对建立自我图感兴趣的人来说值得一看。



如何创建给定半径的自我图?



要创建具有给定半径的自我图,可以使用Python包networkx。它具有非常方便的功能ego_graph。在调用此函数时指定图形的半径。



import networkx as nx

#  
#nodes = [('tensorflow', {'count': 13}),
# ('pytorch', {'count': 6}),
# ('keras', {'count': 6}),
# ('scikit', {'count': 2}),
# ('opencv', {'count': 5}),
# ('spark', {'count': 13}), ...]

#edges = [('pytorch', 'tensorflow', {'weight': 10, 'distance': 1}),
# ('keras', 'tensorflow', {'weight': 9, 'distance': 2}),
# ('scikit', 'tensorflow', {'weight': 8, 'distance': 3}),
# ('opencv', 'tensorflow', {'weight': 7, 'distance': 4}),
# ('spark', 'tensorflow', {'weight': 1, 'distance': 10}), ...]

#   
G=nx.Graph()
G.add_nodes_from(nodes)
G.add_edges_from(edges)

# -  'tensorflow'
EG = nx.ego_graph(G, 'tensorflow', distance = 'distance', radius = 22)

#  
subgraphs = nx.algorithms.connectivity.edge_kcomponents.k_edge_subgraphs(EG, k = 3)

# ,  'tensorflow'
for s in subgraphs:
    if 'tensorflow' in s:
        break
pruned_EG = EG.subgraph(s)

ego_nodes = pruned_EG.nodes()
ego_edges = pruned_EG.edges()


另外,我在这里使用了另一个功能- k_edge_subgraphs。它用于删除一些不符合我们需求的结果。



例如,它storm是用于实时分布式计算的开源框架。但这也是漫威宇宙中的角色。如果您在Google中输入“ storm vs”,您认为哪些搜索建议会“获胜”?



该函数k_edge_subgraphs查找无法通过执行k执行较少的动作来划分的顶点组。事实证明,这是参数k=2的值k=3。最后,仅保留了它们所属的那些子图tensorflow。这样可以确保我们离开始搜索的地方不会走得太远,也不会走得太远。



在生活中使用自我图



让我们远离示例c tensorflow并考虑另一个自我图。这次-专注于让我感兴趣的其他事物的图表。这是被称为西班牙舞会的国际象棋首次亮相(鲁伊·洛佩兹国际象棋开幕)。



chess国际象棋开孔研究





研究“西班牙游戏”(ruy lopez)



我们的方法使我们能够快速发现最常见的开放思路,这可以帮助国际象棋研究人员。



现在,让我们看看使用自我图的其他示例。



▍健康食品



卷心菜!好吃!



但是,如果您希望用其他东西代替漂亮的无与伦比的白菜呢?围绕卷心菜(kale建立的自我图可以帮助您





半径为25的羽衣甘蓝查询的自我图



buy我们买狗



狗太多了,时间也很少了……我需要一只狗。但是哪一个呢?也许像贵宾犬(poodle)之类的东西





半径为18的贵宾犬查询的自我图



▍寻找爱



狗和白菜什么都没改变?需要找到你的知己吗?如果是这样,这是一个很小但非常自给自足的自我图,可以帮助解决这个问题。





要求咖啡的自我图符合半径为18的百吉饼



the如果约会应用没有帮助怎么办?



如果约会应用程序无用,您应该观看系列节目,而不是挂在应用程序上,而是放些带有白菜味(或最近发现的芝麻菜味)的冰淇淋。如果您喜欢“办公室”系列(肯定是英国的一幅),那么您可能会喜欢其他系列。





半径为25的办公室查询的自我图



结果



到此结束有关在Google搜索中使用“ vs”一词以及自我图的故事。我希望所有这些都会至少对您寻找爱,好狗和健康食物有所帮助。



搜索互联网时,您是否使用任何不寻常的技巧?






All Articles