在搜索词后输入“ vs”
这已经发生在我身上。
事实证明,这很重要。这是一个技术是,寻找替代的东西的时候,可以节省大量的时间。
我发现如果将该技术用于查找有关技术,某些开发和他们想了解的概念的信息,那么该技术之所以如此有效的3个原因:
- 学习新事物的最好方法是找出与已知事物相似的新事物,新事物或与已知事物有何不同。例如,在出现在“ vs”之后的句子列表中,您可以看到一些有关其的内容:“啊,事实证明,我要找的东西已经很熟悉了。”
- — . , , .
- «vs» — , Google , - -. «or», - -. , «or», Google , - .
在处理bert或请求时,Google会提供有关芝麻街的建议。bert vs查询为 我提供了有关Google BERT的提示,
这让我开始思考。但是,如果我们在输入“ vs”之后搜索并建议谷歌在搜索结果后加上“ vs”,该怎么办?如果您重复几次,该怎么办?如果是这样,您可以获得相关查询的良好网络图。
例如,它可能看起来像这样。
半径为25的bert查询的自我图
这是一种非常有用的技术,可用于创建反映相似实体之间关系的技术,发展或想法的思维导图。
我会告诉你如何建立这样的图。
自动从Google收集“ VS”数据
这是一个链接,您可以使用该链接从Google获取有关XML自动补全的建议。此功能似乎不适合一般用途的API,因此在此链接上可能不会太繁琐。
http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=<search_term>
URL参数
output=toolbar
表明我们对XML格式的结果感兴趣,gl=us
设置了国家/地区代码,hl=en
允许我们指定语言,并且构造q=<search_term>
正是我们需要获得自动完成结果的条件。
对于参数
gl
和hl
,使用国家和语言的标准两个字母的标识符。
让我们通过从查询开始搜索来尝试所有这些
tensorflow
。
工作的第一个步骤是指所指定的URL,使用描述查询以下结构:
q=tensorflow%20vs%20
。整个链接如下所示:
http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=tensorflow%20vs%20
作为响应,我们将接收XML数据。
与XML做什么?
现在,您需要根据一组特定条件检查自动完成的结果。有了适合我们的产品,我们将继续努力。
检查结果
I在检查结果时,使用以下条件:
- 推荐的搜索查询不得包含原始查询文本(即-
tensorflow
)。 - 该建议不应包含以前认为合适的请求(例如-
pytorch
)。 - 该建议不应包括“ vs”几个词。
- 找到5个匹配的搜索后,将不考虑其余搜索。
这只是“清理”完成从Google收到的搜索查询的建议列表的方法之一。我有时还会看到从列表中仅选择一个单词推荐的好处,但是这种技术的使用取决于每个特定的情况。
因此,使用这组标准,我们得到了以下5个结果,每个结果都分配了一定的权重。
5结果
下一次迭代
然后,对这5个找到的建议进行与原始搜索查询相同的处理。使用单词“ vs”将它们传递给API,并再次选择5个满足以上条件的自动完成结果。这是以上列表的这种处理的结果。
查找已找到的单词的自动完成结果您
可以通过检查尚未检查的列中的单词来继续此过程
target
。
如果对此类单词搜索进行大量迭代,则会得到一个很大的表,其中包含有关查询和权重的信息。此数据非常适合图形可视化。
自我图
我在本文开头向您展示的网络图是所谓的自我图,在我们的案例中是为查询而构建的
tensorflow
。自我图是一个图,其所有节点都与该节点有一定距离tensorflow
。该距离不得超过指定距离。
节点之间的距离如何确定?
首先让我们看一下完成的图。
对于具有22半径的tensorflow查询的自我图是
连接查询的边缘的重量
A
和B
我们已经知道了。这是自动完成列表中推荐的等级,范围是1到5。要使图形无向,您可以简单地添加两个方向上的顶点之间的连接权重(即fromA
到B
,如果存在这样的连接,fromB
到A
)。 。这将使我们的边缘权重介于1到10之间
。因此,将使用以下公式计算边缘长度(距离)
11 —
。我们在此处选择11是因为最大边缘权重为10(如果两个建议都出现在彼此的自动完成列表的最顶部,则边缘将具有该权重)。结果,请求之间的最小距离将为1。
图形顶点的大小(大小)和颜色(颜色)由相应请求出现在建议列表中的情况的数量(计数)确定。结果是,峰越大,提出的概念越重要。
所考虑的自我图的半径为22。这意味着您可以从顶点开始
tensorflow
,走不超过22的距离来满足每个请求。让我们看看如果将图的半径增加到50,会发生什么。
半径为50的tensorflow查询的自我图
事实证明很有趣!此图包含从事人工智能工作的任何人都需要了解的大多数基本技术。此外,这些技术的名称在逻辑上进行了分组。
而所有这些都是基于一个关键字构建的。
如何绘制这样的图形?
我使用了蓬勃发展的在线工具来绘制这样的图形。
该服务使您可以使用简单的界面来构建网络图和其他图。我认为对于那些对建立自我图感兴趣的人来说值得一看。
如何创建给定半径的自我图?
要创建具有给定半径的自我图,可以使用Python包
networkx
。它具有非常方便的功能ego_graph
。在调用此函数时指定图形的半径。
import networkx as nx
#
#nodes = [('tensorflow', {'count': 13}),
# ('pytorch', {'count': 6}),
# ('keras', {'count': 6}),
# ('scikit', {'count': 2}),
# ('opencv', {'count': 5}),
# ('spark', {'count': 13}), ...]
#edges = [('pytorch', 'tensorflow', {'weight': 10, 'distance': 1}),
# ('keras', 'tensorflow', {'weight': 9, 'distance': 2}),
# ('scikit', 'tensorflow', {'weight': 8, 'distance': 3}),
# ('opencv', 'tensorflow', {'weight': 7, 'distance': 4}),
# ('spark', 'tensorflow', {'weight': 1, 'distance': 10}), ...]
#
G=nx.Graph()
G.add_nodes_from(nodes)
G.add_edges_from(edges)
# - 'tensorflow'
EG = nx.ego_graph(G, 'tensorflow', distance = 'distance', radius = 22)
#
subgraphs = nx.algorithms.connectivity.edge_kcomponents.k_edge_subgraphs(EG, k = 3)
# , 'tensorflow'
for s in subgraphs:
if 'tensorflow' in s:
break
pruned_EG = EG.subgraph(s)
ego_nodes = pruned_EG.nodes()
ego_edges = pruned_EG.edges()
另外,我在这里使用了另一个功能-
k_edge_subgraphs
。它用于删除一些不符合我们需求的结果。
例如,它
storm
是用于实时分布式计算的开源框架。但这也是漫威宇宙中的角色。如果您在Google中输入“ storm vs”,您认为哪些搜索建议会“获胜”?
该函数
k_edge_subgraphs
查找无法通过执行k
或执行较少的动作来划分的顶点组。事实证明,这是参数k=2
和的值k=3
。最后,仅保留了它们所属的那些子图tensorflow
。这样可以确保我们离开始搜索的地方不会走得太远,也不会走得太远。
在生活中使用自我图
让我们远离示例c
tensorflow
并考虑另一个自我图。这次-专注于让我感兴趣的其他事物的图表。这是被称为西班牙舞会的国际象棋首次亮相(鲁伊·洛佩兹国际象棋开幕)。
chess国际象棋开孔研究
研究“西班牙游戏”(ruy lopez)
我们的方法使我们能够快速发现最常见的开放思路,这可以帮助国际象棋研究人员。
现在,让我们看看使用自我图的其他示例。
▍健康食品
卷心菜!好吃!
但是,如果您希望用其他东西代替漂亮的无与伦比的白菜呢?围绕卷心菜(
kale
)建立的自我图可以帮助您。
半径为25的羽衣甘蓝查询的自我图
buy我们买狗
狗太多了,时间也很少了……我需要一只狗。但是哪一个呢?也许像贵宾犬(
poodle
)之类的东西?
半径为18的贵宾犬查询的自我图
▍寻找爱
狗和白菜什么都没改变?需要找到你的知己吗?如果是这样,这是一个很小但非常自给自足的自我图,可以帮助解决这个问题。
要求咖啡的自我图符合半径为18的百吉饼
the如果约会应用没有帮助怎么办?
如果约会应用程序无用,您应该观看系列节目,而不是挂在应用程序上,而是放些带有白菜味(或最近发现的芝麻菜味)的冰淇淋。如果您喜欢“办公室”系列(肯定是英国的一幅),那么您可能会喜欢其他系列。
半径为25的办公室查询的自我图
结果
到此结束有关在Google搜索中使用“ vs”一词以及自我图的故事。我希望所有这些都会至少对您寻找爱,好狗和健康食物有所帮助。
搜索互联网时,您是否使用任何不寻常的技巧?