谷歌SEO:理解主题模型和语义连接

seo-topic-modeling-semantic-connectivity

谷歌是怎样理解人们的搜索意图的?杰欣网络营销机构将为大家详细说明。

这其中就牵涉到主题模型(Topic Modeling)和语义连接(Semantic Connectivity),这两个词听起来很难理解,但实际上,他们是帮助我们了解搜索引擎运行原理的重要部分,而且他们对于SEO的某些方面有很大的影响。因此,必须先了解这两个词。

其实,搜索引擎对于人们搜索所使用的词汇、短语的理解更智能。比如搜索“超级玛丽”这个词,人们可能认为只能搜索到以“超级玛丽”为标题的网页,而实际上,只要标题或文章中含有“超级玛丽”的网页都可以搜索出来。而这就是SEO的真正目的,就是为搜索者提供所有的最佳答案。但搜索引擎实际上远比这个更加智能。

还有一个最好的例子,就是谷歌的电影搜索。例如,在谷歌上搜索“一部讲花花公子的电影”,你会看到“The Big Lebowski”排在第一位。那么谷歌是怎么知道的?谷歌把“电影”和“花花公子”结合在一起,发现和两者最为密切相关的是“The Big Lebowski”这部电影。而这部电影正是用户要找的,没有一个网站会将“一部讲花花公子的电影”作为标题。

还是以“超级玛丽”为例,“超级玛丽”会涉及到很多相关词汇或者短语。因此,搜索引擎更多是从语义上对这个词进行理解,它可能优先将这个词与“马里奥”联系在一起,而后是“路易吉”,再然后是“库巴大王”,就是那只背部长满钉子的反派乌龟。

从以上例子我们就可以看出,搜索引擎有着一套自己的主题模型算法,类似于早期的潜在语义索引,以及后来的潜在的狄利克雷分布。模式并不重要,尤其是对于我们所要达到的目标。

最重要的是了解搜索引擎是怎样联系的。比如谷歌和必应就能够很好地理解“超级玛丽”这个词,不会将其和其他方面联系在一起。它们会将“超级玛丽”和“电子游戏”联系在一起,而不是和“猫粮”联系在一起。如果我们恰巧发现搜索结果的网页标题中含有“超级玛丽”,但是大部分内容却是跟猫粮相关。那么即使这些网页中的很多内链和包含“超级玛丽”的锚文本相连,或者排名很高,权重很高,我们也不会对这些网页进行排名。

因此,谷歌等搜索引擎对于语义连接的理解越来越智能化了,这与谷歌的蜂鸟算法有关。蜂鸟是去年秋季新推出的一种算法,这种算法改变了搜索引擎对词语及短语的理解。

所以如果想知道搜索引擎怎样理解我们的意图,就要先理解谷歌和必应对于词语、短语和主题之间的连通性的理解。这个问题会涉及到很多方面,也可能来自于共同出现的网页文档。

关键词之间的距离。我的意思是,如果很多网页都有“超级玛丽”和“马里奥”这两个词,那谷歌是怎么从“马里奥”这个词当中找到“超级玛丽”的?“超级玛丽”的词义和“马里奥”的词义有什么关系?也许“超级玛丽”会出现在很多“猫粮”中,但是“超级玛丽”和“猫粮”的词义相去甚远。但提及“超级玛丽”,搜索结果中会出现很多页面,搜索引擎可能关注文件之间的互相引用和链接,同时也会将这些网页与“马里奥”、“路易吉”、“任天堂”等联系起来。

搜索引擎会理解这些链接的锚文本之间的联系,也会通过协调语料库以及主域名的偏向理解这些词的同现。因此,搜索引擎只关注那些网站、博客、新闻网站,或者高权重的域名上更新的内容,而不是关注这些网站的全部内容。因此,搜索引擎可能会通过不同的方式来理解。

搜索引擎会分析用户提出的问题,而这个是人类所不具备的能力。搜索引擎会分析那些使用“马里奥”、“路易吉”、“任天堂”等词汇搜索“超级玛丽”的行为习惯。

搜索引擎也会通过谷歌浏览器、安卓,以及谷歌搜索引擎等方面的数据,来分析用户点击量、访问页面,并把这些数据作为联系词组和短语的调和资源。

搜索引擎可能也会通过其他途径获得相关数据,并通过这些数据建立起一个非常庞大的数据库,用来联系词汇和短语。对于SEO工作者来说,这个数据库因不得而知而貌似不重要。

假如以“超级玛丽”作为关键词,那么那些和“超级玛丽”语义上相关的词汇短语都可以加以利用。如果知道搜索引擎会将哪些词汇和短语与“超级玛丽”相联系,就可以使用那些词汇和短语。可以将这些词汇和短语写入网页中,让搜索引擎知道你的网页内容和“超级玛丽”相关,因为网页中包含了“马里奥”、“路易吉”、“碧奇公主”、“库巴大王”、“任天堂”等,而不是“猫粮”、“狗粮”、“T恤”、“玻璃”等。

网站获得了一个链接,通常是因为那个链接的锚文本中含有和网站主题相关的词汇和短语,链接的锚文本潜在地指向你的网站,这样就可以从命名规定和品牌角度考虑网站建设。所以,在考虑产品名称和产品内容描述时,可以将这些词汇编入正式的名称和描述中,以此来提高搜索量。

对于网站上的有关介绍页面,大部分要考虑有关个人或者公司的正式介绍内容,包括要使用的词汇,所以介绍就必须根据网站、书本提供的词汇或者会议内容来编辑相关内容,这些词汇不一定必须是相关的。因此,当人们搜索“超级玛丽”这个词时,搜索引擎往往会指向“任天堂”网站。

当然你也可以考虑使用其他关键词。这些可以在你进行网页优化和链接建设时,作为关键词研究的一部分。

现在有各种各样的工具来完成这些步骤,这里就不详细说明了。

网上有很多可以下载的工具以及数据库。Code.google.com就是一种主题建模工具,而这也是谷歌搜索引擎常用的工具。

在网上搜索主题建模工具,但是大部分建模工具都需要网站发展背景。许多工具依靠Python 数据库或者API,大部分还需要一个语料库。你可以下载维基百科数据库作为语料库,或者使用谷歌搜索引擎排名前十的结果作为语料库。

整个过程会非常艰难,这也是我热衷于尝试的原因所在。我们在此详细说明,希望能够帮大家尽快熟悉这些工具,以用于网站优化和关键词研究。

现在你就可以独立完成这些步骤了。可以去网站上看看那些搜索结果,仔细研究那些在谷歌搜索排名前十网站所使用的关键词和短语。然后仔细想想这些关键词和短语是否相关,锚文本中是否包含了这些关键词和短语?人们在搜索的时候会用到这些关键词和短语吗?它们局部相关吗?仔细想想,然后学会利用。这样,在进行SEO时,就能够熟练使用这些工具。

 

Comments are closed.