什么是网站结构-咨道一课2.0


加载问题,请按此处!

视频字幕

Hello,大家好! 欢迎大家收看本期的咨道一课!那今天和大家分享的是:什么是网站结构?

那这个主题我们主要还是会分为五大类:

1、我们要去了解网站结构的定义

2、网站结构对于SEO的影响,包括哪些方面?

3、那如何帮助我们去新建一个网站的时候要网站的架构注意些什么?或者说怎么去决定这些架构?

4、也会列举些常见的网站结构上的一些错误

5、最后要分享的是wordpress,它是如何通过固定链接去修改它的链接结构的。

那第一块的话是网站结构的一个定义。

通俗来讲,网站基本可以分为三个结构:

第一个是我们的物理结构:那物理结构主要是体现于真实网页在主机端上它的一个位置。那包括比如说当我们来到我们网站的时候,这是它的首页A,首页下面会有一个目录B,在目录下面会有不同的小页面,那这样是我们称为一个物理结构。那物理结构是在上传你网站文件的时候所处在的这么一个位置,啊~所以他是真实的存在的。

那第二个结构是我们的内链结构,因为我们知道当网站把页面上传到主机端上之后,在用户端或是前端我们看到的页面事实上是传上去这个页面以后所展现的内容,那这样的内容它是可以根据不同级别下面的页面进行这样一个所谓链接的这样一个贯通。因此,内链的结构其实是网页之间的一个枢纽的管道。这里比如说在我们的B栏目下面会有一个D页面,那D页面原则上从物理结构来讲的话那它是在B下面的,但我们的D页面只要是内容里面有一个内部链接通向我们的C栏目的话,那这样的一个结构就可以看作是我们的一个内链的结构。那第三个是URL的结构,URL结构的话区别主要是体现说当我们去访问页面的时候,我们在浏览器上方总会是一个URL地址的,而这个地址其实他能代表我们物理结构,那有时候它也是可以不代表我们物理结构的,那比如说像这样的动态页面的时候,那所有的这块内容其实它是抓取它数据库里面的内容,而数据库内容其实不是在我们物理结构里面的。因此网站结构里面少不了我们这样一个URL结构,而URL结构我们通常会说动态的URL去变成一个静态或者伪静态的URL,就比如像这个例子,那之前是ID=22这么一个产品,我们可以把URL重新写或重新替换成d22.html这样一种形式。所以,总体来讲的话,当我们提到网站结构的时候事实上它不仅是我们传统意义上想到网站长成什么样子?事实上它更多牵扯到整体网页部分一个物理的架构,包括物理架构里所有页面里面的相互贯穿的这些内链或内部链接的这么一个结构。那第三块才是我们说有了真实的文件有了文件里面的内链结构,随后那用户去访问的时候这个时候URL结构是什么样的?所以说网站三大结构的话主要是会有这三块。

那我们如何去看我们的物理结构呢?事实上会做网站的基本上会用我们称为FTP这么个工具去上传所有的你本地做好的文件,上传到不管是你的虚拟主机啊还是独立主机,那通常我们会用比如说像这样filezilla像这样的一个工具,它是可以去免费的让我们站长使用,那使用这工具的时候,任何网站它都会有一个主机地址,所以你把主机地址填进去,随后你的网站会有一个用户名和密码的,那基本上只要有这三项信息的话,你就可以去链接到你网站所在的那个主机,那登上去之后的话你就可以看到你整个主机上面的原始的这么一个物理结构了,那一开始的话你没有放网站的话,可能就是非常简单的,譬如说,大无风网的虚拟主机它会是一个public gate目录,所以就是在这个目录下面可以把你所有网站里面的内容给丢上去或者是上传上去,其实物理结构的话就是,他更多的就是通过FTP文件或者是网站,就是网页端的一个文件管理器,去管理你整体网页在主机上面的一个结构的一个方式,所以,物理结构其实是决定网站文件的一个位置的 。

随后,内部链接结构其实通常情况下,我现在也是没有找到一块非常好的内部链接查询这么一个软件,告诉你这个网站整体的一个内链结构是怎么样,基本上是没有找到,那其实也没有关系,我们可以用我们一些现成的一些工具,比如说死链接检查的一个工具,比如说在chinaz上面这个页面出链接了,我们可以去用这个软件随后在里面输一个,任何的一个网页,不管是homepage啊,不管是内页啊输进去,随后它会根据你这个页面上面出现的内链去跑,你所有的内链它回去跑一下,那在跑的这个过程当中,其实我们就知道了,对于这个页面来讲的话,他的上下级,他的左右级是相互链向的方位是哪里,如果我们有更好的一些方法的话,把这些原始数据都弄下来到我们的excel里面排列,那这样你就基本上知道整体的内链的一个结构,就比如说我们的F页面,它当然是从C页面过去的,那F 页面它又通向哪里呢,那比如说它通向,那像这样一个工具其实是可以帮我们自动抓到这样一个信息的,这里还有一点就是,很重要的就是,其实内部链接才是真正决定我们蜘蛛爬行路线的,也就是说,内部链接其实对于SEO的意义是来的更大,因为有了内部链接这么的一个通路,搜索引擎蜘蛛才可以根据我内部链接去抓取、扒取或者是收录我们的页面。

随后,我们第二点就讲一下结构对于SEO的影响。那说到SEO,说到结构的话,其实我们第一个要去了解说,通常情况下我们整体的一个,就从物理结构来讲的话会分成两块,一个是我们的扁平的一个结构,另一个就是我们一个树形的这么一个结构,那扁平结构的话意思指的就是说在我们一个大的根目录下面,就是你主机你的那个根目录下可以放所有的页面,都是平行的,都是扁平状的,从B啊,C啊,D啊,不管多少页面都放在根目录下面。那另外一种是树形,树形的 话就是,这样就有了我们所谓的上下级或是层级,那比如说,我们首页是最高级的,那首页下来会有我们的B,然后F目录,然后我们的G目录,不同的目录下面他会有不同的小目录,或者是一个单页面,那这样就像一个树枝树干然后叶子这么一个结构,那这两个结构其实有他们的利弊,主要体现在是五块地方,那第一个就是它的链接深度,那链接深度来讲的话,对于扁平结构来讲的话它的链接深度是比较简单的,基本上大家可能就是在同层上面,那对于树形结构来讲的话,它的链接深度可能就会比较深,那我们也知道,太深的这么一个结构的话它是对于整体蜘蛛在抓取这个能力上面的话会有影响。那从管理难度来讲的话,树形结构的管理难度要比扁平结构的难度更加的简单,因为当你扁平都在同一级的时候,比如说你页面有1000个页面的时候,那就很难从一大堆页面里面去找到某个页面,因为他没有分类,那像我们树形结构的话,因为它可以做这样的一个分类,所以说当你要去找L页面的时候,你就可以很快的知道它是在G大类下面,所以说管理上来讲的话,树形结构相对来说简单一点,那在蜘蛛抓取的过程当中,其实蜘蛛可能更愿意去抓层级不是太多的,虽然你这里的页面数量很多,但如果同样换到树形结构上面的话,页面数量应该是差不多的,就是它层级上,那层级小了话,那蜘蛛相对来说他的抓取或者爬行时更好一些,那也不会好很多。还有一块就是我们的记忆能力,那对于页面来讲的话,如果层级越少,不管是目录层级还是我们的页面命令形式越是短的话可能更容易被记忆,或者是说更容易被传播,那从总体采用比例来讲的话,目前来说我还是觉得绝大部分的不管是大中型还是小型网站来讲,就是主要还是以树形结构为主,除非你的网站非常小,就大概10个20个页面的话,你可以考虑用扁平的结构去做。

那第二点其实要跟大家去讲的就是我们蜘蛛抓取事实上我们知道它是一个波纹效应,英文名叫做ripple crawl effects,那什么是叫蜘蛛爬取是波纹的?可能我们大家会有一个误区就是说当蜘蛛去抓取我们网站的时候它可能是由上而下这么个过程~可能是从首页登入到我们的页面,那事实上蜘蛛它不一定每次都是从首页登入的,蜘蛛抓取的路线事实上能是一个波纹的效应,什么是波纹效?波纹效应就是当你投一块石头到水里,你可以看到像涟漪,像由里往外的这样一个形式扩张出去的。那为什么这么说,因为它当我们网站的页面很多的时候,如果你去看你的Crawl认知的话,你的蜘蛛爬网不一定都是从主链接进来的,那可能它是从你中间这个页面,比如:M,那随后登入M这样一个页面我们会称为一个磁心点,随后在这个磁心点的过程当中它会以辐射的形式向外进行这个领域的这样一个过程。因此,会是一个波纹的效应!所以说,当蜘蛛登入我们M的时候,它可能接下来要去抓的页面就是G,L,U和N,随后在这个过程当中,它又会产生向外走,比如说它从N点出去的时候,那可能就是H,O或者是V。所以我们一定要知道就是说其实蜘蛛抓取它不一定是由上而下的,它一定是找到一个核心的一个点,一个magnic point,随后从这个Point里面进行一个这样的波纹,所谓波纹就是由里向外的这么一个散开式的一个抓取方式。所以我们在做网站的时候,不能只是单一的认为,首页是我们唯一的门口,一定要把首页怎样~怎样~,事实上内页也可能成为这么一个入口的。

那第三点,我们去讲一下如何去决定网站的结构?(当你在做一个新站的时候)

那首先,对于我们刚才讲过的三个结构的话,我们要做到一个树、网、静的这样一个结构模式。那对于物理结构来讲的话,我们要做树形(刚才也有讲到)!那对于我们内链结构来讲的话,要做到网形,那网形事实上更像这样一个横竖的这么一个模式,因为只有当交叉这样一个过程当中,不同页面之间它才可以有更好的一个互通。或者是说从上级的页面到非常下级的页面之间,它的链接层数相对可以减少,这样是可以帮助我们蜘蛛去抓取到底层的哪些绝大部分数量的页面的,所以内链要做的是网形!那URL的话,我们要做到的是静态,那通常我们是希望所有的页面都是能用这样一个静态的形式出现,而不是出现那么多的所谓的参数出现啊~或者是其他的一些非常长的这么一些数字和代码。那这样的话,我们如果是按照这样子的三个这样一个结构规定的一种方式去做我们新站的搭建的话,相信上线之后你网站不管是从他的收录的速度或者是今后在你管理的一个难易度上面或者说在一些关键词的排名上面都会有非常好的表现。

那第四点,和大家去聊下就是说常见的一些错误的一些网站结构。那这里举到一个例子,可以看到就是像这个网站:绝大部分的一些内容和内部的一些页面几乎都是要通过它最上方的这样一个主导航,随后主导航你鼠标点上去的话它是会有这样一个下拉菜单,通过下拉菜单去到每个页面,那这样会带来一个问题就是说你所有除了菜单上面的链接之外那像这样一个正式的产品介绍页的时候你就没有链接了~那对于蜘蛛来讲的话,它只能通过最上方的下拉菜单去找到你网站里面的所有的信息,或者说一些页面所存在的一些物理状态。那这样的话,我们前面也讲到其实对于你网站抓取来讲的话或者是蜘蛛爬寻来讲的话是非常不友善的或者说是效率会非常低。所以我们要在做新站的时候一定要避免只用我们主导航去切换页面去导航主页面,这样的做法肯定是不对的。那第二种比较多的就是说,当一个网站在做的时候它~就我们刚才讲到的第一个例子,它会在根目录上面创创建造很多这样的页面~像这个汉高网站来讲的话,比如说它在所有的主导航上面(这排是它的主导航),主导航上面的话可以看到compangy啊~Brand啊~product啊~或Project所有的这些单页面都是在一个根目录上面的,所以它不会去分,这是第一个问题。那第二个问题,对于它的自导航(这里是它的自导航)~。自导航来讲的话它所用的也是公开的一个模式啊~我们刚才也有讲到那这样的话对于潜在用户来讲的话,浏览网页是没有问题的,那对于它的收录或者是这个网站整体性的一个蜘蛛抓取一个能力或者是穿透力来讲的话一定会打折,那可能在短期里面不会太明显,但对于长期来讲的话像这样一个结构就会很容易或者很快就会碰到在排名上面的一个瓶颈。所以我们要尽量减少我们根目录上面的一个数量,并且要去避免动态URL这么一个结构。那当然另外一种的话就是很多网站它们知道二级域名很强,可以去增排名!所以他们会做的一个事情就是滥用所谓的二级域名!那我们知道二级域名相对比起它的二级目录来讲的话权重来的更高!来个比喻,那其实二级目录的形式就像这种形式更像一个单体。那比如说一家人里面爸爸妈妈和孩子,其中的一个就是单体。那对于二级域名来讲的话,因为他的结构模式它是以二级的形式,www替换掉了嘛对吧~所以说它更多像是一个家庭一样的形式。也就是说爸爸妈妈加你三个人这么一个形式。三个人的形式和单体来比较的话一定是家庭形式的权重会更加高!所以说当我们在做网站的时候一定要注意不能去滥用我们二级域名!为什么称为是一个家庭因为它的数量,每个单位的数量是多的。所以像前面一个例子,比如说前面一个Company的介绍,你不可能去推翻二级域名去company介绍的,那这样的话,页面没有达到所谓二级域名这个数量的时候,事实上搜索引擎肯定会认为你是为了获取权重为了去蒙蔽搜索引擎,这个东西重要而去做这个事情,那反而你的效果会不好,所以说这个大家也要注意。

那第五点我们来看一下如何去修改wordpress里面的URL的一个结构?我相信Wordpress应该绝大部分站长或者是建过网站的朋友应该都比较熟悉,因为这个工具是目前全球CMS里面使用率最高的一款软件,那在使用这个软件过程当中如果你要去修改URL结构的话,其实非常简单,你要去来到这个后台,随后在设置里面会有这个叫做“固定链接”,那在固定链接点完之后的话,会有一个叫“自定义结构”,那在自定义结构里面你是可以在这里去填写你想要出来的url的这么一个机构。那在这个结构里面,这里也举到几个例子吧:比如说这个是你的主域名,你域名下面你希望你的页面的URL直接是这个页面的内容,那像这样的话,你可以就在刚这块里面你可以填写比如说postname随后是%这么一个形式,后面加.html,后面只要你出现的新的文章或新的页面都会根据你这个你POST上去条文章的命名作为你的URL的命名。那还有一种的话就是我可能不希望是.HTML的形式,我可能希望是像二级目录的形式,直接关掉,那其实很简单,你只要要把HTML替换掉,改成这样一个“/”(反斜杠)就可以了!那另外一些人可能说因为我写的内容很多,希望可以有个时间上面的一个区分,那比如说它想增加进去一个年度,那增加一个年度可能你就要在之前的代码上面再加一个年这么一个编码就可以了!包括有些人说我们所有的东西我想写在我的blog下面,以这个category的名字来定义的话,当然你可以写死,你写死的话就直接写BOLG,后面还是跟postname。那如果你不想写死,想根据你实际的category名字的话,那这里就是%categoryname%。那还有就是说担心有时候在写文章名字的时候很怕以后会有重复嘛~那最好方式就是说在文章名字后面再去跟一个递进的数字,就即便以后再写~比如说what-is-SEO的时候的话,那334是第一次,那以后就可能变成337对吧~它是跟着数字递增上去的,那其实也很简单,你只要再去加一个post_id就可以了,那当中的话你是可以加一个这样一个减号键,那减号符号在里面出来的效果也是像这样的。那当然wordpress其实它的固定链接写的方式是非常多的,这里我也给大家一个链接,大家可以去看!如果你需要去修改这样一个命名参数的话。

那当然绝大部分的网站它用的不一定是wordpress,可能是其他的一些CMS系统,那当然CMS系统本身就自带URL结构的话那是最好!那如果没有自带的话那这是你要去修改URL结构的时候可能更多是你要懂这个代码的人进行操作,那这样情况下,一般网站会分为APACHE的主机和我们.NET的主机。那在APACHE主机里面我们主要是通过.htaccess的界面去进行URL的Rewrite,因为APACHE主机它是有一个URL Rewrite这个module的。那当然这个代码的话可能对于一个非技术型的人来讲的话相对是比较难去理解的。那当然只要我们把URL的一个优化的结构给固定好,那我们的程序员去实现的话就是可以~那后面的几个讲义的话会提到这个!那当然我这边也列出了一些链接,也是比较全的在百度百科上面关于Apache的URL重写的一个修改的一个指导。那当然对于.NET来讲的话,那主要是把代码是写在web.config里面的,那这里也是举到了一个简单的例子,那可能是代码要去替换的话可能会写成什么样子?那同样我也是列了一个相对比较全的这么一个.NET的URL rewrite的这么一个参考资料,那整体来讲的话其实对于URL重写来讲,其实更多是对于搜索引擎数量目录上面的一个帮助,那对于内部链接来讲的话它更多的是让蜘蛛如何去比较有效的爬寻和抓取,那物理结构主要是让网站在更新改版管理的时候操作更加简便!

所以这是今天爆老师给大家的分享!希望大家喜欢!我们下期再见!

文档下载

什么是网站结构-咨道一课2.0
返回到优化技能课程 | | 作者:爆老师 Boson 发表于 05/12/2013

『欢迎大家在下方参与(什么是网站结构-咨道一课2.0)评论和分享』


在线咨询