日志分类:SEO

SEO离搜索引擎营销有多远?

2007-10-22   |  分类:SEO

       许多网站通过SEO(搜索引擎优化)的方式来提高网站被搜索引擎搜索到的可能性,以及是检索结果排名靠前,因此SEO通常被认为是一种非常有效网络营销的营销方式,甚至被列为搜索引擎营销的一种。但是,目前SEO还远远达不到营销层面的高度,充其量只是提高网络营销或者搜索引擎营销的一种技巧。

  以通过搜索引擎开展网络营销活动为例,作为营销人员,需要了解搜索引擎使用的需求和使用心理、搜索引擎的功能和检索特点,以及本产品或服务的特性在网上的展现,这也是一个了解消费者、了解营销工具,以及了解自身产品的过程。事实上,这个过程就是开展搜索引擎营销的前提条件。涉及到三个关键环节:潜在消费者、搜索引擎和产品信息在网络上的展现。

  借助搜索引擎开展营销活动,首先需要有网络平台,无论是公司自身的网站还是借助其他网站提供的平台,这样就提供了一个让潜在消费者找到你的机会。没有这个平台,网络营销无从谈起。然后,要确保贵公司在这个平台的信息是建立在对消费者所需信息的预期的基础上的,并且这个信息是经过精心处理、比较充分、能够代表公司的产品和服务信息的正面形象,这些信息需要能够消除消费者的误会。

  在网络上充斥着各种关于贵公司产品或服务良莠不齐的信息的时候,更需要保持足够的警惕,这个时候就需要做一些SEO工作。必要时,还需要向诸如百度这样的搜索业务提供商购买一些竞价排名这类的服务:设计一些和贵公司产品或服务相匹配的关键词,以提高公司信息正确传达到潜在消费者的可能性。当公司出现公关危机的时候,更需要有这样的渠道来澄清一些误会,提供一个公众找到你的途径。

  没有精心处理好网站的信息就盲目开展SEO,所取得的效果无疑是负面的,开展SEO的一个前提是欲传达信息必须是正面、你所想传达信息,否则宁愿不要使用这种技巧。另外,搜索引擎的内部算法在不断调整,很多SEO的方法是建立在对现有搜索引擎工具算法的理解基础上的,这是一个动态的过程,也需要作出不断的调整。内容才是关键,不管怎么调整,确保产品和服务信息是你想要传达的。

meta标签的运用。

2007-10-22   |  分类:SEO

在网页之间常加有很多的meta内容,它包含着关于你网页的一些隐藏信息,能让搜索引擎更好地理解你的网站内容的种类,那么常用的有哪些,他们起着什么作用,下面做个小整理

1、meta name=”keywords”
作用:十分重要,意为本页面设及关键字,真正的SEO 会建议你根据页面内容而去填有相关性的“关键字”,而非大量的的关键字堆积,当然大量的关键字堆积曾是种丰常有效的方法,但随搜索引擎工具日渐完善,keywords作用也被提升,你的堆积很有可能遭到搜索引擎工具直接删除的惩罚,是站长们最常用的meta内容;
建议:在选择关键词时,除了要考虑与网页核心内容相关之外,还应该是用户易于通过搜索引擎检索的,过于生僻的词汇不太适合做META标签中的关键词。


支持:现知搜索引擎工具都已支持
2、meta name=”description”
作用:本页面的描述内容,这里Blank是这样建议的,除非你有很强的文字归纳能力,否则还是请留空吧,虽然到现在他的作用已经是微不足道,但错误的描述对本页的影响还是有的!最好对每个网页有自己相应的描述(至少是同一个栏目的网页有相应的描述),而不是整个网站都采用同样的描述内容,因为一个网站有多个网页,每个网页的内容肯定是不同的,如果采用同样的description,显然会有一些网页内容没有直接关系,这样不仅不利于搜索引擎对网页的排名,也不利于用户根据搜索结果中的信息来判断是否点击进入网站获取进一步的信息。
支持:现知搜索引擎工具都已支持
3、meta name=”NOFOLLOW”
作用:告诉Google不要关注含此标签的网页里的特定链接。这是为了解决链接spam而设计的Meta标签。在对Link概念模糊的情况下,还请慎用!
支持:由Google发起
4、meta name=”NOINDEX”
作用:告诉Google不要索引含此标签的网页。但根据Blank实际经验,Google并非100%遵守
支持:由Google发起
5、meta name=”NOARCHIVE”
作用:告诉Google不要保存含此标签的网页的快照。一般用于专题页面中,当然若你要将你全站都设置成这样,那么请在你建站时就加入该标签,否则请给Google点缓冲的时间,他的效果不是即时生效的
支持:由Google发起
6、meta name=”NOSNIPPET”
作用:告诉Google不要在搜索结果页的列表里显示含此标签的网站的描述语句,并且不要在列表里显示快照链接;挺麻烦的标签,不怎么建议使用,具站长世界统计该功能也用得少
支持:由Google发起
7、meta Name=”NOODP”
作用:ODP即dmoz.org,而NOODP标签的作用就是防止搜索引擎调用ODP上面的描述性语句
使用:你可以在网页的头部加入:META NAME=”ROBOTS” CONTENT=”NOODP” 或者META NAME=”Slurp” CONTENT=”NOODP”;来阻止搜索引擎使用ODP描述。其中第一个对Google、Live Search及Yahoo!均有效,而第二个只对Yahoo!有效。
支持:于2006年7月,由Google和微软MSN搜索(即现在的live search)联合发起
8、meta name=”robots”
作用:表示所有的搜索引擎,现有搜索引擎工具蜘蛛列表Baiduspider—baidu.com、scooter—altavista.com、ia_archiver—alexa.com、Googlebot—google.com、Fast-Webcrawler—alltheweb.com、Slurp—inktomi.com、msnbot—search.msn.com;content部分有四个指令选项:index、noindex、follow、nofollow,指令间别忘了以“,”分隔,否则是没有效果的,以{META NAME=”googlebot” CONTENT=”index,follow,noarchive”}为列,其意思是说“表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照”
提示:该功能常与网站robots.txt联合使用,同时值得注意的是,为robots被更有效的读取,是建议把robots放在网站根目录中;robots.txt书写方式>>>>
支持:目前各搜索引擎工具对其都已经支持,但针对不同的老板,还需作适当的修改!
备注:
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

9、meta http-equiv=”……”
作用:HTTP-EQUIV用于向浏览器提供一些说明信息,从而可以根据这些说明做出相应。HTTP-EQUIV其实并不仅仅只有说明网页的字符编码这一个作用,常用的HTTP-EQUIV类型还包括:网页到期时间、默认的脚本语言、默认的风格页语言、网页自动刷新时间等
支持:

10、时下最新的标签有“unavailable_after”,在先前的“Adsense蜘蛛Mediapartner bot对网站收录的影响”中有提到他的用法,及设置方式
这里再作个简单的描述:
要使用“unavailable_after”标签,只需要在网页的头部加入以下的Meta语句即可:

其中的日期、时间、时区(缩写)分别用23-Jul-2007、19:18:17、EST这种格式。当Google的爬虫看到网页里包含这个标签时,它不仅会不再抓取这个网页,还会在一天左右的时间内将网页从Google的搜索结果里除去。值得注意的是,Google Cache里的相关的网页快照依然会存在。要想移除Google Cache里的记录,得给网页加上noarchive标签。

robots.txt屏蔽搜索抓取

2007-09-28   |  分类:SEO

         搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
          您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt文件应该放在网站根目录下。

         当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

robots.txt文件的格式:
“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:
“<field>:<optionalspace><value><optionalspace>”。

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:

User-agent:
  该项的值用于描述搜索引擎robot的名字,在”robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。

Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如”Disallow:/help”对/help.html 和/help/index.html都不允许搜索引擎访问,而”Disallow:/help/”则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”文件中,至少要有一条Disallow记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。
robots.txt文件用法举例:
例1. 禁止所有搜索引擎访问网站的任何部分 下载该robots.txt文件 User-agent: * Disallow: /
例2. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file) User-agent: *Disallow:
例3. 禁止某个搜索引擎的访问 User-agent: BadBotDisallow: /
例4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: /
例5.一个简单例子  在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。  需要注意的是对每一个目录必须分开声明,而不要写成 “Disallow: /cgi-bin/ /tmp/”。  User-agent:后的*具有特殊的含义,代表”any robot”,所以在该文件中不能有”Disallow: /tmp/*” or “Disallow:*.gif”这样的记录出现. User-agent: *Disallow: /cgi-bin/Disallow: /tmp/Disallow: /~joe/

Robot特殊参数:
1. Google
允许 Googlebot:
如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页,可以使用下列语法:

User-agent:Disallow:/
User-agent:Googlebot
Disallow:
Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。

“Allow”扩展名:
Googlebot 可识别称为”Allow”的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。”Allow”行的作用原理完全与”Disallow”行一样。只需列出您要允许的目录或页面即可。

您也可以同时使用”Disallow”和”Allow”。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目:

User-Agent:Googlebot
Disallow:/folder1/
Allow:/folder1/myfile.html
这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。

如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用”Allow”规则允许该漫游器的访问。例如:

User-agent:Googlebot
Disallow:/
User-agent:Googlebot-Mobile
Allow:

使用 * 号匹配字符序列:
您可使用星号 (*) 来匹配字符序列。例如,要拦截对所有以 private 开头的子目录的访问,可使用下列条目:

User-Agent:Googlebot
Disallow:/private*/
要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目:

User-agent:*
Disallow:/*?*

使用 $ 匹配网址的结束字符
您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用下列条目:

User-Agent:Googlebot
Disallow:/*.asp$
您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包含该 ID 的网址,确保 Googlebot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置:

User-agent:*
Allow:/*?$
Disallow:/*?
Disallow:/ *?一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字符串,然后是问号 (?),而后又是任意字符串的网址)。

Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。

Sitemap 网站地图:
对网站地图的新的支持方式,就是在robots.txt文件里直接包括sitemap文件的链接。
就像这样:
Sitemap: http://www.etcis.com/sitemap.xml
目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。
不过,我建议还是在Google Sitemap 进行提交,里面有很多功能可以分析你的链接状态。

Robots.txt带来的好处:
1. 几乎所有的搜索引擎Spider都遵循robots.txt给出的爬行规则,协议规定搜索引擎Spider进入某个网站的入口即是该网站的robots.txt,当然,前提是该网站存在此文件。对于没有配置robots.txt的网站,Spider将会被重定向至404 错误页面,相关研究表明,如果网站采用了自定义的404错误页面,那么Spider将会把其视作robots.txt——虽然其并非一个纯粹的文本文件——这将给Spider索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。

2. robots.txt可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也没有太大意义,但却耗用大量带宽。

3. robots.txt可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会索引那些临时文件。

4. 对于内容丰富、存在很多页面的网站来说,配置robots.txt的意义更为重大,因为很多时候其会遭遇到搜索引擎Spider给予网站的巨大压力:洪水般的Spider访问,如果不加控制,甚至会影响网站的正常访问。

5. 同样地,如果网站内存在重复内容,使用robots.txt限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content的惩罚,保证网站的排名不受影响。

robots.txt带来的风险及解决:
1. 凡事有利必有弊,robots.txt同时也带来了一定的风险:其也给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在Web服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。

  比如说,如果网站中的私密数据通过www.yourdomain.com/private/index.html 访问,那么,在robots.txt的设置可能如下:

User-agent: *
Disallow: /private/

  这样,攻击者只需看一下robots.txt即可知你要隐藏的内容在哪里,在浏览器中输入www.yourdomain.com/private/ 便可访问我们不欲公开的内容。对这种情况,一般采取如下的办法:

设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。
另一种办法是将缺省的目录主文件index.html更名为其他,比如说abc-protect.html,这样,该内容的地址即变成www.yourdomain.com/private/abc-protect.htm,同时,制作一个新的index.html文件,内容大致为“你没有权限访问此页”之类,这样,攻击者因不知实际的文件名而无法访问私密内容。
2. 如果设置不对,将导致搜索引擎将索引的数据全部删除。

User-agent: *
Disallow: /
上述代码将禁止所有的搜索引擎索引数据。

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:

<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>

表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

阿里巴巴新产品SEO分析

2007-09-28   |  分类:SEO方案

阿里巴巴新业务SEO分析 

    阿里巴巴最近又有大动作,对旗下的诚信通进行了产品升级,升级举措主要是为诚信通用户申请国际域名邦定到客户的诚信通公司主页上。对于用户来说,这样的举措肯定是受到欢迎,毕竟有阿里巴巴来帮我宣传,何乐而不为,用户高兴阿,以后可以不用自己的网站了!先不谈这个举措给用户和阿里带来的好处如何,下面以一个商铺为例子:咱们先谈谈SEO方面的问题

阿里的商铺域名:http://sodr2000.cn.alibaba.com/

阿里送给用户的:http://www.asura-china.cn/

     阿里巴巴推出的新服务,赠送用户的URL与原来的商铺的URL的相似度就是100%相同了,那么肯定会造成其中一个域名的或阿里巴巴的整个产品的域名在搜索引擎的权重下降!或者人为的删除网页。

第一:复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。

第二:网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。从上面这几种情况来看,补充材料在大部分情况下和网页内容重复或类似有关。而阿里巴巴推出的新服务,赠送用户的URL与原来的商铺的URL的相似度就是100%相同了,那么肯定会造成其中一个域名的或阿里巴巴的整个产品的域名在搜索引擎的权重下降!

不过最近GOOGLE会逐渐取消补充材料这一点。 由于“补充材料”和常规结果之间的差距越来越小,因此Google觉得不必要再特地将来自补充索引数据库的网页标记为“补充材料”,于是它决定停止了这一做法。换言之,“补充材料”将成为历史。这意味着以后我们在Google上面进行搜索,将得到更准确及更全面的搜索结果,因为Google的两大索引数据库正在融合。

 针对这一问题如:http://www.asura-china.cn/robots.txt

打开这个URL你会看到

User-agent:*

Disallow:/

说明:robots.txt文件的格式“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:“<field>:<optionalspace><value><optionalspace>”。在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow,详细情况如下:User-agent:
  该项的值用于描述搜索引擎robot的名字,在“robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在“robots.txt”文件中,“User-agent:*”这样的记录只能有一条。Disallow:该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如“Disallow:/help”/help.html /help/index.html都不允许搜索引擎访问,而“Disallow:/help/”则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在“/robots.txt”文件中,至少要有一条Disallow记录。如果“/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

robots.txt文件用法举例:
1. 禁止所有搜索引擎访问网站的任何部分下载该robots.txt文件 User-agent: * Disallow: /
2. 允许所有的robot访问 (或者也可以建一个空文件
“/robots.txt” file) User-agent: *Disallow:
3. 禁止某个搜索引擎的访问
 User-agent: BadBotDisallow: /
4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: /

    阿里巴巴的策略就是选择在新域名中使用robots.txt文件了来禁止搜索引擎抓取页面,robots.txt的使新域名不被搜索引擎收录,蜘蛛基本不会抓取新域名内容。

    阿里巴巴的产品都相当的清晰,在做任何调整的时候都会考虑到SEO的因素,策略和产品,还有营销,每一项用户体验的提升都必须把SEO 的因素考虑进去,自从阿里被降权以后,采用许多策略,能不能把排名提升呢,我们拭目以待!

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

SEO软件:SEOM,免费下载

2007-09-26   |  分类:SEO

本帖随新版本发布即时更新,敬请关注!纯绿色软件,无需要安装,无需要注册,完全免费

  使用SEOM,随时查询你指定的关键词在搜索引擎搜索结果中的排名情况,可以查询一个关键词的排名,也可以添加批量关键词,批量查询。

  批量查询时,系统会自动记录历次查询的最佳排名,与本次查询结果对比显示,让你随时了解关键词排名的升降情况。

  使用SEOM,轻松掌握SEO工作阶段性的情况和成果。

下载地址:www.etcis.com/seom.exe

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

转:Discuz论坛SEO方案

2007-09-08   |  分类:SEO方案

假设discuz已启用伪静态功能,使用5.0/5.5 GBK 版本;

1、meta,content 优化
2、内容页的网页复制问题
3、robots.txt使用及其它

更新
discuz5.5的robots.txt问题
DZ 禁止一个版面帖子的收录的补充

一、meta的优化

discuz的后台可以对meta信息进行设置,甚至可以添加自己的头部信息,但它的设置都是针对于所有页面的,全部页面都拥有相同的keywords和description是SEO所不赞成的。

方案一:删除meta

修改页头模板文件 templates/default/header.htm:将meta的keywords和description标签删除。

这两个标签作用很小了,而且还有discuz自带的一些无用信息,用得不好反而会有坏作用,因此宁缺勿滥。

方案二:定制meta

本部分实现了将内容页keywords设为帖子标题,description为内容前100字;也实现了主页与各版列表页meta的单独设置(不同版的不同,同一版各列表页相同)。

1.修改页头模板文件 templates\default\header.htm:将meta的keywords和description标签改为如下形式

<meta name=”keywords” content=”{$metakeywords}$seokeywords” />
<meta name=”description” content=”$seodescription” />
这里的$seokeywords、$seodescription就是后台设置的那个值,下面说怎么定制这个值;{$metakeywords}是奇虎的关键字,留下以后处理

2.内容页(viewthread)设置keywords为帖子标题,description为内容前100字

2.1修改 viewthread.php 文件:
在 include template(’viewthread’); (更新:dz5.5为iinclude template($iscircle ? ’supesite_viewthread’ : ‘viewthread’); ) 语句的上面加入一行:
require_once DISCUZ_ROOT.’./include/bmt.thread.inc.php’;

2.2创建 include/bmt.thread.inc.php 文件,内容为

<?php
if(!defined(’IN_DISCUZ’)) { exit(’Access Denied’); }

$seokeywords = strip_tags($thread['subject']); //关键字设为帖子的标题
//(已更新: nethome 提出问题,当启用主题分类并允许按类别浏览时,原来代码会有问题。所以加了标签过滤,本来在viewthread.php中改更好,为以后升级方便,还是放在这里吧,subject很短,不会影响效率)

$seodescription = current( $postlist );//description取文章内容的前100字
$seodescription = mb_substr( $seodescription['message'],0,100,”gb2312″ );
$seodescription = htmlspecialchars( strip_tags($seodescription) );
?>
*此处数字和个别函数适用于GBK版本

最后一行作用是过滤内容中的html,否则在meta中会引起语法错误。先是去除HTML标签,但因为这里是前100字,有可能html标签已经被截断了,所以又用了htmlspecialchars转义一下,有可能会有些垃圾信息。
当然也可以在截取之前用strip_tags去除html标签,可能效率会差了。

*所以此处表达式您需要根据自己的情况修改。
我目前用的是preg_replace( ‘/[^\xa1-\xff]/’, ”, $seodescription ),即过滤汉字以外的所在内容,但这样会损失英文关键字。

别外说明,此处数据都是viewthread.php已取好的,所以不会产生额外的数据库操作,只是做了字符串处理,不会引响效率。

3.列表页(forumdisplay)设置不同的keywords和description

3.1修改 forumdisplay.php

文件,在 include template(’forumdisplay’); 语句上面添加
require_once DISCUZ_ROOT.’./include/bmt.forum.inc.php’;

3.2创建 include/bmt.forum.inc.php 文件,内容为

<?php
if(!defined(’IN_DISCUZ’)) { exit(’Access Denied’); }
$seokeywords = $forum['name'];
$seodescription = $forum['description'];

switch ( $forum['fid'] ){
   case 1: //此数字为版的ID号,不同版设置不同的meta
       $seokeywords = ‘key1,key2,…’;
       $seodescription = ‘xxxx xxxx xxxx’;
       break;
   case 2:
       $seokeywords = ‘key1,key2,…’;
       $seodescription = ‘xxxx xxxx xxxx’;
       break;

}
?>
//更新:一般情况下可以不用switch和case,列表页的关键字为版名,说明为版的说明,若要对某个版设置特殊的关键字和说明,可以设置case。这样解决了版面很多时要设置很多case语句,加快了程序执行速度(不了解php,JAVA的 case进行了优化,执行很快)

使用修改文件来实现,每版的meta改起来不方便,感觉有些弱智,呵呵。但没有改数据库,用了两个单独的文件,修改了两个文件也很简单,这样升级或迁移更方便吧

case虽然多了一些,但比起读数据库的记录,速度应该快很多

4.主页meta
在后台设置即可。(如果2、3不做,则meta也同主页)

content的优化
discuz有个archiver,一是URL容易收录,二是页面比较干静,还有description会从正文中取内容,但archiver没有对内容中[b][url]之类的解析,那些标签起不到作用,原样显示还会增加垃圾信息。
本部分主要做两方面的优化,一是去除内容页的无用信息,二是给标题加上

<h1>

。加上伪静态和上篇meta的优化,效果就超过了archiver,因此可以在后台禁用它,还减少了复制网页。

实施方案

1.隐藏内容页(viewthread)中的无用信息:
修改内容页模板文件 templates/default/viewthread.htm:

用<!–{if $discuz_uid}–>   <!–{/if}–>将要隐藏的信息包含起来。

准确的说是当游客(bots)访问时,隐藏那些信息,当用户登录后是正常的,所以不影响使用。
这些信息主要指的是左侧用户信息栏、(资料 个人空间 主页 短消息 等等)、用户的签名(隐藏后不怕签名的内容影响正文,链接也不起作用了:P)
以住相关文章

2.为标题加上

<h1>

标签
修改内容页模板文件 templates/default/viewthread.htm:

将 <span class=”bold”>$post[subject]</span><br><br> 替换为
<h1>$post[subject]</h1>

定制“本帖最后由 XXX 于 xxxxxx 编辑”内容

修改文件 templates/default/misc.lang.php:将下面两行改成您喜欢的内容:

‘post_edit’ => ‘\n\n[[i]] 本帖最后由 $editor 于 $edittime 编辑 [/i]]’,
‘post_edit_regexp’ => ‘/\n{2}\[\[i\] 本帖最后由 .*? 于 .*? 编辑 \[\/i\]\]$/s’,
比如我改成 [ 网站名 URL xxx 于 xxxx 编辑]。改程序无聊时的自娱,呵呵
注意上下两个表达式要匹配。为了防止解析方括号是全角,不要复制后在文件中查找。

二、内容页的网页复制问题

看看内容页的URL大家就知道了:thread-(tid)-(page)-(forumdisplay page).html,可以看出最后一节表示的是此帖在列表页的第几页。所以,当您的帖子越来越多,这个帖就会由第一页到第二页…,它的URL就会不断的变化。其实打开一个列表页就可以看出来,第2页的帖子链接的最后数字都是2,第3页的都是3,只是很少注意它。我是在SE的收录中发现复制网页越来越多,才对最后的数字注意的。

解决方法
修改 forumdisplay.php 文件:

将 $extra = rawurlencode(”page=$page$forumdisplayadd”); 语句替换为
$extra = rawurlencode(”page=1$forumdisplayadd”);
语句中的page就是forumdisplay page,这样改后不管帖子在列表页的第几页,这个数都是1。

功能损失:当用户编辑帖子或版主管理帖子后,有个提示跳转页:选择转入列表页还是主题页,这时转入列表页的话,只能转到列表页第一页,而不管您原来停留在第几页。

redirect的301重定向

在discuz论坛中可以看到类似redirect.php?tid=xxx&goto=lastpost#lastpost这样的链接,它的功能是实现“最新发表、最后发表、上一主题、下一主题“功能,仅这一个功能就可以给同一个内容页造成四份复制网页,因此将这样的链接301永久重定向到帖子的静态地址。

解决方法
修改 redirect.php 文件:

将前两个 require_once DISCUZ_ROOT.’./viewthread.php’; 语句替换为
$bmt_url=’Location:/thread-’.$tid.’-’.$page.’-1.html’;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
将后两个 require_once DISCUZ_ROOT.’./viewthread.php’; 语句替换为
$bmt_url=’Location:/thread-’.$tid.’-1-1.html’;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
dz5.5的引用处也有个跳转,也可以做301:

将 dheader(”Location: viewthread.php?tid=$post[tid]&page=$page#pid$pid”);替换为
$bmt_url=’Location:/thread-’.$post[tid].’-’.$page.’-1.html#pid’.$pid;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
***注意此处直接转到了静态地址,没有做判断是否开启伪静态功能,所以不开启会有问题

功能损失:转向到静态地址后,动态地址中类似#lastpost的锚点将无法起作用了,可能要手动滚屏了
???好像没有影响锚点

提示信息页的网页复制

这个问题和内容页也有着很大的关系,呵呵。如管理员设置允许游客浏览列表,而禁止浏览内容时,这些内容页都将返回一没有权限的提示信息页,但它们的URL 是不同的,这样就形成了严重的网页复制,此外还有其它形成的无权操作等。别一种提示信息如帖子不存在等,数量大了也会形成网页复制。这两种提示信息,都是通过showmessage函数分别调用nopermission.htm和showmessage.htm两个模板实现的。

解决方法
1.创建另一个头模板文件 templates/default/header_disbots.htm
内容同 header.htm 文件,但加入meta robot标签,如下

<meta name=”robots” content=”noindex,nofollow” />

2.分别修改 templates/default/nopermission.htm 和 templates/default/showmessage.htm 文件
将它们第一行的 {template header} 替换为 {template header_disbots}

虽然对meta robots标签支持的不是很广泛,但这是比较省事的方法
因为是提示信息页,用301来实现的话,还要传给转到的页好多信息,修改起来比较麻烦

三、robots.txt使用

User-agent: *

#禁止一个版面的收录
#如果有个水版,不想禁止游客权限,也不想SE收录,已免影响网站质量,可以用如下方法
Disallow: /forum-1-

#数字即为要禁止版块的ID。
#注意数字最后的 - 不要省略,否则连ID为11,12等1开头的版都禁了
[更新]补充方法:再给内容页加meta robot禁止

#再禁网页复制
Disallow: /viewthread.php
#这个是内容页的动态形式,前面对伪静态做了优化并修改了很多的复制网页,因此这里动态形式如打印页等一定要禁止

Disallow: /forumdisplay.php
#这个要慎重:列表页的动态形式,还包括精华、活动、投票等形式。我发现5.0的静态化不彻底,它的上一页下一页翻页仍是动态,这样如果禁止了,十页之后的内容就不能通这索引了。所以如果您站内的交差链接不丰富的话,不要在此禁止,以免影响收录。

hekaiyu说没有这个问题,去官方看了下5.5的确没问题(也许我的5.0本来没问题,也许官方在新版本中完善了正则表达式的替换规则),这样更好了,禁止它,又干净了好多

#禁止其它无用内容
Disallow: /profile
#用户信息,不知为什么discuz也静态化了,一律禁止
Disallow: /relatethread
Disallow: /post
Disallow: /blog
Disallow: /member
Disallow: /misc
Disallow: /faq
Disallow: /my
Disallow: /pm
Disallow: /digest
Disallow: /status
# … … 等等
# —– robots.txt end ——
[更新]dz5.5的robots.txt后部分给出的Disallow: post.php等是不合规范的,一定要在前面加上”/”。>>详细说明

首页URL问题

后台基本设置->首页文件名如果不设置,会默认为index.php。所以站内到首页的链接为形式为http: //domain/index.php。而我们一般引用论坛首页或交换链接的形式一般是http://domain/。实际是一样的,但SE可认为是两个 URL,而且一个拥有很多的内部链接,一个拥有较多的外部链接,所以哪个被降级都不是好事情,最好统一起来。这里的修改目标是http: //domain/的形式。

1.进入后台,基本设置->首面文件名 设置为: /
2.修改文件 member.php 将 header(”Location: {$boardurl}”.$indexname); 替换为

if( $indexname==’/'){
   header(”Location: {$boardurl}”);
}else{
   header(”Location: {$boardurl}”.$indexname);
}
[更新]dz5.5为dheader

此修改处的功能是清除cookies后返回到首页,如不修改域名后就有两个/。暂时未发现使用/当首页文件名的其它问题

结 束

除了文件的修改,有些地方要配合后台设置,前面都提到了,这里总结一下。主要有:1.URL静态化,只启用普通页面静态化就可以了;2.不要启用 Archiver功能;3.后台的keywords和description设置只是针对首页的(如果您没做列表页和内容页的meta修改则也应用到它们);4.后台首页文件名为/(当然您也可以设置自己特定的)

幻色网站SEO方案

2007-08-28   |  分类:SEO方案

花了几个小时的时间对幻色网站的结构以及内容进行了分析,并且针对问题提出解决方案,希望被采纳。

此方案包括了幻色的SEO问题分析,具体问题的解决方法,部分关键词的分析。

1.  网页全部都是同一个标题2.  标签没有充分利用3.  网页链接结构不合理,网页之间缺乏关联性。 4.  网页文字编辑没有考虑到SEO因素5.  图片链接没有合理的描述性文字6.  网站地图7.  内外部链接

一.标题优化。从后台更新新闻的时候为每一个页面设置标题。每一个网页的标题,关键词和描述标签都应该不一样千万不要做成一个频道里所有网页标题全是一个。而幻色的网站正是每一频道里所有网页标题全是一个!这一点是非常恐怖的。因为这样的页面搜索引擎会认为你的网站是在大批量的复制网页。复制网页会遭到惩罚的,比如搜不到你网页的内容。减少网页被收录的内容。

二.网页标题,关键词和描述标签

网页设计这个关键词很多网站都在抢。竞争对手主要包括: 网页设计师联盟 蓝色理想 以及一些百度竞价的网站。 网站 关键词的密度保持在 2%-4%之间。 
keywords:网页设计,新网页设计师,设计师专访,设计交流 ,web网页设计,网页设计门户description:本站是一个中国网页设计,提供网页设计素材,优秀设计师推荐,网页设计欣赏,网页设计师交流平台的web网页设计综合门户corpright:Copyright 2006-2007 幻色中国 版权所有

二.网站网页链接结构不合理,针对错误页面重定向。整个网站应该非常清楚的形成树型结构,内部频道的连接采用 2级域名的形式进行链接。如素材: http://sc.rgbcn.net/

错误页面重新定向404:服务器找不到指定的资源,请求的网页不存在(譬如浏览器请求的网页被删除或者移位,但不排除日后该链接有效的可能性);410:请求的网页不存在(注意:410表示永久性,而404表示临时性);200:服务器成功返回请求的网页;301:网址永久性重定向302:网址临时性重定向 
1). HTTP 404错误HTTP 404 错误意味着链接指向的网页不存在,即原始网页的URL失效,这种情况经常会发生,很难避免,比如说:网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等,导致原来的URL地址无法访问;当Web 服务器接到类似请求时,会返回一个404 状态码,告诉浏览器要请求的资源并不存在。但是,Web服务器默认的404错误页面,无论Apache还是IIS,均十分简陋、呆板且对用户不友好,无法给用户提供必要的信息以获取更多线索,无疑这会造成用户的流失。

IIS服务器下实现404重定向首先应明确的是,404错误应工作在服务器级而不是网页级。对定制使用动态页面如PHP脚本类型的404页时,必须确保在PHP执行前服务器已经顺利地送出“404”状态码,不然,一旦执行到了ISAPI级别,返回的状态码便只能是“200”或其他如“302”之类的重定向状态码了。 
其次,在自定义网站的404错误页面时,对设置的错误页面URL链接应使用相对路径而不是绝对路径,而且自定义404页面应该放在网站根目录下。尽管无效链接可能是多种形式的URL,但当发生404访问错误时,WEB服务器会自动将其转到自定义的当404错误页中,这跟URL的形似没有关系

Apache下设置404错误页面 
为Apache Server设置 404错误页面的方法很简单,只需在.htaccess 文件中加入如下内容即可:ErrorDocument 404 /notfound.php

注意:1.切记不要将404错误转向到网站主页,否则可能会导致主页在搜索引擎中消失2.切记不要使用绝对URL!

2).301跳转定向APACHE环境实现301重定向推荐使用301跳转,当用户访问rgbcn.net时,自动引导用户进入新域名www. rgbcn.net,可以通过程序或域名跳转实现301跳转,这样可以将旧域名PR传递到新域名。Options +FollowSymlinks
RewriteEngine on
rewritecond %{http_host} ^ rgbcn.net [nc]
rewriterule ^(.*)$ http://www. rgbcn.net/$1 [r=301,nc] 
WIN环境下的301跳转定向IIS服务器实现301重定向* 打开internet信息服务管理器,在欲重定向的网页或目录上按右键,见下图
* 选中“重定向到URL”
* 在对话框中输入目标页面的地址
* 切记,记得选中“资源的永久重定向”
* 当然,最后要点击“应用”
 三.内部链接优化系统在自动产生网页的时候,网页标题就应该是产品名,有的时候也可以按”产品名-频道名-网站名”顺序全部加上。但不应该是”网站名-频道名-产品名”。如26期幻色的金牌设计师页面“TTMouse-推荐人物-金牌设计师-幻色中国”幻色的每一频道里所有网页标题全是一个标题。源代码显示全部是<title>幻色中国 - 中国专业web网页设计门户</title>这样的页面搜索引擎会认为你的网站是在大批量的复制网页。复制网页会遭到惩罚的,比如搜不到你网页的内容。减少网页被收录的内容。所以需要改进这个问题。

关键词和描述标签应该结合产品名和产品的其他特性生成,如品牌,作者,型号等。 
好的CMS系统应该在后台允许客户输入自定义的网页标题标签title tag,关键词标签keywords tag和描述标签description tag。对大的网站来说,用户自定义每个网页的标题,关键词和描述标签,比较困难,工作量太大。但是至少对首页和频道首页应该允许用户自定义,对更深层的产品页可以给用户两种选择,既可以自定义,也可以从产品名称和描述中自动提取。

解决办法:1、更换CMS系统          2、手工为每一个页面增加网页标题,关键词和描述标签          3、请程序员改进网站程序 
四.  CSS样式和JS文件的使用 
CSS和JS都应该放为外部文件。不管是由CMS系统生成的网站,还是普通网站都常会犯的一个错误就是,把CSS和JS放在网页的最前面,把真正的内容推到了很后面。

五.网站地图
系统也要自动生成网站地图。导航系统应该清楚地连向首页和各目录首页。制作了XML版和HTML版网站地图

http://www.rgbcn.net/new/2007-08-15/1187146980d74433.html幻色现在返回首页的是文件名而不是 域名。修改网站内页中返回到首页的链接使用域名而不是文件名,会对关键词排名起到很大的促进作用。 
生成的HTML码生成的HTML码应该干净,尽量减少冗余的编码,应该在不同的浏览器下充分试验兼容性,页码应该符合W3C标准。应该在适当的地方使用不同的heading,比如文章标题,目录或频道名,使用黑体,斜体文字来强调一些地方。

关于我们 | 在线反馈 | 广告服务 | 友情链接 | 联系我们 | 免责声明 | 在线投稿 | 网站地图 加到网页最下面 

转:王通的SEO培训内容

2007-08-16   |  分类:SEO

下面就从八大方面来给大家总结一下影响搜索引擎排名的因素:

    第一条因素:服务器因素

    重点强调:

    1、服务器的地区分布影响排名

    相同的英文关键词, 用相同的方法,总是服务器在美国的网站排到第一页的速度快,放在国内服务器上的慢,所以大家要做英文站,一定要放国外。用户爽,搜索引擎也爽。

    2、服务器的速度和稳定性

    服务器速度快了,蜘蛛爬行你网站的时候效率就高。慢了,用户不喜欢,搜索引擎也不太喜欢。 因为搜索引擎的标准是围绕用户的爱好的。同样的道理,网站的稳定性对搜索引擎也至关重要。

    第二条因素:网站的内容因素

    1、网站的内容要丰富
    2、网站原创内容要多
    3、用文本来表现内容

    第三条因素:Title和meta设计因素

    这一条因素是大家都知道的因素,也是大部分人知道并且还会犯错的因素。

    要点重点强调:

    Title和Meta设计原则:

    1、每个页面的title和meta标签都要不同,并且要与该页面的内容相符合。
    2、title和meta的长度要控制合理:title设计越简洁明了越好,尽量不要超过25个汉字。网页描述meta标签不要超过100个字。
    3、title和meta标签中的关键词密度:title中合理突出1-2个关键词就可以了,不要太多。网页描述meta标签,核心关键词合理出现四次左右。关键词标签已经不被重视,合理放几个关键词就可以了。

    大家要注意一下几点:

    1、title中堆积一大堆关键词:这是严重不合理的。我认为:一个页面只排一个词,最合理。 如果你堆积关键词,别人一看就知道你过度SEO,而真正的SEO,优化过之后,就像没有优化一样,很合理,自然。每个页面的title和meta标签都要不同,并且要与该页面的内容相符合。

    2、title和meta的长度要控制合理:title设计越简洁明了越好,尽量不要超过25个汉字。网页描述meta标签不要超过100个字。

    3、title和meta标签中的关键词密度:title中合理突出1-2个关键词就可以了,不要太多。网页描述meta标签,核心关键词合理出现四次左右。关键词标签已经不被重视,合理放几个关键词就可以了。

    第四条因素:网页的排版

    这条因素也很简单,也是做html时候的基本知识,强调一下第三点:

    1、大标题要用<h1>
    2、文本中的的关键词用<b>加粗或者加重
    3、网页中的图片要加上alt注释:加alt注释的图片,是网页中的重要图片,比如产品图片、明星图片等等,网页中的修饰图片不要乱加,加这个只是为了说明图片的内容,因为图片搜索引擎的用户越来越多,在百度中都超越了MP3用户。合理的加图片说明,不要在说明中堆积关键词。

    第五条因素:域名、文件名、url路径因素

    先讲域名

    如果你做英文站,直接采用包含关键词的域名非常有助于排名,比如你要排china tour这个关键词,如果你选用了chinatour.com,那么很快就可以获得好的排名。我在做英文关键词,都会专门选择域名。如果你是中文站,那么现在可以考虑一下全拼的域名  因为各大搜索引擎都可以很好的识别拼音了。这样对你的排名也非常有利,比如大家在google搜索一个“网络赚钱”,排第一的就是一个做的很差的网站,但是它很短时间就跑到了前面。

    文件名

    中文网站无所谓,如果你做英文站,文件名要用关键词,并且各个单词之间要用中横线“-”分开,这点很重要,不要用下横线。

    接下来讲url的权重

    二级域名比栏目页具备优势:abc.web.com比www.web.com/abc/有排名优势;栏目页比内页具备优势:www.web.com/abc/www.web.com/abc.html这样的路径有排名优势;静态路径比动态路径具备优势:www.web.com/abc.htmlwww.web.com/adc.asp?=321 这样的路径具备优势。

   为什么是这样规则呢? 其实很简单。比如我注册一个域名,我用这个域名的首页排“电子商务”这样的一个关键词。那么搜索引擎就认为这个网站整个网站都围绕这个主题。那么,我这个网站针对电子商务的专业程度,肯定要超越其他网站的一个栏目。我们在规划url的时候,需要注意这点。但目录的层次不要太深。最少不要超过3层,因为你的层次越深,权重越低,大家可以看看新浪,它的新闻虽然多,但是层次都不超过3级。

    第六个因素: 网站的导航构架

    这个要注意一下几点:

    1、导航结构要清晰明了
    2、超链接要用文本链接
    3、各个页面要有相关链接

    这一条,说起来很简单,做起来就不那么容易了。大家可以多观察一些超链接结构比较合理的网站。如果你的构架合理了,用户喜欢,搜索引擎也喜欢。如何策划网站的超链接结构呢?不同类型的网站,策略不同。这个属于SEO策略的范畴。这里就不详细讲了。

    第七条因素:关键词的密度和分布

    一般认为,关键词密度在3%-5%左右为适宜,不要刻意追求关键字的堆积,否则触发关键字堆砌过滤器(keyword stuffing filter)处罚的后果。如果每一个页面都去计算密度,累死了也做不好。所以,大家只要处理好分布,密度自然就会合理了。那么,一个关键词,在一个网页的哪些地方合理出现呢? 主要是以下几个地方:Title、meta、网页大标题、网页文本、图片alt注释、网页底部超链接文本。

    在一个网页中,你的关键词能够在一下6个地方合理出现,就OK了。但是,千万千万不要堆积关键词。堆积关键词,后果很严重。一些刚刚SEO入门的朋友特别喜欢堆积关键词,但是不可取。这样很直接都可以看出是SEO过度。会被处罚的。

    第八个因素:反向链接因素和PR值因素

    PR值大家下载google工具条,浏览每一个网页的时候,自动出现他的PR值。或者大家登录http://www.521yy.com/tools/php/pr.php也可查询PR值;反向链接可以用这个语法来查:link:url。比如你要查百度的,那么输入“link:www.baidu.com”即可。这条因素之所以放到最后,是因为它是非常非常重要的。做反向链接大家都知道。这里给大家说一个最为关键的要点:反向链接的链接按钮,不要用图片,要用文字,而且要用关键词作为链接按钮。

    接下来再讲一下反向链接的质量和数量。在2004年以前,反向链接的数量非常重要,所以搞很多垃圾链接也能排上去,但是现在,反向链接的质量就更为重要了,这个道理很简单。 比如说你自己说你是好人,但是没人相信,如果有1000个流氓说你是好人, 别人也不一定相信。这1000个流氓就好比1000个垃圾链接,但是有一个非常有威望的知名人士站出来指着你说,你是好人。那么大家都会相信。这个人就好比一个高质量的反向链接,但在做反向链接的时候,大家要注意一点:千万不要在短短的时间迅速去获得几十个或者上百个高质量的反向链接,因为这样做你很容易被google放进沙盒。因为google怀疑你是购买的。这样他不删除你,你也很那获得好排名,所以做链接,特别是高质量的反向链接,要一点一点的做。

    上面把八大因素讲完了,最后再说一下常见的集中对搜索引擎不利的因素:

    1、框架网页:搜索引擎抓不到。
    2、过度JS调用:JS里面的内容搜索引擎也抓不到。
    3、flash网页:flash太多,搜索引擎也不喜欢,企业网站多范这个错误。

    我提倡大家把SEO看的简单一些,把以上每一条的细节都做好。那么排名自然会越来越好。不过,八大因素虽然说着简单,每一个细节都能够做好的人却很少。知道不等于会!所以学习SEO就是要不断的学习,不断的实践,不断的总结!(本文为王通讲课记录,非本人所写,观点不代表本人 )

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

Pages: Prev 1 2 3 4 5 6 Next