中日之间的差异巨大。

2007-10-19   |  分类:杂文

记得01年开始接触网络,当时沉迷于黑客之类的恶作剧,后来开始接触个人主页等等内容。05年开始学习制作网页,一起做网站的时候认识的一个站长,关系挺不错的。现在在日本留学,这个小伙子很有头脑,昨天偶尔遇到他了,和他聊天,让我体会到了什么叫地域差异!
 

摘录一段聊天记录:
MFI 告诉我,日本人。他们想去中国内买假名牌。哈哈说:日本年轻人没钱啊。但是他们又追求名牌,几乎所有的人的包钱包都是lv cucci什么的,嗯。日本人超追求名牌
MFI 说:他们的钱包几乎一个都要几千人民币买的。经常都是里面放的钱都没有钱包的价值多
阿猎  ! 说:跟国内的年轻人一样啊 ,都喜欢名牌。他们很穷么 。
MFI 说:再穷也比国内有钱多了。。。年轻人没钱。。
MFI 说:一开始工作後就很有钱了
阿猎  ! 说:哦。也就是工资很高MFI 说:我们大学的毕业生的平均工资是一年568万日元,30岁的时候的工资。如果年纪高了工资更高,哎~差距还是很大
阿猎  ! 说:相当多少 RMB 啊 
MFI 说:568万日元人民币30多万吧,一年。平均的,30岁的时候。一般一些的大学的毕业生的工资一个月也有人民币1万多2万这样
日本的消费看人了,便宜的也有。贵的也有。日本人一般不存钱。有多少花多少。。

 

今天一大早。到公司来之后习惯性的打开YAHOO英文搜索,搜寻任何关键词的时候,发生错误,错误页面全部跳转到百度的错误页面上。

 请看下列视频:http://www.etcis.com/soft/MSN的搜索跑到百度的错误页面上去了.rar

原因开始探寻中:

黑色梦中认为原因可能是:百度买断了电信的报错。

部门经理认为:百度和IDC 合作。

 百度一向重视渠道宣传

  大部分传统企业认识百度都是从百度渠道上的直销宣传中知道的。

  因为推广方式的不同,所以他们的用户群有较大的不同,同时造成了他们流量上的较大差别。

  普通网民多呢? 还是精英网民多?

看来百度的渠道很深。。呵呵

yahoo和Msn 应该不会出现如此的原则性的错误。所以IDC电信这边出错的几率比较大。希望到上午10点18分的时候。yahoo可能已经注意到这个问题,及时的处理掉了这个问题。把报错问题换成了以下图片。

MSN的搜索页面仍然是百度的错误页面。

附带:视频录像软件以及注册机

视频录像软件

GOOGLE页面等级的一些感想

2007-10-08   |  分类:google

Google的前1000个搜索结果
记住,仅仅页面等级的提高并不能使你的网站在Google搜索结果排序中有一个靠前的位置。前面提到过,页面等级是一个乘数,所以如果一个网页的其他影响网站排名的因素都为0,即使它的页面等级是200亿,你的网站分数仍然是0。当然这也并不是说页面等级没有用,但是页面等级何时才有价值确是一个令人困扰的问题。也正是这个问题导致了很多对页面等级所具有的价值错误解释。唯一能澄清这种误解的方法是找出页面等级何时无用。
如果你在Google上做一次大范围的搜索,你可能会得到几千条搜索结果。然而,最终你可能会仅仅浏览前1000条记录。理解了这一点,就可以解释为什么想提高子集网站在搜索结果排序名次时你应该先考虑网页本身的因素,然后才是页面等级。
假设在一次搜索中你得到了200,000条搜索结果,如果在对搜索结果排序时要考虑所有的影响因素,你认为这可能仅仅在0.34秒内完成吗?为了加快搜索速度,首先要找到一个与搜索内容有联系的所有的网页的子集。这个子集应该小于搜索结果数,假设是2000。搜索引擎要做的就是用2-3个影响因素查询数据库,用这2-3个影响因素对所有搜索结果进行排序,找到排名最前面的2000条结果记录(不要忘了最后要显示200,000条搜索结果)。然后搜索引擎对这2000条记录的每一条应用所有影响因素并据此排名。排序后,在子集后面部分的搜索结果质量(不是网页质量)有所降低,所以只是显示前1000条结果记录。可以确定的说在产生搜索结果子集时,页面等级并不是被考虑的2-3个影响因素之一。这是因为在产生2000个搜索结果的子集时,这些搜索结果应该必须要与搜索内容有联系,如果我们用页面等级作为一个产生子集的影响因素,那么就可能会产生很多页面等级很高却与搜索内容无关的结果,这不是我们所想要的。
所以你必须好好组织你的网页内容以便当搜索你选择的关键词时可以使你的网页进入前2000个搜索结果,否则你的页面等级再高也没有用。如果网页的其他影响因素不足以使其进入开始的搜索子集,那么页面等级就是没有任何用处的。

申请@msn.cn邮箱帐号攻略

2007-10-07   |  分类:UE用户体验

周日晚上一个朋友告诉我:MSN已经可以进行@MSN.CN域名的邮箱申请了,不过还没有正式公布。或者这样说,他发现了一个微软邮箱帐号申请的巨大漏洞:现在已经可以申请.CN域名的MSN邮箱了,容量是5G,功能和HOTMAIL完全一样。

.CN域名邮箱的意义是什么呢?微软官方说:微软的.LIVE服务旗下有个邮箱服务,那么我们常用的都是hotmail.com或者是 msn.com都是微软提供的邮箱,之前由于几次的漏洞问题,也导致了live.com和live.cn帐号邮箱申请的泄露,导致有一部分人在目前微软还 未正式开通live.com和live.cn邮箱申请服务时已经通过不同的破解方法申请到了相应自己心仪的邮箱地址,当然我也申请到了:)。

因为现在网络的发达,人手一个或几个邮箱已经是常事,邮件是网络生活头等重要不可缺少的。但是要有一个又好用又好记的邮箱地址是不容易的,就像手 机号和车牌号一样,我们都希望能有一个固定不变的,漂亮美观,简短好记,功能完善的邮箱地址。(关于邮箱帐号的问题,之后还要详谈!)

连续奋战了一夜,我已经申请了包括我名字在内的好多邮箱地址,比如 donews@msn.cn 我把MSN和邮箱更换成这个地址,希望朋友们都来加我.

好了,进入正题,下面就详细介绍申请的攻略:

1.只要按照如下链接就可以完成@MSN.CN的邮箱帐号申请了:

https://domains.live.com/members/signup.aspx?domain=msn.cn

通过这个思路,你还可以把最后的=MSN.CN改为=MSN.COM,这样去申请其他的域名邮箱,不过那些是已经开通公布了的,很难申请到很好的帐号的。申请@MSN.CN的好处是目前为止,除了微软内部屏蔽的如:msn@msn.cn; hotmail@msn.cn; live@msn.cn; 之外,任何你所能想到的好名称全能申请到!!!

PS:另外说一句,不要太贪心,申请个自己最喜欢的就行了,多了也无用,三个月不用还是要废掉的,还是留给那些需要的人们吧。可不要让我看到你在淘宝之类卖这类的邮箱帐号哦!

如果你申请到了很满意的,别忘给我报个喜!:)

创业,还是就业

2007-10-02   |  分类:杂文

我不会去创业,就是创业也不会和我一样年轻的人一起,年轻需要的是积累,我不相信25岁以下的人有什么资源可以做成一个项目。如果有,那一定是吹的。

但是,我觉对不具备创业的能力,尤其是领衔创业。在这里,我想说下,创业究竟应该具备什么条件,年轻人又应该如何去积累创业的资本?

年轻人创业应该积累身后,放眼前方。下面我分别谈一下:

如何积累身后?一、和年轻人交流,因为他们代表着你的未来,并且因为他们不是什么明星,未来一定会支持你,为你提供这方面的后备力量;二、假如你想在互联网中创业,你要懂得积累和互联网相关产业的资源,比如政策背景资源、媒体资源及相关合作资源;三、假如你想在大城市创业,你就需要积累小城市资源,给自己留很多背景后路,让你的身后聚集一个强大的渠道。

如何放眼前方?一、与前辈多交流,他们了解很多你不知道的潜规则,就算关系打不好也没关系,至少也不会排挤你;二、多了解行业动态,吸收新知识,了解前人是如何进行相关项目的操作。

当然,继续学习,提高能力,并在实践中锻炼,都是不可缺少的。这个,我就不多谈了,想创业的人应该都是懂得学习的人。

最后,引用深圳IT茶会曾老大的一句话“少谈模式,多谈终端”。模式有什么用啊,用户找不到有个屁用,你模式不错,但你做不了,那就好好积累背景去吧。冲锋陷阵的核心团队也去寻找吧,找你适合的,而不是最好的。就是这些都有了,你还要考虑协调外部环境,积累与上游产业和下游产业的合作资源。警告一些年轻人,现在做互联网项目不是从前了,只有能力不行,你还得有相当强大的背景资源,光会冲锋陷阵都不行,你得懂得协调。我是实在想不出哪个20出头的人会有这么多资源,塌实点。

世界上天才很多,懂得厚积博发的人却是很少的。潜龙勿用啊!当然可以和大哥们合作,资源互补。我的意见是出来混5年内不要创业,用心积累,塌实做事。

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

robots.txt屏蔽搜索抓取

2007-09-28   |  分类:SEO

         搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
          您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt文件应该放在网站根目录下。

         当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

robots.txt文件的格式:
“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:
“<field>:<optionalspace><value><optionalspace>”。

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:

User-agent:
  该项的值用于描述搜索引擎robot的名字,在”robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。

Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如”Disallow:/help”对/help.html 和/help/index.html都不允许搜索引擎访问,而”Disallow:/help/”则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”文件中,至少要有一条Disallow记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。
robots.txt文件用法举例:
例1. 禁止所有搜索引擎访问网站的任何部分 下载该robots.txt文件 User-agent: * Disallow: /
例2. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file) User-agent: *Disallow:
例3. 禁止某个搜索引擎的访问 User-agent: BadBotDisallow: /
例4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: /
例5.一个简单例子  在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。  需要注意的是对每一个目录必须分开声明,而不要写成 “Disallow: /cgi-bin/ /tmp/”。  User-agent:后的*具有特殊的含义,代表”any robot”,所以在该文件中不能有”Disallow: /tmp/*” or “Disallow:*.gif”这样的记录出现. User-agent: *Disallow: /cgi-bin/Disallow: /tmp/Disallow: /~joe/

Robot特殊参数:
1. Google
允许 Googlebot:
如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页,可以使用下列语法:

User-agent:Disallow:/
User-agent:Googlebot
Disallow:
Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。

“Allow”扩展名:
Googlebot 可识别称为”Allow”的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。”Allow”行的作用原理完全与”Disallow”行一样。只需列出您要允许的目录或页面即可。

您也可以同时使用”Disallow”和”Allow”。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目:

User-Agent:Googlebot
Disallow:/folder1/
Allow:/folder1/myfile.html
这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。

如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用”Allow”规则允许该漫游器的访问。例如:

User-agent:Googlebot
Disallow:/
User-agent:Googlebot-Mobile
Allow:

使用 * 号匹配字符序列:
您可使用星号 (*) 来匹配字符序列。例如,要拦截对所有以 private 开头的子目录的访问,可使用下列条目:

User-Agent:Googlebot
Disallow:/private*/
要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目:

User-agent:*
Disallow:/*?*

使用 $ 匹配网址的结束字符
您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用下列条目:

User-Agent:Googlebot
Disallow:/*.asp$
您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包含该 ID 的网址,确保 Googlebot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置:

User-agent:*
Allow:/*?$
Disallow:/*?
Disallow:/ *?一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字符串,然后是问号 (?),而后又是任意字符串的网址)。

Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。

Sitemap 网站地图:
对网站地图的新的支持方式,就是在robots.txt文件里直接包括sitemap文件的链接。
就像这样:
Sitemap: http://www.etcis.com/sitemap.xml
目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。
不过,我建议还是在Google Sitemap 进行提交,里面有很多功能可以分析你的链接状态。

Robots.txt带来的好处:
1. 几乎所有的搜索引擎Spider都遵循robots.txt给出的爬行规则,协议规定搜索引擎Spider进入某个网站的入口即是该网站的robots.txt,当然,前提是该网站存在此文件。对于没有配置robots.txt的网站,Spider将会被重定向至404 错误页面,相关研究表明,如果网站采用了自定义的404错误页面,那么Spider将会把其视作robots.txt——虽然其并非一个纯粹的文本文件——这将给Spider索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。

2. robots.txt可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也没有太大意义,但却耗用大量带宽。

3. robots.txt可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会索引那些临时文件。

4. 对于内容丰富、存在很多页面的网站来说,配置robots.txt的意义更为重大,因为很多时候其会遭遇到搜索引擎Spider给予网站的巨大压力:洪水般的Spider访问,如果不加控制,甚至会影响网站的正常访问。

5. 同样地,如果网站内存在重复内容,使用robots.txt限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content的惩罚,保证网站的排名不受影响。

robots.txt带来的风险及解决:
1. 凡事有利必有弊,robots.txt同时也带来了一定的风险:其也给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在Web服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。

  比如说,如果网站中的私密数据通过www.yourdomain.com/private/index.html 访问,那么,在robots.txt的设置可能如下:

User-agent: *
Disallow: /private/

  这样,攻击者只需看一下robots.txt即可知你要隐藏的内容在哪里,在浏览器中输入www.yourdomain.com/private/ 便可访问我们不欲公开的内容。对这种情况,一般采取如下的办法:

设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。
另一种办法是将缺省的目录主文件index.html更名为其他,比如说abc-protect.html,这样,该内容的地址即变成www.yourdomain.com/private/abc-protect.htm,同时,制作一个新的index.html文件,内容大致为“你没有权限访问此页”之类,这样,攻击者因不知实际的文件名而无法访问私密内容。
2. 如果设置不对,将导致搜索引擎将索引的数据全部删除。

User-agent: *
Disallow: /
上述代码将禁止所有的搜索引擎索引数据。

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:

<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>

表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

阿里巴巴新产品SEO分析

2007-09-28   |  分类:SEO方案

阿里巴巴新业务SEO分析 

    阿里巴巴最近又有大动作,对旗下的诚信通进行了产品升级,升级举措主要是为诚信通用户申请国际域名邦定到客户的诚信通公司主页上。对于用户来说,这样的举措肯定是受到欢迎,毕竟有阿里巴巴来帮我宣传,何乐而不为,用户高兴阿,以后可以不用自己的网站了!先不谈这个举措给用户和阿里带来的好处如何,下面以一个商铺为例子:咱们先谈谈SEO方面的问题

阿里的商铺域名:http://sodr2000.cn.alibaba.com/

阿里送给用户的:http://www.asura-china.cn/

     阿里巴巴推出的新服务,赠送用户的URL与原来的商铺的URL的相似度就是100%相同了,那么肯定会造成其中一个域名的或阿里巴巴的整个产品的域名在搜索引擎的权重下降!或者人为的删除网页。

第一:复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。

第二:网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。从上面这几种情况来看,补充材料在大部分情况下和网页内容重复或类似有关。而阿里巴巴推出的新服务,赠送用户的URL与原来的商铺的URL的相似度就是100%相同了,那么肯定会造成其中一个域名的或阿里巴巴的整个产品的域名在搜索引擎的权重下降!

不过最近GOOGLE会逐渐取消补充材料这一点。 由于“补充材料”和常规结果之间的差距越来越小,因此Google觉得不必要再特地将来自补充索引数据库的网页标记为“补充材料”,于是它决定停止了这一做法。换言之,“补充材料”将成为历史。这意味着以后我们在Google上面进行搜索,将得到更准确及更全面的搜索结果,因为Google的两大索引数据库正在融合。

 针对这一问题如:http://www.asura-china.cn/robots.txt

打开这个URL你会看到

User-agent:*

Disallow:/

说明:robots.txt文件的格式“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:“<field>:<optionalspace><value><optionalspace>”。在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow,详细情况如下:User-agent:
  该项的值用于描述搜索引擎robot的名字,在“robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在“robots.txt”文件中,“User-agent:*”这样的记录只能有一条。Disallow:该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如“Disallow:/help”/help.html /help/index.html都不允许搜索引擎访问,而“Disallow:/help/”则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在“/robots.txt”文件中,至少要有一条Disallow记录。如果“/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

robots.txt文件用法举例:
1. 禁止所有搜索引擎访问网站的任何部分下载该robots.txt文件 User-agent: * Disallow: /
2. 允许所有的robot访问 (或者也可以建一个空文件
“/robots.txt” file) User-agent: *Disallow:
3. 禁止某个搜索引擎的访问
 User-agent: BadBotDisallow: /
4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: /

    阿里巴巴的策略就是选择在新域名中使用robots.txt文件了来禁止搜索引擎抓取页面,robots.txt的使新域名不被搜索引擎收录,蜘蛛基本不会抓取新域名内容。

    阿里巴巴的产品都相当的清晰,在做任何调整的时候都会考虑到SEO的因素,策略和产品,还有营销,每一项用户体验的提升都必须把SEO 的因素考虑进去,自从阿里被降权以后,采用许多策略,能不能把排名提升呢,我们拭目以待!

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

SEO软件:SEOM,免费下载

2007-09-26   |  分类:SEO

本帖随新版本发布即时更新,敬请关注!纯绿色软件,无需要安装,无需要注册,完全免费

  使用SEOM,随时查询你指定的关键词在搜索引擎搜索结果中的排名情况,可以查询一个关键词的排名,也可以添加批量关键词,批量查询。

  批量查询时,系统会自动记录历次查询的最佳排名,与本次查询结果对比显示,让你随时了解关键词排名的升降情况。

  使用SEOM,轻松掌握SEO工作阶段性的情况和成果。

下载地址:www.etcis.com/seom.exe

作者:阿猎
原载:阿猎的SEO博客
版权所有,转载请以链接形式注明作者及原始出处。

Pages: Prev 1 2 3 ...9 10 11 12 13 14 15 16 17 Next