2009-02-06搜索引擎

没有评论
1,670 views

【转载】逃离雅虎,雅虎关闭站长天下服务

昨天,阿里巴巴集团旗下的中国雅虎再度进行业务调整,宣布自即日起至2月28日逐步关闭站长天下业务。这是继上月初,中国雅虎宣布放弃著名的浏览器插件3721上网助手业务之后的又一次断臂。

现在的中国雅虎已经没有继续待在北京的必要,是南迁杭州的时候了,因为只有这样才能离阿里巴巴集团的“魂”更近一些。中国雅虎虽然已把自己定位于光脚创业的,但已经不住马云的再三折腾了。虽然现在的名字是雅虎口碑,但“阿里口碑”的名字更好一些,因为“雅虎”的称号实在是名不符其实。

中国雅虎现在已退出中国搜索引擎市场前三强的地位,新闻资讯门户的位置也早以不保,也许拿得出手的只有雅虎邮箱了。但现在的雅虎邮箱,登录帐号的域名后缀混乱(有cn、com.cn、com三种),用户忘记密码后又很难取回密码,也早已是鸡肋。有理由相信,中国雅虎的邮箱用户数据已呈大幅下滑趋势。我现在担心的是,终有一天马云会宣布关闭中国雅虎的邮箱业务。

 不过,站长天下的关闭和之前的一搜、3721业务一样,这是阿里集团对中国雅虎的再次折腾的表现。这次折腾不是第一次,也不会是最后一次,中国雅虎旗下的空间、博客、相册、论坛乃至去年新上线的雅虎关系业务都有被关闭或停掉的可能性。对中国雅虎的用户来说,现在是逃离的时候了,不主动逃离将会面临被 “强制驱逐”的危险。

我现在使用的中国雅虎服务主要是雅虎统计和雅虎邮箱,雅虎统计由于已和阿里妈妈整合在一起,而阿里妈妈已被淘宝收编作为推广淘宝网店的重要渠道,暂时还没有倒掉的可能;雅虎邮箱也只是作为备用邮箱使用。

中国雅虎不把用户的利益放在首位,没有足够的耐心,指望通过所谓的生活服务搜索来重整旗鼓,是没有多少人会买账的。

本文原载于蓝天博客

人肉搜索公约发布

人肉搜索”从诞生之日起就面临着数之不清的争议。我在BLOG中专门就人肉搜索做了分析和专文撰写,前天,朋友yule制订了“人肉搜索公约”,需要我给出一些意见,他想规范网络道德意识,加深大众对人肉搜索正确定义的理解,并使人肉搜索引擎向正确的方向发展。以下是公约正文

  • 为了加强网络公民的网络道德意识,加深人们对人肉搜索正确定义的理解,使人肉搜索向正确的方向发展,并不断服务大众,特制定本公约。
      
      一、热爱祖国,热爱党,遵纪守法,互助友爱,维护网络和谐;
      二、人肉搜索时做到以诚信、安全、公开、公平、公正、互助的原则,多进行利他性的知识性人肉搜索;
      三、以网络道德为准绳,尽量不参与搜索他人隐私;
      四、对他人暴露隐私尽力保护,保证不在公共场所公布他人隐私;
      五、对于涉及“贪污、腐败”、“惩恶扬善” 可以不受第三、四条的约束 ;
      六、人肉搜索要提供真实可信的内容,提供信息者对信息真实性负责;
      七、文明用语,对于恶意人肉搜索行为做到不起哄,不传播;有条件的情况下告知当事人以及相关网站负责人;
      八、通过不断努力提高人们对于人肉搜索的正确认识。
      本公约于2008年末,经各网站网民讨论修订而成,凡在此网站活动的网民应该自己遵守。
      
      人肉搜索非组织性联盟
      
      二零零九年元月一日

google也推行了一段时间的人肉搜索,并且在天涯社区中推行。当然,这个公约的制定和发布需要不段的完善,制定人YULE也希望大家在以后进行人肉搜索的时候能够有一个规范指导,公约发布之后,得到了很多朋友的支持,其中包括:历史作家赫连勃勃大王,猫扑管理员,天涯管理员。

如果大家对人肉搜索引擎有疑惑请参考我相关的几篇日志。

原文作者:阿猎

转载请著名:阿猎SEO博客

人肉搜索引擎的未来商业化道路

这篇文章主要介绍人肉搜索引擎的商业化过程,介绍google等网站如何将搜索结合人工来对信息处理完善,为用户提供精品的内容,当然,关注搜索引擎优化的朋友可以略过不读

在我之前的文章中分别写了人肉搜索的前世,现状,这篇关于人肉搜索未来的文章也该出现了……这种人肉搜索这种人找人、人问人、人碰人、人挤人、人挨人,一人提问、八方回应、一石激起千层浪,一声呼唤惊醒万颗真心”的搜索方式也因其不受约束的强大攻击性而引发众多的忧虑与争议。 争议声中,将“人肉搜索”商业化的进程却高歌猛进。猫扑、腾讯等知名网站纷纷开始招兵买马,组织专门从事“人肉搜索”服务的“正规军”。 然而,专家学者对网站此举大多表示忧虑。从自发组织起来惩恶扬善的“网络福尔摩斯”,到受雇于商业网站服务于商业模式的“赏金猎人”,频频侵犯现实社会中法规和道德因而造成人身伤害的“人肉搜索”,能否将它强大的震慑力与杀伤力约束在某种准绳之内?

继续阅读 »

如何利用robots限定yahoo蜘蛛爬行

yahoo蜘蛛频繁爬行给公司系统部带来了巨大的麻烦,因为蜘蛛的频繁爬行直接导致系统反应过慢,那么如何才能降低yahoo的蜘蛛爬行抓取速度呢?
在yahoo的帮助定义:

在robots.txt 里,YST有一个特定的扩展名,可以通过它对我们的抓取程序设定一个较低的抓取请求频率。您可以加入Crawl-delay:xx指示,其中,“XX”是指在crawler程序两次进入站点时,以秒为单位的最低延时。如果crawler频率对您的服务器是一个负担,您可以将这个延时设定为任何您认为恰当的数字,例如1或10。

    例如,您想设定一个2秒的延时,语句如下:

    User-agent: Slurp
    Crawl-delay: 2

他们给出的帮助建议是设定为2,这个设定为2用来告诉Slurp蜘蛛2次访问之间的间隔,单位是秒.但对于大型网站设定2秒肯定是不合适的,因为雅虎美国和雅虎中国有2套蜘蛛在运行,每个蜘蛛都是遵循Crawl-delay间隔的,因此为了进一步降低Slurp压力,希望达到10秒一次请求的频道 实际的Crawl-delay配置就要*2。
Slurp来源于40多个IP网段,同网段内的蜘蛛协调抓取频度。因此:实际的Slurp设置,需要设置为10*40 = 400秒,才能达到期望的Slurp每10秒访问一次频度。

那么要想限定YAHOO蜘蛛的爬行,那么robots.txt可以写成

 

User-agent: *
Disallow:

User-agent: slurp
Disallow:
Crawl-delay: 100

 

定义说明:

1. 添加了User-agent: *属性。允许所有蜘蛛访问。
2. 更正了Slurp数值,1000为25秒,如果需要,可以设定成10000
3. 添加了sitemaps地址,将b2b网站的新旧sitemasps加入robots,便于蜘蛛抓取.

 

 

本说明来源于雅虎官方日志:
如何控制Yahoo! Slurp蜘蛛的抓取频度
http://ysearchblog.cn/2006/07/yahoo_slurp.html

众里寻她千百度,蓦然回首,却是一头笨猪

由于网站的历史遗留问题,网站存有大量动态url地址(如info_list.php?),而且参数非常混乱。动态url地址由于存在时间较长,已被搜索引擎大量收录,存于搜索引擎的索引数据库中,且有了很高的权重。
使用webtrends对日志进行了spider爬行分析得出,这些动态url地址有很高的排行优先权,多次都是spider通过这些动态url从数据库中直接爬行至网站,进行抓取。由于spider是通过如info_list.php?此类动态页面爬行至此,在抓取的过程中spider一直在动态网页中循环抓取(因为参数比较混乱,spider会根据参数排列逻辑自己排列组合进行抓取,且不是返回404,所以导致了动态页面无穷多,严重浪费了spider的抓取效率),无法抓取到网站的伪静态页面。
对此情况采取了以下措施:
1、对全站url进行静态化处理,限制不同参数的排列组合,固定参数非正确的排列组合返回404.
2、对静态化的页面进行META规则制定,每个页面拥有自己独立的META信息,避免造成这些页面被收录后,在索引数据库中本站关键词竞争,可以突出重点词。
3、制作静态化页面sitemap.xml ,且通过robots.txt屏蔽各个动态目录。
4、通过google管理员工具删除已存在于google索引数据库中的动态url地址,可以删除整个动态目录。
通过以上方法,经过约1个月时间,目前google.com索引数据库中动态url地址已全部删除。site:该目录以为0. 通过webtrends对日志spider爬行的分析,目前已经批量抓取静态页面。原有排名的动态url页面,已被静态页面取代。spider抓取、索引数据库中的静态页面排名已趋于正常。
通过此次操作,又再次体会出google.com比baidu.com智能的多,其中最重要一点包括google.com可以通过管理员工具很方便的与站长沟通,即能帮助站长解决问题又能节省自己的spider抓取资源。而百度呢?baiduspider根本就不能控制,乱抓。也不明白站长的意思。技术含量极低… … 排序规则、更新规则中又夹杂着n多人为因素。

众里寻她千百度,蓦然回首,却是一头笨猪.

人肉搜索引擎的现状

搜索引擎技术发展到现在,搜索引擎的算法越来越人工智能化,越来越注重用户的搜索体验,为用户提供精确的信息,搜索技术其实是利用搜索算法自动的收集网络信息并有序的进行排列的一种技术。搜索引擎高效快速,也让使用搜索引擎的用户不段的增多!这时,广告主希望通过一种营销方式把搜索引擎中的这些用户带到到自己的网站中来,所以就产生搜索引擎营销这个行业,越来越多的网站也开始注重搜索引擎营销,普遍组建搜索引擎营销(SEM)团队或者搜索引擎优化(SEO)团队,来对自己的网站进行整体的优化,让网站符合搜索引擎的抓取规则.

然而,搜索引擎也有可能对一些问题不能进行解答,当用户有一些疑问在搜索引擎中得不到解答的时候会试图通过其他几种渠道来找到答案,或者通过人与人的沟通交流寻求答案,这也使论坛在线IM在中国大肆流行,而我这里所说的人肉搜索引擎就是指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制,有些人想从搜索引擎的反面来解决问题,那就是更多的利用人工把搜索引擎得到的信息进一步选取,进一步有序化,我们称之为人肉搜索引擎!我介绍目前几个比较流行的人肉搜索引擎,大家如果有什么解决不了的问题,或者想在么个问题上寻求答案的时候可以到以下地址去寻找答案!

继续阅读 »

人肉搜索引擎的前身

4月1日.“人在搜索中的作用”,google借人肉搜索引擎的概念,来继续为他本土化造势,在4月1日玩玩无厘头的同时,不忘记推广他们旗下产品”天涯问答“!所谓人肉搜索,就是人的搜索或者人贡献于搜索。电脑报记者萧钺的一篇文章形象的把他比作:一只老虎N个武松.越来越多的人开始熟悉这部机器,更多的人参与到了这部机器.以至CCTV的参与跟踪报道.让这部机器促进中国互联网和谐化稳定化规范化的发展!

大家都知道.像GOOGLE百度这类搜索引擎的主要靠机器和算法以及分词技术来提高搜索质量,从搜索引擎的问世那天起至今搜索技术已经为无数网民提供数亿计的服务.也是因为搜索技术的发展,他衍生许多与搜索引擎有关的行业.比如搜索引擎优化(seo),搜索引擎营销(sem).电通公司很强大的提出AISAS(Attention 注意Interest 兴趣 Search 搜索 Action 行动 Share 分享)法则:搜索引擎在改变人们的生活习惯影响人们的消费习惯.而搜索引擎有时候也会出现信息不准确,或者信息不对称的状况,当用户遇到这样的情况他会怎么办呢?

继续阅读 »

2008-03-25搜索引擎

没有评论
1,305 views

网易科技:SMX搜索引擎营销大会给外贸企业带来的价值

SMX搜索引擎营销大会(event.timev.com )最近在美国西部硅谷的会有3000人参加,其中非行业人员占了很大比例。有非常多的传统企业的IT和营销部门的人员对大会非常有兴趣,他们希望通过参加大会掌握搜索引擎营销和搜索引擎优化的知识。对于这些IT和市场人员来说,无论他们在日常是希望自己开展网络营销还是寻找专业的公司来提供服务,掌握相关的知识总是没有坏处的。

搜索引擎营销是一种非常专业的营销模式,一般企业的市场人员对此都比较陌生。出于对市场的敏感,他们也会有些了解这种营销模式的优势,并会做出相关的市场预算,请专业的公司提搜索引擎营销服务。但由于自身对搜索引擎营销的不了解,带来了一些比较尴尬的问题。

首先,不知道如何选择搜索引擎营销服务公司。

目前市场上打着网络营销顾问、专业网上推广公司之类旗号的网络公司很多,还有自称搜索引擎营销专家、搜索引擎优化专家的。那些号称几百块就能保证你在Google第一名、百度第一名的更是比比皆是。同时,多数搜索引擎营销服务公司还停留在卖产品的结算,就是代理某某搜索引擎的产品,卖给企业用户赚差价,根本没有提供增值的服务内容。选择一个好的搜索引擎营销服务公司,能给企业的网络营销带来全新的突破,但是如果选择不当,只能是花了大钱,却没有效果,甚至还会被一些不良的服务公司屡屡欺骗。

其次,不知道如何评价搜索引擎营销服务的效果。

一般的企业对于在电视、报纸上投放广告都有一套评价体系,包括来自第三方的评价和自身的评价。更有企业成立专门的部门,根据广告投放额达反馈及时修改投放策略,从而保证效果的最大化。很多企业市场部门负责广告投放的人员,本身就是媒体专家,对电视、报纸等广告形式有非常专业知识。近年来,一些大企业的市场人员也加强了对网络广告的熟悉。而搜索引擎营销是更为专业的内容,多数企业的市场人员还不熟悉,也导致了不知道如何评估广告效果的问题。

无论是固定排名还是竞价排名,其实都应该建立有效的评价体系,而不是单纯的看看点击量,更不能仅仅查看服务公司的报表。目前甚至还有很多服务公司根本不提供任何报表,而企业的市场人员也仅仅关注排名是不是靠前,是不是超过竞争对手。因为不知道怎么评估效果,有的企业就会认为是没有效果,从而减少甚至停止了搜索引擎营销的投放。这样一来,一方面服务公司失去了客户,另一方面企业也放弃了一个高效的营销途径。

再次,不能把搜索引擎营销和企业的其它营销活动有效的结合。

搜索引擎营销不是一个独立的营销手段,应该和其它的营销途径一样,和企业整个的营销体系紧密结合。比如说,如果企业有什么新产品问世或者有什么促销活动,市场部门应该将之及时反馈给从事提供搜索引擎营销服务的公司,在关键词上做一定的调整,而不能搜索引擎营销服务公司的人员闭门造车。企业的市场人员如果熟悉例如关键词竞价管理、根据点击情况调整关键词、改善从点击到购买的流程等,那么在搜索引擎营销上同样的投入将能产生数倍的回报。

SMX搜索引擎营销大会厦门站4月18-19日召开,给企业的市场部门提供了一个机会,让他们在短短2天的时间里面,通过聆听国内外搜索引擎营销领域专家的演讲,通过面对面的交流沟通,能够站在比较高的层面上了解搜索引擎营销。大会从基础到技巧,以大量活生生的案例,让没有相关知识基础的参会者也能有很大的收获。学会一些方法,让每年成千上万的搜索引擎营销的投入发挥更大的价值,这就是搜索引擎营销大会给行业外的参会者带来的最大价值.

作者:赢时代
原载:赢时代
版权所有,转载请以链接形式注明作者及原始出处。

返回顶部