存档在 2012年11月

基于数据分析的seo

2012年11月20日
       数据分析不仅仅体现在tag方式监控的前端wa数据和后端交易数据,在基于seo的服务器log日志方面同样可以得到运用,并为提供网站seo优化做出贡献。
        在seo的数据分析中传统的工具均提供了流量监控,但普通缺乏log服务器日志层面监控。seo的数据分析中有几项指标特别值得关注。
1、网站页面收录比率查询
         以往在搜索引擎用site命令得出的是收录是估算值,后来演变的百度统计、百度站长工具能计算到精准的收录数据。但对于运营特别值得关注的是页面被收录比率而不是总收录页面数。
       主要是基于三方面考虑:
        一、收录多少不能完全反映seo的好坏、因为本身网站的总页面数很多站长主是不知道,这时候收录数是100,1,000不能说明这个值到底意味站点的seo是否是合格的。
       二、页面数目本身是变量。也许读者会问那看页面收录数趋势就好了,但大部分网站的页面数基本在不断变化的,所以即便增加或者减少也不能说明seo的好处,此时页面收录比率变得特别重要。
       三、不是所有页面都应该被收录。网站主希望将权重l集中到核心页面,对于不能获取搜索流量 的比如 购物车、支付页面等页面是不希望被收录的。
如何实现?
       要实现查询页面收录比率,原理就是模拟一个蜘蛛抓取网站页面,同时已经将抓取的页面和搜索引擎的搜索结果页面做比对,看抓取的数据和搜索引擎结果页面是否匹配。
        工具设计如下:
实现步骤:
1、从任意一个页面开始抓取(建议取首页或者和网页地图之类页面),
2、利用正则表达式匹配出要被收录的页面类型。
3、设定采样的页面数目。
4、同时列出未被收录的页面,为后续的分析做数据支撑。
2、关键字竞争分析
     只有知己知彼才能百战百胜 ,关键字竞争分析是指基于网站主的行业搜索词计算网站主网站在搜索引擎中的排名和得分情况。
实现方式:
      a、查询网站关键字排名:用给定关键字去百度自然搜索(排除竞价),如排在第一位的网站给30分,第二位的20分, 第三位 15 以此类推,第17位给1分.
     b、对排名前17网站的得分进行汇总排序

卖个关子留两个问题:

1、为什么第一名给30分、第二名给20分,第三位给15分?

2、另外按照现在的排名给分的一个待优化算法的地方是什么?

网站数据分析面临的挑战

2012年11月18日

       网站数据分析也称为web analytics 按照维基百科的定义为:Web Analytics is the measurement, collection, analysis and reporting of Internet data for the purposes of understanding and optimizing Web usage.意为通过收集、度量和分析互联网数据进而理解网站业务和优化网站的一种方法. 是一门比较新的互联网分支,最近几年得到重大发展。2012年3月后WAA改名为Digital Analytics Association.

          尽管如此,传统的网站分析还面临以下各种挑战:

1、cookie机制对于确定唯一用户的挑战
挑战:基于cookie机制和移动互联网发展导致用户多终端、多浏览器的访问对确定真正唯一用户的挑战?
解决方案:在部分电商和登陆网站可以利用customer id(注册id)和cookie id的关联关系去定义唯一用户(虽然仍然存在偏差,账号公用导致customer id大量对应不相关cookie id)。

2、offline数据如何更好和onine数据的结合
挑战:传统线下和互联网融合更加紧密,传统公司开始有大量online数据,而过去的online公司也会同样产生更多offline数据,如何更好标准化和对接数据成为挑战。
解决方案:至少需要小型BI系统,建议将前端WA数据输出到bi系统。

3、跨渠道的Attribution model
挑战:转化渠道的关系和贡献度如何确定

跨渠道分为多种

a、 多个click广告: 渠道之前的关系更加密切,用户在转化和形成品牌认知前经常跨越多个媒介 。

first click last cick or average 都是计算模型。

b、线上impression广告对渠道的贡献:传统的web analytics是基于click点击行为的数据,对于impression广告的贡献和参与的分配将是web analytics面临的另外一大挑战

c、offline marketing对于online marketing的转化促进作用的贡献程度如何确定?

如: 线下品牌广告对线上用户搜索和交易等行为起的引导促进作用如何量化,线下分地域投放和线上基于地域的效果监控、二维码、优惠券的使用、短地址的采用能部分解决线下往线上转移的监控。

d、营销的后续影响对于转化的贡献度如何定义?
张栋在微博曾经说的案例就是这样的情形:”【一个点击到底多少钱?之二】一个电商 SEM 每天花 1000 元, 每天总共 3500 个点击:SEM 带来 1500 个点击 + SEO 自然流量 带来 2000 个点击;这个电商停止 SEM 投放,每天 SEO 自然流量带来 100 个点击,问:一个 SEM 点击到底多少钱?”

解决方案:总体来说,需要完整的Attribution model机制和更加完善的监控机制,比如展现广告的监控,同时还需要case by case的分析(基于每次营销的)。

4、数据越来越多,如何收集有用的数据。
挑战:不计算后端的数据,单纯一个网站的前端数据的维度也变得越来越多

哪些数据是最终支持通用kpi,在异常个案中如何收集证明案例的数据

解决方案:从业务和商业目标出发的去收集数据,在异常情况需要case by case.

5、网站分析师的技能要求

挑战:网站分析师在技巧技术娴熟的情况下,更多的是凭借敏锐的商业嗅觉去收集数据,分析数据,对商业的理解可以更好发挥网站分析的作用。
         网站kpi有很多:转化率、  新会员注册、老会员回访、顾客数增多、品牌和口碑曝光度等等,网站分析师必须更加懂商业,抓住主线。例如在网站分析中常见的有长期商业目标和短期商业目标。分析师如果不清晰目标往往得出对商业无利的结论,在电商中毛利率和订单金额是长期追逐目标,但在短期阻击对手活动中这个明显就不是短期指标,比如京东要做图书的早期,一定是优先看用户数和市场规模,打击毛利率。

解决方案:对分析师的要求越来越高,懂统计、计算机、商业的分析师将是各个公司追逐的目标。

6、法律和政策

挑战: 基于网络立法对用户隐私的保护,cookie可能会被block,各个浏览器和操作系统对tracking的态度将导致跟踪cookie的数据完整性。

解决方案:几乎无方案,国内的用户隐私政策相对宽松,需要行业自律。

7、如何利用网站数据做精准营销
挑战:从vistor到customer的数据对接:如在常见电商购物车放弃率达到70%,从前端监控到用户登陆流程需要完整化,才可以采用精准营销唤醒购物车放弃用户。
解决方案:网站分析系统需要更多的自定义参数和api接口去关联用户更多的非浏览行为和离开网站后的后续行为。

8、WA工具的pm和网站分析师对网站分析的理解程度
      挑战:工具和人谁先行?
       设计wa工具的pm具有前瞻性带来的好处是更多的分析师群体可以更好使用工具,但工具的使用门槛大幅提高。
        而当分析师更有前瞻性,瓶颈便在分析工具上,但不可能每个分析师都要求自主按自己想法去设计工具。
         解决方案:wa工具pm需要精通wa,提供可供选择的版本和功能供普通用户和分析师使用。

9 、传统wa的clickstream数据如何从页面走向位置
挑战:传统的wa局限在页面上下游关系,需要收集页面位置和区块点击的显性反馈数据作用到个性化推荐等系统中,需要企业有强力的部署和实施能力,典型案例:amazon的url架构,页面不同位置和区域url均被埋点,针对用户和搜索引擎两套url。
解决方案:
        判断uesr-agent,前端用一个js脚本控制,当用户出发区块的链接时,就会在url末尾自动加上标签。