Changes between Version 1 and Version 2 of Match3


Ignore:
Timestamp:
12/02/2013 12:14:27 PM (12 years ago)
Author:
lifeng
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Match3

    v1 v2  
    2828 
    2929 * '''命题二:去重算法''' 
    30   * 作为一个程序员,怎么能不懂算法?现在有100万的论坛帖子,SEO希望能够过滤掉标题重复的帖子,给你一台日常工作的电脑,你会怎么做? 
    31  
     30  * (1)从100万的论坛帖子中,过滤掉标题重复的帖子,要求使用单机实现。 
     31  * (2)从网站的连续3天访问日志文件中,分离出独立访问者visit,对访问者总数进行统计,并将拆分好的独立访问者归档,用于校验和备查。拆分规则: 
     32       * 根据cookie+ip来排重,续接访问者信息; 
     33       * 根据每次访问的referer等来判断本次访问的来源,分为站内/直接、广告、搜索、站外四个来源,如果来源改变,则本次独立访问结束; 
     34       * 如果来源不变,但是两次访问间隔时间大于30分钟,判断为一次独立访问已经结束;