Changes between Version 1 and Version 2 of Match3
- Timestamp:
- 12/02/2013 12:14:27 PM (12 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
Match3
v1 v2 28 28 29 29 * '''命题二:去重算法''' 30 * 作为一个程序员,怎么能不懂算法?现在有100万的论坛帖子,SEO希望能够过滤掉标题重复的帖子,给你一台日常工作的电脑,你会怎么做? 31 30 * (1)从100万的论坛帖子中,过滤掉标题重复的帖子,要求使用单机实现。 31 * (2)从网站的连续3天访问日志文件中,分离出独立访问者visit,对访问者总数进行统计,并将拆分好的独立访问者归档,用于校验和备查。拆分规则: 32 * 根据cookie+ip来排重,续接访问者信息; 33 * 根据每次访问的referer等来判断本次访问的来源,分为站内/直接、广告、搜索、站外四个来源,如果来源改变,则本次独立访问结束; 34 * 如果来源不变,但是两次访问间隔时间大于30分钟,判断为一次独立访问已经结束;
![(please configure the [header_logo] section in trac.ini)](http://www1.pconline.com.cn/hr/2009/global/images/logo.gif)