土法炮制数据库 家谱网帮你查祖宗
狂想
奥巴马和影星布拉德·皮特是什么关系?答案是第九代表兄弟。他们共同的祖先名为埃文·希克曼,生于1690年。埃文的儿子小埃文是布拉德·皮特的第七代曾祖父;埃文的另一个儿子詹姆斯是奥巴马的第七代外曾祖父,属奥巴马母亲的家族。
该信息来自成立于1983年的“家谱网”Ancestry.com。这家网站的业务就是基于庞大数据库,帮助人们寻根问祖。
会有那么多人花钱查自己祖宗么?相信我,世界上“无聊”的人实在太多。就在去年,Ancestry将家谱业务做到了3亿美元。
土法炮制数据库
Ancestry是英文祖先、家世的意思。顾名思义,这是一家做互联网寻根问祖服务的公司。
既然是帮助用户找祖宗,自然离不开庞大的基于家庭关系的资料数据库,而这也是Ancestry最核心的竞争力所在。目前,它已拥有数十亿人的数据,这一数据还在持续不断地增加。基于这个数据库,Ancestry可以帮助用户找到自己的祖先和远亲,甚至可以发现与某个名人之间存在的亲戚关系。因为根据六度空间理论,一个人和任何一个陌生人之间所间隔的人不会超过6个。
之所以能拥有这么庞大的数据库,完全是来源于Ancestry的不断积累,通过为用户提供建立家庭树的家谱软件,然后再通过各种记录的资料充实数据库以支持寻根活动。
比如在美国市场,Ancestry就拥有1790-2000年的美国人口普查的数据,另外还有各种移民记录、军队服役记录,连旧报纸和杂志上的个人资料也不放过。而在其他市场,Ancestry的工作同样用心,英国用户在Ancestry上甚至可以追溯到13世纪剑桥大学的同学录。
当然,这些数据都不可能通过捷径来获得,需要把很多手写的记录录入到电脑数据库中,其中包括一些字迹非常难以辨认的档案资料,耗费了非常大的人力工作。光是美国人口普查档案数据的录入就耗费了6年时间,共耗时达到660万小时。而英国人口普查档案数量也非常之多,如果把这些档案打印成册并堆放起来,高度可达到著名摩天轮“伦敦眼”的5倍。
正是通过这样一砖一瓦慢慢添加的土办法,Ancestry打造了一个旁人无法想象的庞大数据库,为整个寻根模式打下了基础。
两级付费
虽然不像谷歌、Facebook等大众型网站那么引人注目,但Ancestry一年几亿美元的收入也让投资人心里很踏实。它在2009年IPO,目前市值18亿美元。
通常Ancestry的用户有两周的试用期,付费用户分为查看美国本土资料的用户和查看世界资料的用户,两者服务的价值也不同。其中,查看美国本土资料的用户,一年需要交纳155.4美元,而如果要查找全世界的资料,年费为299美元,相对于美国居民的总体收入,这点钱简直微不足道。
付费用户不仅可以获得所有免费用户的服务,而且可以获得家族寻根的提醒服务。比如通过其庞大的数据库,帮助用户发现了可能的祖先或者远亲,网站都会告知付费用户。付费用户还可以通过社区服务寻找相关的人员,比如有相同研究兴趣的人,也许可能就是自己的远亲,网站为用户提供了信息传递的服务,因为在确定身份之前,双方可能并不一定愿意想认识,网站能够起到信息沟通的中介作用。***,付费用户还可以查阅和搜索很多珍贵的记录资料,这些记录资料有利于用户寻根,有利于用户完善个人的家族历史,并把家族历史传承下去。
另外,免费用户则可以建立、扩大和分享家庭树,还可以上传照片、文档以及家族故事,可以在线邀请其他朋友浏览,相当于免费建立个人家族历史谱系。这里,免费用户其实也在为网站做贡献,贡献了家族历史的数据,这样的数据为其他用户,尤其是付费用户的寻根提供了很好的基础。从这一点看,Ancestry的模式对于所有用户的价值的挖掘其实做到很深的层次了。
一座“金矿”
Ancestry之所以成功,主要原因就在于它的庞大数据库很难被模仿和拷贝,并在此基础上建立了坚实的用户价值。如果谁想提供类似的服务,对手至少要想方设法获得多如牛毛的档案资料,这是一道坎;而要对档案资料进行数字化的处理,这又是一道庞大的工作;而要说服用户放弃Ancestry转投其他网站,又是一道坎。对于用户来说,即使你做到了对档案的数字化工作,如果没有其他更好的寻根服务,用户也没有必要去别的网站。
到目前为止,Ancestry还只是为用户提供寻根服务,毕竟他们是靠这项服务起家的,但是手握如此庞大而又准确的数据库,就像守着一座金库一样,仍有可挖掘的商业空间。
比如,这些梳理人际关系的个人数据对企业用户就价值千金。因为这些数据将使企业的宣传销售更有针对性,同时能更好地提供个性化服务。到时候,Ancestry就能广开财源,在为个人用户提供付费服务的同时,还能获益于企业用户。
【编辑推荐】
相关文章
- 从本体论开始说起——运营商关系图谱的构建及应用
- 如何成为一名数据科学家?
- 从未见过的堂兄杀了人,你的DNA是关键证据
- 20个安全可靠的免费数据源,各领域数据任你挑
- 20个安全可靠的免费数据源,各领域数据任你挑
- 阿里云李飞飞:All in Cloud时代,云原生数据库优势明显
- 基于Hadoop生态系统的一高性能数据存储格式CarbonData(性能篇)
- 大数据告诉你:10年漫威,到底有多少角色
- TigerGraph:实时图数据库助力金融风控升级
- Splunk利用Splunk Connected Experiences和Splunk Business Flow 扩大数据访问
- 大数据开发常见的9种数据分析手段
- 以免在景区看人,我爬了5W条全国景点门票数据...
- 【实战解析】基于HBase的大数据存储在京东的应用场景
- 数据科学家告诉你哪些计算机科学书籍是你应该看的
- Kafka作为大数据的核心技术,你了解多少?
- Spring Boot 整合 Redis 实现缓存操作
- 大数据学习必须掌握的五大核心技术有哪些?
- 基于Antlr在Apache Flink中实现监控规则DSL化的探索实践
- 甲骨文再次被Gartner评为分析型数据管理解决方案魔力象限领导者
- 爬取吴亦凡微博102118条转发数据,扒一扒流量的真假