时间: 2021-08-03 08:40:50 人气: 15 评论: 0
编辑导读:楼**字典,即一本写满了楼**信息的字典。对于一个房屋租赁公司来说,掌握真实的楼**信息是非常重要的,是其立足于租赁市场的核心资产。本文以贝壳为例,分析楼**字典为什么能成为贝壳的**级护城河,希望对你有帮助。
昨天给大家分享了一下数字化转型的三种主导方式:产品主导、技术主导和业务主导。其中不免又把贝壳的案例拿出来分析。结束之后,一位朋友现场提问,为什么楼**字典能够成为贝壳的护城河呢?当场解释之后,这位朋友还追到休息室聊了半个多小时,应该是嫌弃我没说明白。
我向来不是一个急智的人,但凡遇到一个问题都得整理清楚思路之后才能完整回答。不过这个问题还真值得写一篇好好说说的。
楼**字典如字面意思,就是一本写满了楼**信息的字典。贝壳的楼**字典采用的是7级门址:城市、城区、楼**、楼幢、单元、楼层、房屋,这样就能确定每一套房,然后再给这套房编一个独一无二的代码。这样再加精准GPS坐标,就能确定每一套房的地理位置。
图**来源于贝壳公开演讲资料
同时,他们还**收集每一套房的商圈、楼**别名、行政地址、产权地址、邮编、房间信息、周边设施等基本信息。
还**收集总建筑面积、**所名称、地上车位、总占地面积、所属街道、居住总户、电梯品牌、绿化率、门窗材质、容积率、物业名称、大堂装饰、建筑类型、通信配置、外墙面、建筑结构、供水方式、建成年代、开发商名称、供电方式、开**均价、供气公司名称、供气方式、采暖方式、供暖公司名称、自来水公司名称、土地级别、物业公司、社区安全配备、地上车位数、地下车位数、入住时间、最低计税价、付赠面积、公摊面积、项目文章、车位数量、容积率、项目位置图、项目交通图、整体规划图、生活信息图、外观实景图、楼栋位置图、楼**剖面图、原始户型图、消防疏散图等扩展信息!
我都不说别的,光这些名词我一口气就念不完呐。贝壳楼**字典现在一共建了多少呢?2亿多套!
图**来源于贝壳公开演讲资料
有啥用?这么说吧,楼**字典是链家升级贝壳的核心中的核心。现在都说ACN是贝壳的核心,我们来捋一下哈,ACN是这样的;
ACN把卖房的流程拆分成两个方向10个小流程。每个角色完成一部分的工作,就拿这部分该拿的钱。
我们假设一下,如果没有这个楼**字典,你怎么把这个流程串起来?甲完成了找一个房源,录到系统中,乙完成了这个房源勘探,也录到系统中,结果系统中是两条数据,怎么给他们算功劳?谁说的清啊?更不用说后续的卖房的事儿。到系统里一搜,同一个房源有N条信息,而且时间还不一样,信息冲突,房主都买过两轮了,还能找到第一个房子的电话,这不乱套了么?
现在很多平台上就是这种情况啊。早期的二手房平台,都用爬虫技术互相爬取,你爬我的,我爬你的,乱成一锅粥。再加上卖房小哥防止别人抢自己好不容易找到的一手信息,故意放的错误信息,你说这房源信息能真的了么?
政府三令五申,禁止房地产交易平台上传虚假房源信息,这人性的弱点,哪能是一纸政令就能搞定的?但是楼**字典就保证了数据的统一性、唯一性和准确性。
这个统一的丰富的楼**字典,就是贝壳扎实的数据基础,对所有业务提供基础数据服务。比如各种花式查询、精准导航、BIM快速出图等,结合大数据和算法,还能有各种的楼**数据分析、热卖小区、户型图解、估价、成交预测等等高阶数据服务。你说这楼**字典有多有用!
楼**数据是怎么收集来的?无他,人肉尔!
我在网上找到的信息是从2008年开始建设楼**字典,2011年制定了真房源标准。但是我从一份早期的《楼**字典采集系统培训手册.ppt》上看到,该文档是2005年创建的,2009年最后一次保存。
图**来源于贝壳公开资料
那么我理解,应该是从2008年开始建设楼**字典的系统,2009年开始进行全面采集。咋采集?业务员扫楼呗!
当时链家的经纪管理部成立了楼**字典项目组,利用楼**字典采集系统采集所有楼**数据。采集范围是所有能出售/出租的房屋。
他们以大区为最高管理单位,大区下面是区域,再往下是店面作业单位。一层层落实到位,管理到位。同时每个区域配备一名普查员,负责房源的真实性、完整性,以及楼**数据录入的进度监督、控制和检查工作。
就这样,从2008年到现在,持续12年了。累计投入多少钱呢?2017年的时候就号称已经投入4.5个亿了。用了多少人呢?人数最多的时候是在2014年,雇了500多名兼职人员搞定了24个城市的6000万套房源。
你说要是没用,不能成为核心数据资产,链家能这么投入么?
这可是人家的商业秘密!不过我倒是真做过类似的工作,当年我做过朝阳区地址库。另外,之前服务过的国家统计局的人口普查(民用住宅)、经济普查(商用房产)系统中,地址也是核心中的核心呐!
楼**字典中各种乱七八糟的系统功能设计其实很简单,就是一个信息录入的页面,没啥难度的。无非就是按照录入业务流程,给个页面,把所有字段都放进去,让业务员好填写,然后上级检查,普查员抽查,领导监督进度。页面长这个德行:
图**来源于贝壳公开资料
至于楼**字典的数据库,大致是这个样子:
图**来源于百度
所有数据的基础是GIS,所以必须得有一个GIS数据库;然后就是房源数据库,里面全是各种小区、房源的信息;还有地址库,我之前做的就是这个工作,把乱七八糟的地址给稍微统一一下;还有历史数据和管理数据等等。
主要的功能呢,基本上就是数据采集(业务员用)、采集进度管理(管理层用)、数据质量管理(普查员用)、元数据管理(初始化用)、系统管理(管理员用)等。
这毕竟还是一个OLTP的系统,又是内部人员用,所以长的丑点无所谓了,主要是能把数据沉淀下来啊。
其实一直以来,都有人拿美国的MLS说事,说中国无能,不团结,做不起来这种完全开放且数据真实的房地产信息平台。
这个言论其实很没道理,单纯的对比而已。美国为啥能有MLS?因为美国地广人稀,僧多粥少,而且也有飞单到其他公司的情况,所以各经纪公司就制定了MLS规则,抱团取暖,成立了MLS。而且,美国的MLS也不是全国统一的,各地都有,据统计有800多个。所以贝壳其实就是中国改良版的MLS。
那对于其他经纪公司来说,没有贝壳那样的楼**字典咋办?好办么,弄一个就是了。贝壳是半封闭的,接受ACN规则的经济公司,才对他开放所有资源。想要打败贝壳,那只有出现一种更开放、更完善的规则。因为在贝壳目前的维度之下,没有敌手。ACN就是二向箔,低维度的商业模式根本无法抵抗。
咱圈外人,看个热闹就行了。这些事情地产界的人研究的透透的,潘石屹大佬的弟弟潘石坚就写过很多MLS的科普文章,各位可以去翻一翻。瓜吃完了,下次再聊~~
作者:大数据架构师,国药国华大数据总监,擅长BI、数仓、数据中台产品规划领域,公众号:大数据架构师
本文由 @大数据架构师 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于 CC0 协议