基于北上Airbnb的一份调研报告

微信:leftmoon(本文初次完成于5月底)

其实早在2013年的时候就注册了Airbnb,当初对这东西还挺好奇的,只是一直没尝试过。随着前不久Airbnb入华,因此,又一次起了好奇之心,还是打算研究研究。

一、房源样本

Airbnb没提供公开的数据和API,所以,只能通过网页上看到的数据来分析,但又由于数量太多,因此只能选取部分数据研究一下了。

Airbnb本身的访问较慢,而且不允许太频繁,所以只能拆成多个时间段来获取数据。

研究时间:2017.4.26~2017.5.20,选取的城市为北京和上海
样本总数:总计2470,其中有效2084。由于样本并不是一次选取的,而是根据需要多次添加,在这段时间中,有些房间变得不再提供服务。

样本总数为:

选取方式如下:搜索目标城市,如上海,然后限定价格范围,将搜索的结果记录下来,通常,这些结果不会超过300条,多次修改价格范围,将数据汇总。

房间类型方面,目前Airbnb上主流就这三种,虽然还有其它的,但暂时没出现在样本中。

合住房间 87
整套房子/公寓 1259
独立房间 738

一点小猜测,合住的,基本上就是共享经济了,独立房间的,也许就是为了减轻一点房租的压力,整套房子的,基本上就是经营生意了。

由于两城消费能力不同,所以,其价格分布上也略有差别。

由上图可看出,上海集中在¥150~¥300之间,北京集中在¥250~¥450之间。好吧,北京果然是全国人民的首都,还是有钱人多啊。

附加结论:北京的房租高于上海是有支撑的,对于租房一族来说,多数人在北京生活比上海要难一些。

二、房东们

每个房源都会对应一个或多个房东,为了简便,这里没有把第二房东计算进来。通过样本找到了这些房东们,总计1700位,不知道什么原因,有3位房东在此期间注销了帐号

在1697位房东中,有52位房东虽然没有注销账号,但是暂停了房源服务,因此,能提供服务的房东合计为1645,同时,顺手查了一下这些房东经营的房源数量,结果比预想的要多,合计为6709个房源,平均每位房东有4个房源。

在清理数据的过程中,总是会出现一些偏差,让人不解。后来发现,原来有4位房东在北京和上海同时经营着Airbnb

(上面4位漂亮的妹子同时在两城经营着Airbnb)

这下越发有趣了,于是继续深挖。不知道Airbnb对于一个房东有没有房源上限的限定,因此,想看看拥有房源数最多的房东名下到底能有多少房源。结果还是有点吃惊的,拥有房源数最多的一位房东,其名下有95套房源,厉害厉害,佩服佩服。这位大哥肯定有专门的团队来管理房源了。至于中间有67个房源的那位妹子,笑得可真开心啊。

(Airbnb 房源数TOP5)

Top5中,北京的房源占了70%。首都就是首都,有钱人真多,足够支撑得起市场。

其它的数据做一个汇总:38%的房东只维护了一套房源,37%房东维护2~4个房源(一套房子最多4居,房东自己不住),25%房东维护着5个以上的房源(至少得有两套以上的房子才行),而实际情况是,由于某些原因,这些房东会把房源拆在多个账号下,因此,拥有超过5个房源的房东人数实际会更少,难怪有人说Airbnb上有20%的房东拥有80%的房源,看来也差不多。

拥有房间数 人数 房间总数
1 627 627
2~4 602 1656
5+ 416 4426

 

三、预定情况

由于预订数据较多,而且状态会多次变化,对于数据的加工、整理比较耗时,所以这里多以上海举例。

分析完了房源和房东后,还想知道这些房子到底能不能订得出去,预定率如何。这个还是得拿出数据说话。经过近20天的跟踪发现,每天的预订情况基本相符,所以,仅展示某一天的预订情况。

每天晚上23:45分的时候,对样本房源进行查询,看看今日能否预订,如果可以,说明还没预订出去,如果不行,说明房间已经预订出去了。

以上是5月20日当日0点截止到23:48分时的预订情况,也许后面12分钟还会有预订发生,不过相对于一整天来说,影响不大,所以,先不考虑了。

Airbnb上最严格的要求是提前7天可退50%,暂时没有统计在最严格的退订政策之下有多少人是提前7天以上预定的。只是假设住户本身是希望灵活处理的,所以,提供7天以上的预订可以扔掉,实际上也是如此,每天都有很多取消的,不过,当日入住一般都不会取消。所以,我们把7天以上的预订去掉再来看看。

当日入住当日发起订单的超过50%,每天都是如此。在当日预订中,预订时长基本上为1天,2天的不多,超过2天的更少,相反,在提前2~3天的预订中,多数会有2~4天的行程。

上图是每日当日的退订数量,由上图可看出,当日退订最多不超过2%,对整体基本没影响。(13日前后由于网络问题,导致数量异常,请忽略)

仅仅知道有哪些预订还不够,还想知道什么位置的房源更受欢迎,什么样价位的房源预定最快。这些有些繁琐,仅选取上海为例子,可以看到下图。

(由于百度使用的火星坐标系,因此显示有偏差,你懂的。为了避免麻烦,上图没有修正这个位置偏差)

可以发现,上海的预订基本集中在浦西,浦东的不仅少,价格也不高(颜色由浅及深代表价格越高,600以上的价格用蓝色标出)。从房东的描述来看,也是基本相符,房源中“法租界”这样的字眼出现频率较高。

北京情况也是相似,基本集中在二环内,因为大量的老胡同,当然,东二环到东三环因为有使馆、工体、三里屯等,也是预订的重点区域。

现在进一步分析,究竟什么样的房源更吸引人入住,首先我看们一下房东都喜欢以什么样的关键词来描述房源:

拆分出来的关键词很多,如下:

‘地铁’: 490, ‘租界’: 364, ‘号线’: 352, ‘公寓’: 318, ‘外滩’: 272, ‘迪士尼’: 236, ‘温馨’: 210, ‘分钟’: 198……

太多了,而且杂乱,进行适当的整理及合并,比如将’地铁”号线”分钟’这三个关键词合并起来,都是用来描述房源的位置信息的,最后得到的结论如下:

地铁:1206

租界:364

迪士尼:290

外滩:272

温馨:210

新天地:130

人民广场:118

由上可以看出,排在第一位的是交通的方便程度,其次是位置,然后是游玩的目的地,相反,对于房间的描述,并不多。上述地点除了迪士尼外,其它都高度集中在浦西,因此,大部分房间比较老,而且会临街,最多只能用温馨这种词来描述一下,至于其它的如装修风格等,也只是辅助性的描述了。迪士尼太远了,只能强调一下交通的便利性,真正迪士尼周边的房源不多,入住率也一般。

四、访客群体分析

其实,这部分我没做……数据量太多了,也犯懒,不过,从现有数据中,还是可以得到一些结论的。(也许会再专门做一次分析)

我们相信,大多数的房东都不笨,一定会追求利益最大化,因此,无论是房源的标题还是描述上来说,都会经过调整,所以,从房源的描述上来分析,也能得到一些结论。

尽管Airbnb自带翻译功能,即使使用单一语言的描述,针对不同国家的用户,会自动进行翻译,所以,如果一个房东只有是刻意想要服务老外,因此,才会使用英文来进行描述,对于国人,这一点显然是多余。

纯英文描述 非英文描述
上海 101 980
北京 60 943

上述结论与预期相符(省去若干字的预期),并且可以得出简单的结论:

  • 使用Airbnb中,仍然是以国人居多
  • 上海的老外比北京要多

五、补充

上述部分基本完成于5月底,7月底做一下少量补充,因为中间自己做了一些实践去验证一些猜测。数据样本没有变化。

1、预订率:北京接近90%,上海约75%

2、预订天数:北京单次预订天数比上海多1.5~2天,因此,北京的经营成本低于上海

3、毛利润:上海的房租略高于北京,但价格低于北京,同时,受限于成本等原因,所以在利润上,北京远高于上海。一个简单的推算,airbnb的房东下的评论数与毛利润成正相关,同样一条评论,在上海,意外着房东赚取了170的毛利润,在北京意味着600左右的毛利润。所以,当看到某个北京的房东下有1000+评论的时候,意味着这位房东已经通过airbnb赚取了60万左右的毛利润,而实际上,这个数值可能会很轻松的超过100万

4、airbnb已经形成了一种规模,实际上,已经是很多机构开始投入了大量资金,所以,超过100套房源的机构是一个非常多的数字,但没法从表面上看出来

5、退订:基本可以忽略,另外,一些空置数据也有一些偏差,因为有部分支付绕开了平台,导致出现空置与退房的情况

更多:也许会有第二篇调研分析来完善本章的不足

最后,为了不辜负我辛苦码的这么多字,转载请保留作者及出处