如果你在微博上搜索“小宇宙首页”,搜索结果大概有三种。

  1. 小宇宙app微博账号推荐app首页上的播客;
  2. 各播客的主播发发现自己的节目上了首页非常惊喜和快乐;
  3. 播客听友们花式吐槽小宇宙主页推荐的播客特别差。

我不禁陷入了沉思。小宇宙app上到底在推荐什么播客?光沉思没什么用,还是数据比较直观。那么就说干就干。


插播一个广告
我开了一个newsletter Your Weekly Dose of Podcasts,每周推送我喜欢的播客节目,我对于播客的观察(包括这篇对于小宇宙的观察),播客吐槽等等。
欢迎通过以下按钮订阅。




By subscribing, you agree with Revue’s Terms and Privacy Policy.


第一步 -- 拿到数据

一种方式是对着小宇宙app,手动录入数据。我这么懒…放弃。
搜了下小宇宙app官方微博有在微博上也发布每天的更新。只要发了微博那就很好办了。
随手google一个“微博crawler”,第一个结果就是github上别人写好的爬虫: GitHub - dataabc/weibo-crawler: 新浪微博爬虫,用python爬取新浪微博数据,并下载微博图片和微博视频
跑了一下这个crawler以后,几分钟内我就有了一份“小宇宙播客App”发过的所有微博。

第二步 -- 清理数据。

到这步的时候我才发现,从2020年4月小宇宙app上线后,每日推荐的微博几乎每天更新只更新到2020年9月,总计100天。之后就只有非常零星地提到“今天首页”播客。
因为我并不会抓取app上的数据,并且周四打了疫苗后,周五完全瘫倒什么事情都没有做,所以我们就用这一百多天的数据凑合着看吧。这样我们至少能知道小宇宙上线的最初半年,都在推荐什么播客。
花了一点时间把这100多天的播客的名字都整理出来。一共有来自135个播客节目的306期播客。
最花时间的是找到每个播客对应的category(类别)。因为我没有找到如何scrape这部分的数据,所以只能花了点时间手动做了这部分。也正式因为这个手动的部分,也发现了很有意思的数据 — Podcast Network。在下一部分会详细讲。

第三步-- 看看数据

节目

推荐过五次及以上的有如下15档节目:

最高次数的是无聊斋,被首页推荐了10期, 第二的是跳岛FM。

Podcast Network

这里我用“Network”来非常不严谨地定义这些单个播客背后的联盟。我常听的英文播客里有很多是媒体的节目,例如NPR/BBC都有一系列的节目;再例如Wondery,也是一个很成熟的podcast network,2020年底被Amazon收购了。

国内目前做得最好的Podcast network应该是JustPod了。

在这306期,100多天的推荐里,JustPod旗下的播客占了~16%。约等于每两天就有一期JustPod的节目。JustPod的节目平均每档节目被首页推荐3.6次。

在独立的播客(这里指没有和其他播客结盟)里,随机波动和故事FM是并列第一名,应该没有人会觉得意外吧。

Category

Apple Podcast在提交的时候会要求选择podcast的category,子category。这里的category根据apple podcast上的显示,无论是否和播客本身内容相符,都是播客制作者选择的。
在小宇宙首页上的播客里,前三名分别为“社会与文化”,“喜剧”和“艺术”。“社会与文化“占到了全部播客单集的28%,和28%的播客节目。“喜剧”分别为12%和9%,“艺术”分别为10%和10%。

根据Apple podcast对于top-level category和子category之间的定义,当把所有的category都换成top-level category后,Society&Culture继续强势领先,占据了近40%的被推荐播客单集。Arts是第二名,占17%。

在我试图搜索scrape播客和播客的category时,我找到了这篇文章
The most crowded categories in Apple Podcasts (April 2021 edition) | by Dan Misener | Apr, 2021 | Pacific Content

这个数据是截至2021年4月的数据,作者的数据包括了来自165万播客节目的3800万单集。

这个chart 和小宇宙推荐的chart非常不一样。小宇宙完全没有”宗教与精神生活“和“新闻”。这个当然和中文播客的总体状况有关。小宇宙上推荐的教育类只有非常少的占比(3.3%)。Science类别更少(2集)。

另外,通过这位作者的数据,可以对比2018年,2020年和2021年的数据,三个年份的对比非常有趣。篇幅有限并且和这篇的主题不是特别相关,我会另起一篇写其中的变化。

一个好玩的数据可视化

最后是一个我觉得比较好玩的数据可视化,把小宇宙所有每日推荐播客的微博内容做了一个wordcloud。能看出来这是一个小宇宙的logo吗?

在拼贴了几个tutorial之后,code在这里。你也可以做任何形状的数据可视化图。


总结一下,小宇宙首页的推荐,至少在前半年里,有非常多的JustPod旗下播客,有非常多的社会与文化类别节目。

虽然小宇宙首页的推荐只是中文播客里非常非常非常非常少的一部分,不过鉴于很多很多中文播客听众是从小宇宙开始听播客,我们可以说小宇宙的首页推荐引导了相当一部分人对于中文播客的品味和期待。

很多主播都会希望自己的节目登上小宇宙的首页,毕竟首页上的节目确实会有非常高的收听量。这对于中文播客的整体前进方向也会有很大的影响。所以在此一个小小的私心,希望小宇宙app能够推荐一些更多元化的节目,或者开发更多“发现”的功能,让更多依赖小宇宙收听节目的朋友可以听到更广阔的世界。

为什么好多人吐槽小宇宙app首页推荐?--数据告诉你