@SD下海的杨大夫
【磕盐博主】前几天李云迪事件后,我和 chenqin 一起做了一份好玩的分析。
我们首先将中国东部某发达省份的行政处罚案例从2016年1月到2021年10月全部抓取了下来,原始行政处罚数据约500万条,保留了其中卖淫嫖娼案件后,还剩13万条。从图1和图2可以看到,这个处罚决定书非常详细,包括了时间、地点、价格、方式,用正则表达式即可可以很方便地将这些信息提取出来。
随后,将这13万条数据分成了民房、酒店/旅馆、足浴/会所/发廊,共三大类。图3列出了这三类地点的分布。不难发现,从2016年1月到2021年10月,民房的占比是越来越高的。一开始仅占25%左右,到现在已经高达63%。当然,这个比例并不等同于嫖娼发生地点的真实分布,只能说,被抓到的嫖娼案件中,在民房中发生的比例大大提高了。到底是民房发生嫖娼的频率更高了,还是民房嫖娼更容易被抓了呢?只能说,各地的朝阳群众都很靠谱啊。
图4列出了不同地点的嫖娼价格,可以看到,酒店/旅馆的价格一般都显著高于民房和足浴/发廊/会所,平均价格达到两倍以上。而但其中民房的价格又要比足浴/发廊/会所略低一些。从时间上看,这几个地点的嫖娼价格都在快速上升(通胀无处不在[二哈]),酒店内嫖娼价格2016年还在400元左右,目前已经稳定在800元以上,个别月份甚至超过了1000元。民房的价格在2016年原本是200元出头,现在大约是400元。李云迪被举报的地点是某小区,那应该属于民房,但民房内部的价格差异也很大,在我们抓取到的数字中,发生在民房嫖娼价格的99%百分位达到5000元,1%百分位仅为50元,相差百倍之多。如果看极端值的话,最高甚至达到50000(图5),不过被捕时嫖资尚未支付……
然后又做了一个「方式」上的分析。因为这个处罚书写得实在是……过于详细了,用关键词可以识别出来具体是哪一种。图6是不同嫖娼「方式」在各个时间的占比、图7是不同嫖娼「方式」在各个时间价格,都挺好玩的,不细说了,自己看吧。
没有评论:
发表评论