2025-07-28 21:00:00
案例:“记者在火车上调查大家都买到了回家过节的车票”
第一章讲的是样本因自身特性或选择方式而无法代表总体,导致统计结果失真。
最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。 随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本? 纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。
案例:一个富豪年薪 1000 万,他有 9 个朋友穷光蛋,平均一看,各个年薪百万。
当你听到公司执行总裁或企业所有者宣称,在他的企业中员工的平均收人是多少时,你应该好好思考一下其中的原因。如果这个数是中位数,你可以获得一些显而易见的信息:一半员工赚得比它多,一半比它少。但如果是均值(请相信我,没有确切指出它的种类时,多半是均值),它仅仅是所有者 25000 英镑的高收入与全体工人低水平收入的平均数,根本没有什么意义。“平均年收入为 3800 英镑”既隐瞒了1400英镑的低收人,又隐瞒了所有者以巨额薪金形式抽取的高额利润。
所以,当你被告知某个数是平均数时,除非能说出它的具体种类——均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。
案例:某人宣称抛硬币正反面的比例是 5:1,但是没有披露他做了 100 次试验,只选择了其中的 5 次试验结果作为样本进行统计
还有另一类没有透露的数据,它的遗漏也同样具有破坏性。这类数据表明了事物的变动范围以及与给定平均数的偏离水平。通常情况下,单凭一个平均数来描述事物过于简单,起不到作用,不管这个平均数是均值还是中位数,也不管平均数的具体类型是否已知。
案例:某公司投入巨额资金,部署了多条国际专线,调整了 BGP 路由策略,优化了跨境访问链路,最终成功地将国际网络访问速度从 300 毫秒降低了 2% —— 相当于 6 毫秒的提升。
只有当差别有意义时才能称之为差别
换句话说:
只有在毫无意义时,这个差别才如此值得强调
案例:(见以下图像)
只需要改变横坐标与纵坐标的比例关系,将纵坐标的每一个刻度缩减为原来的1/10即可,没有人规定不能这么做,而这将会产生一张更加完美的图形。
显然图形比文字更有效,因为图形中不存在任何形容词和副词来破坏它所具有的客观性幻觉,而且谁也无法指责你。
搜索到某龙江省历年出生率数据(21 世纪),这是一个稀疏平常的折线统计图
已经可以看到出生率下降比较多,如果我修改为下图的形式,宽高对调,同时 Y 轴间隔从 0.2 调整为 0.05,图像将更有震撼效果
案例:(见以下 AI 提供的说明)
在图表的世界里,只要敢缩轴、敢立体、敢堆图标,你就能让“微涨”看起来像“暴涨”
跟「令人惊奇的图形」类似,一维图像想要突出或降低一些视觉效果,可以做的文章很多
案例:某诺贝尔奖得主每天都喝这种牛奶,但没有提及他也吃面包、鸡肉和沙拉,每天晨跑、骑自行车
如果你想要人相信 “结论A”,但拿不出证据,就展示一个听起来很像、但其实只是“相关”的 B。
这就是“不完全匹配的资料” —— 一种披着数据外衣的偷换概念
案例:研究发现冰淇淋销量高的时候,溺水事件也多。
实际上是因为夏天到了,吃冰淇淋的人变多,游泳的人也变多,共同原因是 “气温升高”,不是冰淇淋和溺水互为因果。
重要的概念即:相关 ≠ 因果
“相关性”(correlation)只是两个变量一同变化,而“因果性”(causation)意味着一个是另一个的原因
但是,很多时候人们会误把 “同时发生” 当作 “有因果关系”——这是一个统计思维中的致命误区
案例:产品满意率达到 100%,其实只调查了 5 个人,这五个人还是公司的员工
任何建立在小样本容量上的百分数都可能产生误导,直接给出调查对象规模(样本容量)的大小将更有价值。
案例:股票跌了 10%,但是需要上涨百分之 11.11% 才能回到原来水平,下跌的越多,涨回去越难
50%的削减量需要通过提高100%才能加以补偿。
案例:商场打折,折上折的数字陷阱
份“50%折扣再打20%折扣”的报价单时,那并不意味着70%的折扣,实际上只有60%
案例:(这个案例就很经典)
人们询问他的兔肉三明治为什么能卖到如此便宜的价格时,“哦,”他说,“我当然得掺一些马肉,但我的比例是一比一:一匹马,一只兔子。”
省流:数字不是事实,只是说故事的工具,别轻信涨幅和图标,多问问数据怎么来的,多问问 AI 怎么看
2025-07-23 21:00:00
刚跑外卖时,我同时下载了美团众包和达达秒送骑士,后者两个月前被京东收购了,我跑了几周的美团众包后,也过了新手期,就想着换达达试试
网上说达达定位不准,结果第一单就体验到了,是真不准
距目的地差了有两百米,我给用户打了两遍电话才找到,直接导致我手里拿着的第二单被迫超时,好在可以用新手免罚卡抵扣
如何避免定位不准出问题?
别用达达 APP 内的点击跳转到地图功能(错误的坐标,在哪里显示都是错误的),直接打开高德地图,手动输入目的地,开启导航
达达单价整体上感觉比美团众包能高个一两块,但也不能无脑接单,广场挂着没人抢均价还不到1块钱每公里的单可别接,妥妥的甄纯牛马
公里均价能到2元以上的单,对我来说都还算不错(取货送货都是几百米,公里均价3+元的单是真不好抢)
达达近期有个活动,跑一单达标就送 15元奖励,也是被我白嫖到了
说回来配送,跑达达第一天,就送到两个让我蛮开心的单,一个配送到我现在住的小区,另一个配送到前些年住过的城中村公寓,这两单不用开导航
最近发现,女骑手好像多起来了,网上买菜送货员、上班去地铁的路上、商场电梯间,都有看见过女骑手,明显比前两年多,不知道有没有关于骑手的数据报告支持主观感受
2025-07-24 更新
还真找到了美团的骑手报告,在 https://www.meituan.com/newsroom/rider-protection 找到《美团骑手年度职业报告(2024-2025)》
(2) 性别特征:男性占比超九成,“夫妻档”稳定性强
2022-2024 年,男性骑手在平台月活骑手中占比始终超过 90%。虽然女性骑手占比不足 10%,但数量 稳步上升:2022-2024 年,在美团平台上获得收入的女骑手数量从 51.7 万人增长至 70.1 万人。田野 调查显示,女骑手以已婚中年女性为主,其中很多女骑手职业选择受配偶影响,即丈夫先成为骑手,后 和妻子组成“夫妻档”。因样本量有限,夫妻档骑手占比难以衡量,但已有样本显示,“夫妻档”骑手 的就业稳定性更强,且女性略强于男性。调研中,多对夫妻档做骑手时间超过 3 年,二人中至少有一人 实现晋升,成为小组长、站长等。除夫妻档外,女骑手的职业选择理由与男骑手无异,收入高、自由度 高是其选择做骑手的主要原因。
报告提及到女骑手人数变多,但比例并没有提升
除了「信息公开」板块,美团网站上的「公益」板块也很好,为公益操场捐款时可以选择到家乡,然后看到正在筹集资金的幼儿园,建设完成后可以获知 "捐赠的每一块地板放到了哪个操场的哪一行哪一列"
2025-07-19 23:06:00
大阪今新宫、动物园前是个交通很便利的地方,北上可到难波、心斋桥,往东南方向一站可达天王寺,在附近住了两天,交通很便利
在我返程的最后一天,到 Daikoku Locker 取行李,顺便逛了下附近的唐吉诃德,根据 Google Map 地图,打算坐南海本线往关西机场走
下着小雨直接钻进了「JR 今新宫」站(下图),上站台后走了好长一段,刷卡时错误,被站务拦住,他有一个小对讲机,在跟我确认是 Chinese 后,切换为中文输出,告知我不能从这里过去,但是他没告诉我要怎么走,于是我又掏出手机中文转日语,但是我他表情有些迷茫,然后又打字问他
耽搁了一会儿,我大概理解了他说的,然后从图 ① 位置又出来,冒雨沿路走到图 ② 位置
惯性思维容易害人,这两个站其实不互通
看到 “NANKAI” 字样,就是走对了
坐车前,我还有些分不清海南本线和南海特急,以为是同一车型,后来发现差别很大,一下是南海本线和南海特级的列车
(有些像北京地铁的是海南本线)
(网图:酷酷的是南海特急 - 忍者号 Rapit)
2025-07-19 22:56:00
之前没读过《长安的荔枝》原著,直接看的电影,观影上整体感觉良好,节奏比较快,没有彩蛋
剧中大鹏饰演的李善德,被媳妇每天来个大逼斗,着实有些不理解,不知是否要塑造出 “妻管严” 的人设,感觉老实人+爱媳妇的形象的主角,观众都很喜欢
剧中圣人只是想讨皇后的欢心,执行的人就得脑袋别裤腰带上跑断腿,底层的老百姓就要为这些权贵买单,并附上沉重的代价,真就是时代的灰尘… 牛马们能一秒对上号,高台上的权贵们也从不管底层死活(电影中)
电影表达的内容,字谜都在谜面上,所以可挖掘的深度有限
说回大鹏,他拍的影片,都有很强烈的流量风格,从屌丝男士,到后来看过他拍的《年会不能停》 ,都带着幽默、职场、Happy Ending 的标签
大鹏是导演也是主演,可以感觉到演技有所提升,但大鹏的电影目前看还是主打快销
提一嘴白客,从《万万没想到》的王大锤时期积攒了好感度,个人觉着白客演电影很有表现力,荔枝园主阿僮(庄达菲 饰)的率真仗义也让人印象深刻
这个电影适合平时不太看太多电影的观众,许久未去影院,偶尔去看个电影,有泪点、有笑点、有故事也有还不错的结局,对于我这种一年看两三场电影的人来说是友好的
2025-07-17 19:41:00
稍微调整了博客的代码,支持了 “Memos” 功能,用来记录一些零碎的想法和备忘录。
线上实施,准备了脚本(是 Pod 的 Yaml 配置文件)用来导出数据,测试环境验证的很完美,正式环境一提交,Pod 起不来,一看日志被 Dockerhub 限流了,想到前两天刚看到个国内镜像源 https://docker.aityp.com/ ,虽然机器在国外,但问题不大,替换了镜像地址,救我老命
导出数据容易,从 k8s 中下载数据到本地有些麻烦,数据量不大,压缩后几十MB,想到可以加密后上传到免登录的公共临时存储,找了 https://0x0.st/ 和 https://catbox.moe/ 前者限制了我的机房 IP,后者用着着实不错
$ zip -r -P "$ZIP_PASSWORD" data.zip data/
$ curl -F "reqtype=fileupload" -F "[email protected]" https://catbox.moe/user/api.php
https://files.catbox.moe/y1xzwa.zip%
2025-07-15 21:00:00
有天我在网上闲逛,看到一个「船新」版本的地球 Online 游戏思路
如果你想玩开放世界大作,可以弄个外卖工作做做,有大地图,有每日任务,有随机事件,有动态天气变化,有NPC,有攻略,有打法,除了战斗系统外一应俱全,完成任务委托还能获得对应奖励,为何不来试试呢
外卖是现代冒险者,有任务中心,有结算,有冒险地图,这就是冒险者工会。
研究后发现确实值得一试,在真实物理引擎的加持下,体验肯定会不一样
新手上手最简单的是「美团众包」服,在上号的前几天先下载游戏,注册,学习了解游戏规则,游戏外设至少要准备「电动自行车」和「头盔」以及「外卖箱」
自行车和步行也是可以的,只是能接的任务有限,影响游戏体验,因为游戏过于真实,头盔也必不可少,外卖箱我是在淘宝 18.8 买的,可以使用泡沫箱替代,箱子不是强制的,主要是为了保温和避免餐损
另外电动车上的手机支架,也十分建议配备,路线不熟时,频繁停车看手机很浪费时间,超时罚款会很影响心情(新手期赠送了三张免罚券)
需要缴纳 100 元押金,用来解锁更多类型的订单任务,健康证非强制,一个月新手保护期过后会提示上传,不上传会限制同时挂单数量
新手玩家不建议以挂单量和任务奖励为主要目标,这会增加些焦虑情绪,也能避免任务超时触发惩罚机制,先稳稳当当,一次接个一两单
新手期有时会派发新人专属,绑在一起的两个订单,取餐都在一个区域,送达地点也不远,这种单很好,不要错过
不建议接的任务
就接点正常的任务,在新手村慢慢攒经验
游戏感受
平时下班儿晚,都是赶在周末上号,每次两到三小时,最近总共游戏时常 9小时,报酬124.5 元(把头盔和外卖箱钱赚了回来),平均时薪 13.8元/小时,后期陆续达到 15元/小时(跟职业玩家没法比)
近单模式下,平均四块钱左右一单,六块钱以上要骑的比较久,十块钱以上我就不接了,对我来说性价比不高,更适合专业骑手,他们的设备,一脚油就到了
第一次配送的时候,找不到商家,明明定位就在那里,但是看不到店面,可以询问同为「骑手」职业的玩家,问过几次路,发现大家都很乐意帮忙,不要用“您好”,直接叫“大哥”,融入进去
配送过程最多三单在手,在时间的催促下,不时有闯红灯的冲动
晚上穿梭在车流人群中,感觉人从世界中抽离出来,对时间的感知不再明显,灯火、热闹也都跟自己没有任何关系,只有 “从哪里取,送哪里去” 的最简单又朴素的使命感
外卖送达时,成就感即时反馈
如果你在夏日下午四五点钟点开始送外卖,日光渐隐,热浪还在,辛苦了两个小时后,偶然接到一个林荫路的单,那一刻能体会到凉爽的风是对辛劳者最好的馈赠
游戏收获
对周边更加熟悉,地图 “战争迷雾” 不断在消散,发现商圈中不显眼的外卖档口,进到的城中村感受喧嚣,也送货到千万元别墅区体会宁静
然后,生活中减少了点外卖的次数,且更加慎重,没有实地去过的实体店外卖几乎不再买,宣称 “绝无预制菜” 的小商家不可能厨师现炒,大概率是提前分装好的菜品,小份菜摞成一摞,放在微波炉中加热,两分钟后伴随着“滴”声出餐
实付十来块的外卖,配送费三四元、扣除平台抽成,再扣除商家的房租水电燃气及人力成本,最后想要盈利,一定是在餐盒和食材上能省尽省,高油盐本就不健康,还可以用来掩盖掉食材不新鲜的味道
实体餐饮很难
想起前些天一个朋友弟弟来北京开店,主营山西肉夹馍和凉皮面食,在热门区域租了一个小门市,可以堂食,也接入了外卖,因为我们公司就在附近,就点了吃,肉夹馍里瘦肉多、汁水足,味道正宗
没想到在二十多天后,就听说不做了,了解得知房租每月几万块,我听着都顿感压力,这得卖多少单才能挣回来
美团外卖上显示订单 100+/月,饿了么 24 单,总应该不超过 200 单,按照线下线上 3:1 估计,月总 800 单,均价 25 元/单,毛利润八元算(已经是很高的估算),入账六千四,不算人力成本,房租月亏几万,怎么算都太亏
突然有个不成熟的想法,感觉做餐饮小本经营的个体户,可以跑一个季度的外卖,对于周边消费者的喜好、客单价,会有一个不同的看见,在选址上也会有更多的选择
游戏之外
外卖骑手可能是跟程序员很互补的职业,虽说大多时候在骑车,但是去往商家与送餐过程中,也会走路和小跑,不必排斥接到送货到七楼的单,不赶时间爬爬楼也是锻炼身体
称呼 “游戏”,并非因骑手是容易的,相反,这个职业被称为 “铁人三项”之一,是高强度的体力劳动,我是选择西山的太阳才敢出门,正午的太阳只想在家躺平,只是送外卖这个工作,具体到个人来说,是营生,还是生活的调味剂,心态自不相同
跑外卖想赚钱,真的需要靠着铁人的身体素质和意志,月入一两万的单王是极少数人,春夏秋冬高强度跑外卖,身体也容易落下病,只有体验过才知道辛苦
对于我来说,参与了体力劳动换取报酬,对于消费习惯会有影响,送了几单林里手打柠檬茶后,回家的路上也想要犒劳自己一杯,然后想到要跑一个多小时才能赚回来,就算了,到超市买了两个柠檬回家
闲暇时,我想我还会偶尔上号继续前行,感受并探索世界