爱因万江斯坦 用文字记录思想

2018年度北京积分落户数据分析

上午老妈通知我北京落户的公示名单出来了,我差了4分落选。但出于对数据的敏感,我顺手把数据扒了下来,分析一下下,看看是哪些人在跟我竞争,看看敌情,方知来年战势。

一共数据6019条,用shell脚本梳理了一下数据,这6000多人分布在3430家公司,我在这里列出前300:

华为一方独霸,高科技领军,央视、首钢这种大国企也有这么多没北京户口的呀。。。百度、联想人多基数大,民生银行的总部不是在上海吗,北京难道有个研发中心吗?总体来说前50家公司基本上是很熟悉的公司,也是相对比较稳定的。

嗯,新浪+微博:7人

网易:2人

腾讯:26人

搜狐:5人

搜狗:7人

小米:8人

微软:17人

用友:37人

亚马逊:8人

 

再来看看高考的前50名吧:最高分122.59,杨效丰,1972年,前辈高人,榜单里前900多名都在100分以上

汽车之家财报

汽车之家2017-2018Q2财报

2018.Q2:
1. 移动端APP’s DAU较17年Q2增长54%,达到1030W;
2. 数据驱动的PGC平台(车家号)作者增长25%,内容量增加150%;
3. 多样化内容,9个栏目:名人talk show, 路上的美食家,动态评车,喜剧汽车,晒媳妇,公路音乐,工厂之旅,试驾;
4. 战略投资天天拍车1亿美金;
5. 广告客户投放单价上升;
6. 单位经销商的leads营收增加,同时扩展了经销商客户基数;
7. 汽车金融与数据产品收入增长比例大;(Online marketplace and others 包括:新车、二手车商城,汽车金融、数据产品 )

 

世界杯预测算法

探索一个预测世界杯冠军队的算法

晚上俄罗斯世界杯就要开赛了,大家伙们又要开始预测比分了,我想了一个预测世界杯冠军队算法的数学模型,有兴趣的同学可以试试看,说不定能赢足彩大奖。

预测一场比赛的胜负,若不做任何数据收集和分析,那么我们猜测胜负的概率,跟抛硬币没有太大分别(差别就是小组赛有胜、负、平三种可能,只有淘汰赛才真正跟抛硬币只有正、反两种可能相似),所以我们需要通过球员、教练、裁判的历史大数据训练出一个概率模型。

假设世界杯某球队A,按规定有球员23名,主教练员1名,那么球队A的基础赢球概率为:

模型1:P(A)=W(A).(∑P’/23.).P”      (球队常数W(A)=32/世界排名,P’为单个球员赢球概率,P”为教练员赢球概率,均可从单个球员跟教练员的历史比赛数据中得出)

这个模型符合我们常见的大牌球星与大牌教练的组合胜率高于普通球队的认识,但是,这很不够精确。

因为上面的模型我们没有考虑的是每个球员比赛数据中对手的数据,假设两个球员a和b,各有50场比赛经历,经计算胜率均为0.55,但a参加的是西甲联赛,而b参加的是中超,很显然,这个人胜率没有意义了。所以,我们对上面的数学模型进行改造:

模型2:P(A)=W(A).(∑P’R’/23.).P”        (R’为单个 球员历史对手常数,由历史对手在各国家联赛/国家队中的排名所决定)
R’=  k log ∏R(a)   (R(a)为A球队单一球员a的一场历史比赛对手的当时得分,k为常数)

目前这一版的模型已经比第一版要精确一大点了。但是………….还不够精确。

通过大数我们可以发现一些好玩的事情:假如世界杯某小组的A,B,C,D四支球队,A对B高胜率,B对C高胜率,C对D高胜率,但D却对A有高胜率,按照逻辑传递性,矛盾出现了,若B队碰上D队,到底是高胜率,还是低胜率?哥德尔不完备定理似乎出现了。

出现这种情况的原因是,我们的数据模型还不够完备,所以只单纯分析队员,或是单纯的分析球队,或是简单的组合分析都不行,因为球队是个动态数据,球队出现的队员是每年甚至每场都在变化的,所以我们还需要更复杂的数学模式和更多的数据。

我们要具体到B,D两支同组球队的对比数据,而降低那些无用历史数据的权重。

具体方法是:找出所有B球队队员参与的比赛对手中包含了D队队员的比赛数据,进行建模。(这句话很重要,请再读一遍)

模型3:  P(B|D)=W(A).(∑P'(B|D)R'(D|B)/23).P”

P'(B|D)      是B队单一球员在有D队球员为对手的比赛中的胜率
R'(D|B) =k log ∏R(D|B)       R(D)是D队球员在以B队球员为队手的球队的所有比赛中的个人打分

目前这一个模型算是比较接近真实了,但是,还不够精准,我们一直忽略了P”这个主教练的胜率,还有裁判员F的执法偏好。。。还有,上场真正踢的是11个人,他们今天用的队型是不是各个队员胜率中覆盖的队形。。。

还有一种情况就是新晋的球队,或新队员比较多的球队,其对阵数据不足的时候,那可能就要回到第二个数据模型了。

好复杂,要不说足彩500W,不是那么好挣的,就瞎掰到这儿吧, 所以说,现实是复杂的,但至少世界杯是快乐的。

晚上看球了。

Tokyo

2017年世界人口最多的10个城市

2017年世界人口最多的10个城市/The 10 most populous cities in the world in 2017

排名 城市 所在国家 城市人口(不包括远郊区,单位:万)
1 东京 日本 3784.3
2 雅加达 印度尼西亚 3053.9
3 德里 印度 2570
4 上海 中国 2419.7
5 马尼拉 菲律宾 2412.3
6 首尔 韩国 2348
7 卡拉奇 巴基斯坦 2212.3
8 北京 中国 2172.9
9 墨西哥城 墨西哥合众国 2102
10 纽约 美国 2063
不是人人都是产品经理

不是人人都是产品经理

大概是从2010年起,业内流行一句话,叫“人人都是产品经理”,鼓舞了不少的有志之士投身到互联网产品经理这个行业中,到现在8年过去了,我以我的经验想告诉大家:不是人人都是产品经理。

有一次下班在公司电梯,到3层的时候上来一男一女,抱着笔记本电脑,显然是刚开完会,其中男的进电梯后就抱怨道:我是来做产品经理的,只想做产品,现在却让我做项目管理的活,我真不想干了。女的解释道,产品经理不是都干产品的活的,也会做项目管理的事情呀。但那男生似乎并不认同,仍说,我真不想干了。(我默黙地在心里点点头,立马判断出,那个女生才是真的产品经理。 )

我挺赞同那女生的观点的,反观那男生,我觉得他不是产品经理,他只是个产品专员,他没理解什么是产品经理。

什么是产品经理?我看到过的最好的定义是在《重新定义公司》(英文名是《How Google works》,由Google前CEO 埃里克·施密特和部分Google同事所著)这本书里的描述的:

在互联网时代,产品经理的任务是与设计、策划以及研发人员通力合作,共同打造高质量的产品。这样的模式要求产品经理通过涉足一些传统概念中的管理工作来影响产品生命周期、制定产品营销结构图、为消费者说话,并把这些理念传递给自己的团队和管理层。
创意精英式的产品经理还需要从技术入手,让产品质量更上一层楼,他们不仅要学会解读和分析数据,还要看懂科技潮流,预见这些潮流对他们所在行业带来的影响。

我后来也把这段话做为培训PPT的内容,给我的产品团队看,因为现在互联网圈的大多数自以为是产品经理的人,其实一直在干着产品专员的活。

我总结一下产品经理与产品专员的区别,如果有阅读这篇文章的人恰好在从事与产品有关的工作,你可以对照看看自己或身边的人,谁才是产品经理。

1,产品经理会主动跟进产品从设计、开发、上线、运营整个产品生命阶段,按流行的话说,是产品的CEO。

产品专员只会跟进其中一个或几个环节,不会主动推进产品的生命周期,需要靠外围的项目经理或领导来驱动。

2,产品经理会去主动了解技术实现的原理,跟技术团队一起优化产品。

产品专员则无意识要跟技术团队接触,只负责提需求,盲目追求功能,而忽略产品性能。

3,产品经理通常同时是一个好的项目经理,在各资源部门间沟通,把控产品的开发节奏,把需求变更合理化

产品专员只专注产品逻辑本身,不关心或不了解各配合部门的情况。

4,产品经理是用户的代言人,始终以用户视角思考问题,敢于提出不同的意见,做很多用户研究工作,包括案例收集,竞品分析。

产品专员有时是以个人喜好,或以领导的意志为工作方向,基本是一个工作任务的执行者,而不是挑战者。

5,产品经理更了解业务部门的工作,了解实际的需求,了解行业的发展。

产品专员对业务部门知之甚少,不会对需求做本质的分析。

6,产品经理是自己产品的深度用户。

产品专员只设计产品,但却很少真正使用。

有人说,马化腾是个好的产品经理,我不同意,他只是提些产品意见,或做一些产品逻辑解释,他的重要工作是做公司管理了,所以他现在只是个好的产品专员,因为产品经理这个工作真的不是一般人可以做的,太需要精力与专注。

已逝的乔布斯是好的产品经理,他把控了几乎所有苹果产品的细节、性能、发布,是个近似发狂的产品经理。

张小龙是好的产品经理,他对微信产品的方向、产品逻辑都参与决策,甚至包括打开画面的情怀表达。

雷军、周鸿祎这也是两个标准的产品经理。

到这里会发现真正好的产品经理似乎都是做技术出身的,是不是非技术人员就做不好产品经理了,这个话题我觉得值得再写一篇文章来讨论了,但我可以说一下我的观点:将来十年,好的产品经理必然是学人文类专业的人,现在看,做技术的人天然更善于把技术跟产品融合,那是因为互联网发展时间又短又快,早期低垂的果实必然是被有技术特点的人先摘得,但越往后,人文类专业的综合性优点就会越明显。

这个话题以后再说。

Privacy

互联网上无隐私?

最近Facebook泄露用户信息的事情,让大家有了更多的担心,事情是这样的:

一家名为剑桥分析(Cambridge Analytica)的公司,获取了5000万Facebook用户的个人信息(其实从报道来看,他们是通过正常渠道,利用Facebook自身的系统不完善,甚至都不是漏洞,而获取了这5000万用户信息,所以算是合法获取的)。 对这些用户进行大数据分析,分析他们的喜好,偏向,政治倾向。然后通过facebook的广告系统精准投放他们喜好的新闻和广告,潜移默化的用他们想看到的新闻给他们洗脑,最终影响他们最后的投票,从而影响整个选举… 而这个公司,跟川普的前幕僚班农又有着无比的联系…..,据说这个公司还有俄罗斯背景。

一个大片应有的元素都有了,高科技、民主政治、总结选举、大国博弈…  估计五年后就有美国大片拍出来了,

不过我在想一个问题,在互联网上,我们如何看待我们的隐私?有人肯定会说,那当然是要绝对保护隐私呀,个人隐私神圣不肯侵犯。

互联网真正从发展到普及才不到20年,技术带来便利的同时,也带来了很多问题。所有的问题,都源自“信息”。
我们访问互联网,看新闻、看视频、聊天、发微博、点赞、购物,我们每一个网络行为都是在进行信息交换,你的所有足迹都伴随着你的个人标识,可能是IP地址,也可能是设备ID,也可能只是原始的Cookie,也可能是你的手机号等,都会在这些网络行为中留下日志(log),凡点击(滑动)过的,必有痕迹。
在有的人看来,这是大量的垃圾日志,但在有的人看来,这就是稀缺的信息,通过这些信息,可以完整的塑造出你真实的性格、性别、年龄、种族和各种偏好。如果网络背后有一个老大哥,那他看我们每个人都是赤裸着的。
一旦这些信息被某人掌握,该信息就成了权力之源并能对他人发挥影响力。

按《未来简史》和目前众多科学研究的说法,我们人,更像是一台计算机,我们的思想和行为是受深层次的算法控制,我们只是比物理计算机多了意识,但并不妨碍我们遵循着一定规则来做决断。
所以一旦有更强大的组织或个人,知道了我们底层数据,推算出我们的行为规则,从而对我们施加影响力,我们就会做出一些我们认为是我们自己的决定,而其实是被引导了而做出的决定,想想京东、淘宝不时出现的各种推荐广告吧,那就是简化的影响力,只是简单的影响我们的购买决策,还可接受,若真的用来指导我们的世界观和人生观,那就是一件极其恐怖的事情了。

目前,这个权力掌握在大的互联网巨头手里,你怎么知道他真的就 Don’t be evil 呢?比如Facebook.

汽车之家vs易车

汽车之家与易车的2017年度财报对比

做为中国市场上唯一的两家汽车垂直互联网上市公司,其业务模式看似一样,都是为用户提供汽车资讯和购买决策服务,其实各自的发展路径是各走各路,招式都各成体系。

2017年度,汽车之家营收62亿,其中媒体业务收入30.8亿,销售线索收入26亿,在线售车业务5.1亿(但该业务已经逐步放弃,从营收占比也可看出),利息收入2.2亿,其他收入0.85亿。

支出情况,营收成本13.58亿;运营成本28亿(其中市场营销16.47亿,管理费用2.82亿,产品研发支出8.78亿:包括4960万的股权激励支出),所得税费用2.76亿,投资权益支出1亿。

净利20亿,其下员工4097人。

2017年度,易车营收87.5亿,其中广告与订阅业务39.2亿,交易服务收入38.7亿,解决方案收入9.56亿,利息收入0.3亿,其他收入0.93亿。

支出情况,营收成本32.3亿,销售、管理费用60.6亿,产品开发费用5.65亿,股权支出11.9亿(个人理解这个应该包括在管理费用和产品开发费用里,否则这数整体上对不上),所得税费用 2亿,利息支出0.926亿,股权投资支出0.7亿,投资损失0.75亿。

净亏损14.3亿,其下员工8558人.

从对比可以看出,汽车之家更加的轻量化,并有着惊人的利润率,并战略性的放弃利润率低的售车业务。而易车则显得臃肿,拥有两倍于之家的员工数,拥有超过之家营收的25亿,却支出了近100亿的成本,而之家的成本则不到40亿。

原因是:一,易车的业务模式较汽车之家更烧钱,渠道购买,再加售车业务模式目前还太重,导致成本下不来。二,汽车之家的产品优势更明显,从产品投入的对比也看出,汽车之家更注重产品的投入,而易车之则更侧重于营销的投入。终究还是双方的模式不同,产品、市场投入就各不相同了。期待看到易车2018年的变化,毕竟汽车垂直市场没有什么创新很久了。

随便提一下汽车之家的的移动端DAU,他们似乎不愿在财报里透露,只写了增长率,但我翻了一下汽车之家2016年的财报,找到了在2016年的Q3财报里提及的当时的DAU,我再根据他们各Q财报里提及的增长率,计算结果如下:2017年Q3,汽车之家移动端的DAU是970万,2017年Q4应该是1000万,是不是很恐怖。

霍金与李嘉诚

霍金与李嘉诚

本周有两条新闻:3月14日,物理学家霍金逝世,享年76岁。

3月16日,全球华人商界领袖李嘉诚宣布退休,今年将满90岁。

把这两件事放在一起,不是要比较他们的年龄,而是刚好这周他们都接受了命运。

一位是身残志坚的物理学家,研究的是宇宙的起源与未来,一位是从穷苦底层打拼起来的商界大佬,建立了庞大的商业帝国,这两位老人似乎是处于两个平行宇宙的人物,但他们其实是相似的,他们本身是一个传奇,留给我们的是符号和意义。

霍金的名望更大于他对物理学研究的贡献,他并没有突破爱因斯坦的相对论,但霍老爷子把相对论的应用推向了一个高度,是有真才实学,他把大家对物理学的关注,把人们对宇宙和自身的理解都提升了一个层次。霍金是本世纪物理学的一个符号,他刺激了更多的人关注和投入到物理学,包括对我的影响。

所有商人该具有的特点,李嘉诚都有,因为商人逐利。李老爷子身上又有很强的中国人的传统,立功、立德都有,但唯独没有立言,但凡成功的中国商人皆是如此,所以我们很少听到李嘉诚说过什么。人一旦太有名,就会有多太多所谓的**哲学,**经营之道,聪明的人就不要理会这些了。性格与运气才是李老爷子成功的秘诀,这是外人无法学的。李老爷子早已也是中国商界的一个符号,激励着很多投入商界的志士。

能成为符号的人,都是了不起的人。