什么是博弈论求解的优化算法中的剪刀效应?求详解

来自子话题:
每个消费者要是都有这自觉,蒋三锤的年终奖就得打折扣了。&br&&br&蒋三锤?&br&谁是蒋三锤?&br&&br&蒋三锤是萌萌哒牛奶的么么嗒大区的市场部总监。&br&&br&布莱麦超市货架上7月中旬的萌萌哒品牌S系列的牛奶总压库存,眼看着划定的冰柜分区就快摆不下了。负责的分区经理蒋三锤面对该种情形,一个月大姨妈来四回,每回来五天,周末和她一起双休,同甘共苦,风雨同舟。&br&&br&更糟糕的是,么么嗒大区的消费者都很实诚,只挑最新鲜的买,从不买快过期的牛奶,压得库存越积越多,市场部最近都快喝醉了。&br&&br&眼看九月考评将至,三锤觉得问题有些严重,于是召集了市场部的黄四钉,毛五铁在茶水间开了个小会。&br&自从上月区域业绩不佳开始,茶水间的冰箱就再也不放除S系列牛奶以外的任何饮料。&br&四铁嘬着吸管看了眼保质期,已经过去三天了,他骂了句粗口后陷入了沉思。&br&会后决策如下。&br&为了解决库存,先搞区域促销,在某超市酸奶买一送一,买二送乐扣,买三送大保健,买四送南极双人自助游…… &br&&br&一个礼拜后,库存终于解决了不少,可是产量不变的情况下,每天还是有不少积压。&br&于是市场部又开了个小会,分析时令和不同地段超市间供应的数量是否合理。讨论如果不合理,又该如何调整? &br&&br&又是一个礼拜,萌萌哒牛奶在某超市的囤货现象稍有好转,但仍旧没有达到理想的产销匹配度。&br&于是蒋三锤在一个没有大姨妈的周末又把四钉和五铁叫了出来。他们找了个路边摊,一边吃着麻辣小龙虾,一边喝着扎啤。&br&四钉当时正在剃虾屎,他撕到一半突然顿住,拍案叫到&br&“我知道了,原来是挤太多了!”&br&五铁看着他手里的黑条,问&br&“屎吗?&&br&“奶啊!”&br&&br&蒋三锤在角落里默默听着,若有所思,她带着塑料手套拍拍四钉的肩膀,会心一笑,说&br&“四钉说的对,看来是产能过剩。这时候就要看现有市场是否已经饱和,饱和了的话,就要外扩,把多挤的奶想办法卖到外市去。这样就要赶紧联系配送合作和货柜合同。&br&没饱和,市场和销售部门就要开始忙起来了。反映到上层,想想该找李敏镐代言呢?还是搞变形金刚5的软植入呢?你们手底下断粮大半年的软文写手也该喂喂了。知乎牛奶板块要炒热,微博热门话题加个颜射板块,朋友圈里也要买个公共号集中转发“喝牛奶的五大误区”……”&br&&br&三锤和上层反应了滞销的情况,其他几个分区也出现了相同问题.&br&总部看苗头不对,想这条产品线估计没什么搞头了,于是出了个sm大pk的营销策略,S系列与M系列通过消费者投票决定生死存亡。&br&&br&总部的销售部门经验丰富,比起四钉和五铁,段位高了不知道多少。&br&当三锤那天打开电视,看见甩着皮鞭的李奥纳多和捆绑诱惑的强尼德普分别S奶和M奶互喷,bgm放着雨中人的时候,一口椒盐牛奶喷了布莱麦超市的采购一脸。&br&&br&咦?&br&椒盐牛奶?&br&&br&对了,这其实是萌萌哒开发的新系列,叫做萌萌哒美味中国八大菜系调味牛奶系列。&br&目前还处于试卖阶段,只出了椒盐排条,宫保鸡丁,小鸡炖蘑菇和重庆火锅四个口味。今天三锤就是在和布莱麦的市场和采购谈新产品的推广问题。&br&这一系列其实是sm大pk万一失败的保底计划。研发部的总监伍佰半非常看好这一系列,内部试喝的反响也很不错。&br&&br&布赖麦的采购舔了舔左嘴角的牛奶,突然世界都亮了。&br&他尝出了葱的芬芳,椒盐的咸香,猪肉的油嫩和牛奶的醇厚。&br&简直太好喝了!&br&他们当即同萌萌哒拍板订货。&br&&br&三锤有些纳闷了,这个世界怎么了?&br&&br&九月考评时正好是sm激战最酣的时刻,八大菜系系列加了红烧肉和兰州拉面口味以后简直供不应求。网上出现各种晒喝奶照的活动,萌萌哒俨然成了九月最热关键词…&br&&br&三锤这一年的年终奖是去年的两倍。&br&&br&&br&其实消费者顺从本心选择,顺从利己的消费观,才能帮助厂商真正发现问题的所在。只要有足够的反应能力和行动力,坏事未必就变不成好事。&br&&br&&br&&br&&br&我也不懂牛奶这一行,也不懂营销和零售,大家别当真,这只是霸道总监蒋三锤的成功学日记,小朋友不要学哦。
每个消费者要是都有这自觉,蒋三锤的年终奖就得打折扣了。蒋三锤?谁是蒋三锤?蒋三锤是萌萌哒牛奶的么么嗒大区的市场部总监。布莱麦超市货架上7月中旬的萌萌哒品牌S系列的牛奶总压库存,眼看着划定的冰柜分区就快摆不下了。负责的分区经理蒋三锤面对该种情…
GSP 是Generalized second-price auction (广义二价拍卖)的简称,VCG 是 Vickrey-Clark-Groves 机制的简称。&br&&br&先简单谈一下Google 采用GSP 拍卖搜索关键词的历史。较早的搜索广告拍卖设计是雅虎的Overture 设计,采用广义一级价格拍卖:如果有K 个广告位,那么竞价最高的K 个商家每人赢得一个,并且支付竞标的价格。一级价格拍卖最大的问题是策略选择很不稳定,商家会频繁地修正出价。如果最高出价者出价2块,次高为1.5块,那么最高者就有激励把出价将到1.51,仍然赢得最好的广告位同时省下0.49。可是这同时次高者或许正为了拿到最好的广告位将出价往上修正。&br&&br&Google 使用GSP 主要就是为了避免广义一价拍卖中不断参考相邻出价进行的策略修正。在GSP 下,每个赢家只需要支付次高出价的金额,从而没有激励把出价修正到次高出价。&br&&br&而多物品拍卖中的VCG 机制中,每个赢家支付的是他给其他人带来的负外部性,即他由不参与变为参与带给其他商家利益的损失。由于广告位本身的异质性和商家对广告位的估值的不同,这种损失的计算并不简单。&br&&br&由上,Google 使用GSP 而不是VCG 的原因可能包括:&br&1. &b&历史问题。&/b&开始的设计使用了GSP,如果现在用VCG 替代,评估好坏不是太容易的事情。&br&2. &b&复杂度。&/b&VCG 的优点主要在于参与人投标真实估值是弱占优策略,但是最直接的缺点是在多物品拍卖中理解起来远不如GSP 简单。&br&3. &b&利润考虑。&/b&从基本模型的理论分析角度,GSP 在特定均衡中带给Google 的利润并不比VCG 的差(参考[2])。&br&&br&最后,在上面的例子里,每个参与人只需要一个物品(广告位)。在更一般的多物品拍卖中,例如spectrum auction,参与人的需求可能是多个物品的组合,那时候由于物品之间可能存在的互补性使用VCG 机制会出现各种各样更严重的问题(参考[1])。&br&&br&&br&&b&References:&/b&&br&1. Ausubel and Milgrom (2006), &&a class=& wrap external& href=&http://www.stanford.edu/~milgrom/publishedarticles/Lovely%20but%20Lonely%20Vickrey%20Auction-072404a.pdf& target=&_blank& rel=&nofollow noreferrer&&The Lovely but Lonely Vickrey Auction&i class=&icon-external&&&/i&&/a&&, Combinatorial Auctions, MIT Press.&br&2. Edelman, Ostrovsky, Schwarz (2007), &&a class=& wrap external& href=&http://faculty-gsb.stanford.edu/ostrovsky/papers/gsp.pdf& target=&_blank& rel=&nofollow noreferrer&&Internet Advertising and the Generalized Second-Price Auction: Selling Billions of Dollars Worth of Keywords&i class=&icon-external&&&/i&&/a&&. American Economic Review 97(1), 242-259
GSP 是Generalized second-price auction (广义二价拍卖)的简称,VCG 是 Vickrey-Clark-Groves 机制的简称。先简单谈一下Google 采用GSP 拍卖搜索关键词的历史。较早的搜索广告拍卖设计是雅虎的Overture 设计,采用广义一级价格拍卖:如果有K 个广告位,…
当时没有导弹,需要战略轰炸机投弹,损失率较高,不是他想扔多远就能扔多远的。被战斗机拦截后偷鸡不成蚀把米,蛋蛋被捡回来研究咋办。米国主要是想用战术核弹,用炮射的,几万吨当量,把上甘岭整体炸塌方那种。即使这样,此先例一开,毛子在欧洲也可以理直气壮地用。米国政治家高瞻远瞩,岂容麦克阿瑟这个军痞胡闹,滚回家养老去吧丢人现眼的玩意儿。&br&&br&更多是傲娇,打肿了脸说“杀,杀了你哦。”&br&&br&真正被核平的可能性来自毛子,还好米国传了消息,智商90以上是不会用核弹的。毛子军虎的大脑整体浸泡在75度伏特加,已经不能用常理来推断。这回租吸真的怕了,深挖洞,大搬迁,随时准备细软跑。同时把城市初中以上知识分子疏散到每一个村,保留知识的种子。被毛子逼得走投无路,但又不敢过度反抗,只好暴打毛子的小弟阿三,向米国传递信号:我们真的和毛子不是一路,快和我交往吧!后来又暴打毛子的小弟阿二,天米正式领证。&br&&br&&img src=&/2cf61b73ed81a7e521fe55bd8ce15459_b.jpg& data-rawwidth=&316& data-rawheight=&412& class=&content_image& width=&316&&
当时没有导弹,需要战略轰炸机投弹,损失率较高,不是他想扔多远就能扔多远的。被战斗机拦截后偷鸡不成蚀把米,蛋蛋被捡回来研究咋办。米国主要是想用战术核弹,用炮射的,几万吨当量,把上甘岭整体炸塌方那种。即使这样,此先例一开,毛子在欧洲也可以理直…
你母亲买彩票不是为了钱,是为了那种”期望能发财“的快感。说白了,就是花钱买快乐。&br&而快乐这种东西,有人花3块钱换一个甜筒买来,有人花6000元换游戏装备买来,有人花几个亿换私人飞机买来。你妈妈花2元钱买来,已经很划算了。如果不是危及到家庭财产稳定的话,没有劝阻的必要。
你母亲买彩票不是为了钱,是为了那种”期望能发财“的快感。说白了,就是花钱买快乐。而快乐这种东西,有人花3块钱换一个甜筒买来,有人花6000元换游戏装备买来,有人花几个亿换私人飞机买来。你妈妈花2元钱买来,已经很划算了。如果不是危及到家庭财产稳定…
《权力的游戏》第三季中,丹妮莉斯假装听不懂Valyrian语。&br&奴隶主多次对她说出了 粗鄙 之语,比如:&br&&img src=&/4a625cee89_b.png& data-rawwidth=&898& data-rawheight=&616& class=&origin_image zh-lightbox-thumb& width=&898& data-original=&/4a625cee89_r.png&&然而龙妈得到无垢者后说了一句 Valyrian语,奴隶主当时就蒙逼了:&br&&img src=&/5d6d13e937ffe249ca0dda0ca7da4b08_b.png& data-rawwidth=&898& data-rawheight=&616& class=&origin_image zh-lightbox-thumb& width=&898& data-original=&/5d6d13e937ffe249ca0dda0ca7da4b08_r.png&&真相是:&br&&img src=&/122da4f25ec847f39557_b.png& data-rawwidth=&898& data-rawheight=&616& class=&origin_image zh-lightbox-thumb& width=&898& data-original=&/122da4f25ec847f39557_r.png&&于是,奴隶主就被烧死了:&br&&img src=&/2dfca0f98f598c60c8650e8add9b2855_b.png& data-rawwidth=&898& data-rawheight=&616& class=&origin_image zh-lightbox-thumb& width=&898& data-original=&/2dfca0f98f598c60c8650e8add9b2855_r.png&&
《权力的游戏》第三季中,丹妮莉斯假装听不懂Valyrian语。奴隶主多次对她说出了 粗鄙 之语,比如:然而龙妈得到无垢者后说了一句 Valyrian语,奴隶主当时就蒙逼了:真相是:于是,奴隶主就被烧死了:
这是同一个算法。事实上deferred acceptance algorithm, 在1962年被Gale and Shapley从理论上提出的时候,论文的标题就叫&College Admissions and the Stability of Marriage&. 由于婚姻匹配问题是简单的一对一匹配问题,之后对deferred acceptance algorithm的许多研究就以婚姻匹配为背景。比如高德纳于1976年用法文写了一本书叫Mariages Stables, 总结了截至当时的结果。&br&&br&2003年改革前,纽约公立高中招生采用的是这样一种机制:每个申请者填写自己最想进的五所高中作为第一至第五志愿,他们的志愿列表会发给学校,学校决定接收、拒绝还是放进waiting list. 这个过程重复三次,三轮过后仍未被录取的学生接受统一分配,这时候就不看志愿了,基本只看离家远近。学校决定是否招收某个学生时,不仅要看学校对学生的偏好,也看学生把学校列在第几志愿。学校更喜欢招收把它列为第一志愿的学生。&br&&br&这篇文章(&a href=&http://economics.mit.edu/files/3962& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&economics.mit.edu/files&/span&&span class=&invisible&&/3962&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&)的附录AII(从pdf的19页开始)描述了改革后的招生机制。总体来说,它的核心就是一个简单的由学生propose的deferred acceptance algorithm, 运作与&a href=&/question/& class=&internal&&恋爱中有哪些博弈? - 恋爱心理&/a& 中给的相同。大体上说,DA算法的核心步骤如下:&br&&br&第一步:每个学生向他最想去的学校申请。每个学校暂时接收所有申请者,学校最想要的那些学生,直至用完招生名额。并拒绝没有被暂时接收的申请者;&br&&br&第k(k&=2)步 :前一步被某一所学校拒绝的学生申请去所有尚没有拒绝他的学校中,他最想去的那一所。每一所学校将这一步的申请者与以前暂时接收的学生放在一起,从中挑出最想要的学生,直至用完招生名额。并将其余学生拒绝;&br&&br&算法停止于再没有学生被拒绝。&br&&br&&br&要讨论改革后的机制相对于原有机制有哪些优点,就要讨论这样一个two-sided matching问题里面,评判机制好坏的几个标准。&br&&br&1. 稳定性(stability):稳定性要求,算法跑完之后得到的配置满足个人理性(individual rationality, 举例来说,男生得到的女朋友不能让他觉得 “还是单身好啊”),同时满足不存在blocking pair(举例来说,不存在两对couple中的一男一女想见异思迁组成新家庭)。&br&纽约公立高中的招生旧机制是不稳定的。表现为有些学校不喜欢这个机制派给它的学生,所以宁可回避掉这个机制。比如说,一个高中校长说,假设学校有100个招生名额,它宁可告诉当局他只要40个,等跑完三轮志愿填报后再通过其他程序招完余下名额。而对于deferred acceptance algorithm就比较简单了,理论证明这个算法必定生成稳定匹配。&br&&br&2. 学生的福利(student welfare):
Gale & Shapley(1962)证明了一个非常有意思的结果:假设所有男女的偏好是严格的(不存在无差异的情形),由男生表白的deferred acceptance algorithm所生成的配置结果是在所有稳定匹配中,&b&对于所有男生都最好&/b&的匹配;这个匹配同时也是在所有稳定匹配中,&b&对于所有女生都最差&/b&的匹配。(这里的“最好”和“最坏”都是指双方申报的偏好而言。如果申报的偏好与真实的偏好不同,那么产生的匹配有可能不是对于真实偏好最好或最坏的结果。)&br&招生匹配中,机制设计者的目的是找出对于学生来说最好的稳定匹配。公立学校的偏好一般是被政府抑制的,波士顿机制更甚,学校对于学生本身没有偏好差异,只有政府外生给定的一些排序。比如说家离学校近的排在家离学校远的前面,有兄弟姐妹在校的排在没有兄弟姐妹在校的前面,等等。纽约学校对学生本身有偏好,也存在学业水平考试,政府同样在新机制中压抑了学校偏好的表达,比如说将学生学业成绩粗略地分级排序。总而言之,此类机制的设计目的一般是最大化学生的福利,也就是说,挑选出对于学生来说最优(往往就是对于学校来说最差)的稳定匹配。&br&原有的机制在学生福利方面做得不够好。有很大比例的学生最后是被分配到自己根本没有填报过志愿的学校去的。在改革后,被分配到未曾表达过志愿的学校的学生数量下降了90%(&a href=&http://www.nobelprize.org/nobel_prizes/economic-sciences/laureates/2012/popular-economicsciences2012.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&nobelprize.org/nobel_pr&/span&&span class=&invisible&&izes/economic-sciences/laureates/2012/popular-economicsciences2012.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& 第4页)。&br&&br&3. 学生说真话(students' strategy proofness) : 要求学生真实地表达自己的偏好是他们的占优策略(dominant strategy)。旧机制下是不可能的,原因很简单,既然学校招生看志愿次序,学生就不敢把自己最喜欢,但希望渺茫的学校填在前面。而在新机制下,学生是会说真话的。原因不难理解:students proposing deferred acceptance algorithm产生的是对于所有学生来说,对于他们申报的偏好而言最好的稳定匹配,那么当然申报真实的偏好最好。注意学生说真话不代表学校有说真话的动机,事实上有证明说不存在所有方面都说真话的稳定匹配。但由于学校的偏好表达被政府规制,学校说假话的机会也不太多。
这是同一个算法。事实上deferred acceptance algorithm, 在1962年被Gale and Shapley从理论上提出的时候,论文的标题就叫"College Admissions and the Stability of Marriage". 由于婚姻匹配问题是简单的一对一匹配问题,之后对deferred acceptance algorit…
经济学是一门研究理性人假设下资源如何配置的学科。那么我们在对经济现象建模的时候要回答以下几个问题:&br&1.涉及哪些参与者&br&2.他们可选的方案有哪些&br&3.给定理性人的假设,他们会如何决策,结果如何&br&4.他们的福利如何。&br&&br&所有这些问题正好可以用博弈论来建模,比如&br&1.经济现象所涉及的人正好对应于博弈论中的players&br&2.可行方案对应于strategies&br&3.如何选择和结果如何正好对应于各种解概念(solution concepts),比如大家熟悉的纳什均衡。博弈论最重要的其实就是各种各样的解概念。为何我们要提出这么多解概念呢,因为在许多情况下人们的决策往往依赖于他人的决策,而不是中级微观里解个约束条件最优化那么简单。&br&4.福利正好对应于payoff&br&&br&具体来说的话微观经济领域几乎每个分支都要应用博弈论的知识(宏观我不太了解,但前沿的动态契约理论也会用到)。微观大致有那么几个分支吧&br&1.产业组织(IO):最基本的古诺模型,就用到了Nash Equilibrium。Stakelberg 模型用到了Subgame perfect equilibrium。&br&2.信息经济学:Spence教育模型就是一个不完全信息动态博弈,用的解概念是perfect Bayesian equilibrium。&br&3.拍卖:一级密封拍卖的均衡就是个Bayesian equilibrium。&br&4.匹配理论:这类模型的建模基本是不同于以上,用的是合作博弈里的解概念,比如说Core,stable matching。&br&&br&暂时就回答那么多了吧,具体的还得看书。推荐一本《A course in game theory》。(这本太难的话可以看看MWG的part3。基本都是博弈论在经济学里的应用)。
经济学是一门研究理性人假设下资源如何配置的学科。那么我们在对经济现象建模的时候要回答以下几个问题:1.涉及哪些参与者2.他们可选的方案有哪些3.给定理性人的假设,他们会如何决策,结果如何4.他们的福利如何。所有这些问题正好可以用博弈论来建模,比如…
来自子话题:
纳什均衡是这样的一种状态:在博弈中如果玩家A选择了X选项,那么玩家B为了使自己的利益最大话选择了Y选项;相反如果玩家B选择了Y选项,这种情况下X对于玩家A来说也是利益最大话的唯一选项。&br&&br&例子如:A,B两个理性的玩家博弈,规则是两个人各自选择从1到9的任意一个整数,如果两个人选的数字之和不大于10,则A、B玩家各自获得所选数目的奖金,反之双方一分钱也拿不到。&br&&br&在这个例子里面,如果A选择“4”,B为了是利益最大化会选“6”,记为(4,6);相反,如果B选择的是“6”,A为了利益最大化就只能选“4”,因此(4,6)就是一个纳什均衡点。&br&相应地,(1,9)、(2,8)、(3,7)、(5,5)、(6,4)、(7,3)、(8,2)、(9,1)也都是纳什均衡点。&br&&br&但是哪一个纳什均衡是最容易出现的呢?这个答案取决于这个游戏是静态(Static gaming)的还是动态(dynamic gaming)的,彼此知不知道对方的选择。&br&&br&如果游戏是静态的(就像猜拳,彼此同时选择,而且对方不知道彼此的选择),出现哪个结果则取决于A,B双方更愿意相信对方会选择多少。&br&&br&如果是动态的,又分几种情况,信息透明,和信息不透明,和信息不对称。&br&1,如果信息透明,也就是像下象棋一样,A先选,B知道A选择之后再选择,这种情况下,一定是(9,1);&br&2,如果信息不透明,就是A选好了,写下来后放在信封里,然后B做选择,这种情形等同于静态博弈。&br&3,如果信息不对称,就比较复杂了,涉及到有没有bluffing,有没有欺骗等等,所以结果很有可能达不到纳什均衡点。
纳什均衡是这样的一种状态:在博弈中如果玩家A选择了X选项,那么玩家B为了使自己的利益最大话选择了Y选项;相反如果玩家B选择了Y选项,这种情况下X对于玩家A来说也是利益最大话的唯一选项。例子如:A,B两个理性的玩家博弈,规则是两个人各自选择从1到9的任…
这是一个&b&目的和方法匹配的问题&/b&。&br&&br&鸟的&b&目的&/b&是和别的鸟竞争,抢虫子吃。&b&方法&/b&就是早起,抢在别的鸟吃前出发。&br&&br&而虫子的目的是&b&躲避&/b&鸟的攻击,所以早起这个方法是&b&错误&/b&的。&br&&br&所以当你论述 &b&&u&早起的鸟儿有虫吃&/u&&/b& 重点在于提出方法。&br&而他反驳的点在于你提出&b&&u&方法并不具有普适性&/u&&/b&。&br&&br&他的论据本身没错,只是在误导论点。&br&&br&所以如果你要反驳,你需要指出他的论据和你提出的论点不匹配。&br&&br&也就说, 「早起的虫儿被鸟吃」 &u&&b&可以证明&/b&&/u& 早起不是万能的, &u&&b&但是无法证明&/b&&/u&,早起不能使鸟吃不到虫子。
这是一个目的和方法匹配的问题。鸟的目的是和别的鸟竞争,抢虫子吃。方法就是早起,抢在别的鸟吃前出发。而虫子的目的是躲避鸟的攻击,所以早起这个方法是错误的。所以当你论述 早起的鸟儿有虫吃 重点在于提出方法。而他反驳的点在于你提出方法并不具有普适性…
从方法论上讲,经济学在过去一个世纪中越来越趋于科学化。科学化是指,一方面有一套自洽的、基于演绎推理的理论体系;另一方面能够用经验数据检验理论体系的各种推论。到目前为止,经济学的科学化程度在社会科学中是最高的。&br&&br&而从研究对象上讲,经济学在过去半个世纪中研究领域不断扩张,把许多传统上属于社会学,政治学,心理学,历史学等的问题纳入自己的研究范围,并且取得了巨大成功。这就是所谓的“经济学帝国主义”。(題主所说的“经济学越来越趋于社会学化”,应该也是这个意思。但这种说法其实不对,理由见后。)&br&&br&以上两种趋势同时存在,并不矛盾,但不是同一层次上的。方法论与研究范围相比,前者对于一个学科而言更为根本。題主所说的“经济学思维”,是蕴含在经济学的科学方法之中的。那些费解的数学模型,实质上是把纷繁复杂的社会现象简化成几个变量,再来根据逻辑研究它们之间的关系。这种方法,也就是思维方式,是其他社会科学的分支所不具备的。之所以必须要用数学,是为了避免文字的模糊性,保证逻辑推演的正确性。&br&&br&所以,在正规文献中没有“经济学社会学化”的说法,因为这不是事实。只有“经济学帝国主义”,经济学用它的思维方式去思考和研究传统上其他学科的研究对象,这其实是社会科学的经济学化。&br&&br&经济学初学者最容易被数学弄晕,其实无论多复杂的数学模型,其经济学思想都是十分简单的,最重要的是,都是遵循逻辑的。在弄懂数学的基础上,要花些功夫想清楚背后的经济学故事。&br&&br&掌握了经济学的逻辑,也就具备了经济学的基本素养。然后再去分析人类社会中的各种问题,会有一种“人挡杀人,佛挡杀佛”的感觉。
从方法论上讲,经济学在过去一个世纪中越来越趋于科学化。科学化是指,一方面有一套自洽的、基于演绎推理的理论体系;另一方面能够用经验数据检验理论体系的各种推论。到目前为止,经济学的科学化程度在社会科学中是最高的。而从研究对象上讲,经济学在过去…
这是能够实现的,参与人数可以扩展到n个人。我的解法需要以下假设:&br&&ol&&li&每个人的功劳是可以量化并且向所有成员公开的,即功劳能达成共识。定义第i个人所占总功劳的百分比为&img src=&///equation?tex=a_i& alt=&a_i& eeimg=&1&&。&br&&/li&&li&分割目标是公平分割,即对于n中的任意第i个人,他眼中的蛋糕总价值是&img src=&///equation?tex=V_i& alt=&V_i& eeimg=&1&&,则他最后分得的蛋糕价值不少于&img src=&///equation?tex=a_iV_i& alt=&a_iV_i& eeimg=&1&&&br&&/li&&li&所有的&img src=&///equation?tex=a_i& alt=&a_i& eeimg=&1&&都是有理数。&/li&&/ol&这是典型的公平分割问题,具体的实践方法可以参考&a href=&/question/& class=&internal&&三个极度自私的人分一个蛋糕,采用什么策略,能让三人都觉得公平?&/a&。这种方式的可靠性已经证明。接下来我会将其拓展到带权重情形。&br&&br&&blockquote&一般的,对于m个人,公平程序如下:&br&&ol&&li&每个人排好顺序&/li&&li&第一个人切出他认为的 1/m。&/li&&li&按顺序,每个人都判断一下,这一份是不是太大。是的话就削掉一点并进原来的蛋糕,不是的话跳过。&/li&&li&所有人都判断过后,这一块给最后削过蛋糕的那位;如果没有人削过蛋糕,这块给第一个人。&/li&&li&重复 2-4,直至最后剩两人,用我切你选的方式决定。&/li&&/ol&&/blockquote&注意,在这种情形下,每个人分得的蛋糕不少于它眼中蛋糕总价值的1/m,m为总人数。&br&&br&知道了一般情形之后怎么办呢?这时&img src=&///equation?tex=a_i& alt=&a_i& eeimg=&1&&是有理数就派上用场了。对所有的i属于n,把&img src=&///equation?tex=a_i& alt=&a_i& eeimg=&1&&进行通分,使得&br&&img src=&///equation?tex=a_i%3D%5Cfrac%7Bb_i%7D%7BD%7D& alt=&a_i=\frac{b_i}{D}& eeimg=&1&&&br&其中&img src=&///equation?tex=b_i& alt=&b_i& eeimg=&1&&和&img src=&///equation?tex=D& alt=&D& eeimg=&1&&都是整数,这样问题就退化成了D个人的公平分割问题。原题目n个人中的第i个人占有D人公平分割问题中的&img src=&///equation?tex=b_i& alt=&b_i& eeimg=&1&&个席位。&br&&br&这样即可保证即对于n中的任意第i个人,他眼中的蛋糕总价值是&img src=&///equation?tex=V_i& alt=&V_i& eeimg=&1&&,则他最后分得的蛋糕价值不少于&img src=&///equation?tex=a_iV_i& alt=&a_iV_i& eeimg=&1&&。n=5就是题主问的问题。&br&&br&难得写个短答案……
这是能够实现的,参与人数可以扩展到n个人。我的解法需要以下假设:每个人的功劳是可以量化并且向所有成员公开的,即功劳能达成共识。定义第i个人所占总功劳的百分比为a_i。分割目标是公平分割,即对于n中的任意第i个人,他眼中的蛋糕总价值是V_i,则他最后…
&p&谢邀,我尽量避免字多起来。&/p&&br&&p&这算是产业组织的部分,涉及到不同厂商的博弈。&/p&&br&&br&&p&&b& - 霍特林模型&/b&是说对方只要一移动,就会占有更多你的市场。&/p&&p&在它的拓展中,加入了包括&b&多方&/b&、合谋、地理位置非直线、产品差异等形成了&b&空间区位竞争理论&/b&体系,更加完善,目的是为了解释产业聚集的状态。但这不是我要讲的。&/p&&br&&br&&p& - 什么样的产业*会聚集:&/p&&br&&p&组成CBD的商家中,不同产业的企业考量不同。&br&&/p&&br&&p&由&a href=&http://en.wikipedia.org/wiki/Central_place_theory& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&中心地理论(Central place theory)&i class=&icon-external&&&/i&&/a&得知,对于高等级商品(higher ordered goods)来说,包括展馆、剧院等,人们愿意远道前往,所以有必要聚集。&/p&&br&&br&&p&而咖啡厅快餐店类的聚集与霍特林原模型(原文为沙滩上的冰淇淋车)类似,以占领本地市场为主要考虑。&/p&&br&&p&&i&* 补充一句,聚集还涉及的到运输成本下降&/i&&/p&&p&(Toivanen, O., and Waterson, M. (2011). Retail Chain Expansion: The Early Years of McDonald's in Great Britain. Working paper, University of Warwick.)。&/p&&br&麦当劳的发展策略,主要是用到了两种学习的情形(涉及到主要是大型购物商圈会使运输成本下降)。&br&&br&&br&&p& - 简单来说,聚集效应&u&可以&/u&与霍特林(包括之后的拓展)的假设无关。可以因与消费者的地理分布、消费者偏好特性有关,而导致商业圈的形成。&/p&&p&也就是说,如果消费者居住圈和对产品的喜欢并非为均匀分布,而是在某个地方密度很高,那么也是会发生集聚效应的。&/p&&br&&p&政策导向除外,当然制定的前提肯定是分析了顾客的密度、产品特性等等的。&/p&&br&&p&而且实际上由于进入壁垒、产品异质性、价格等的存在,很难达成霍特林定理的情形(不聚集)。&/p&&br&&br&&p& - 而进驻商圈的店铺能否持续/是否按照理性分析的长久运营,也同不完全信息和外部性有关。&/p&&br&&br&&p&来源:&a href=&https://www.iei.liu.se/nek/730g83/artiklar/1.328859/Lancaster1.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Lancaster, K. J. (1990), &The Economics of Product Variety: A Survey&, Marketing Science, 9(3), 189-206.&i class=&icon-external&&&/i&&/a&&/p&
谢邀,我尽量避免字多起来。这算是产业组织的部分,涉及到不同厂商的博弈。 - 霍特林模型是说对方只要一移动,就会占有更多你的市场。在它的拓展中,加入了包括多方、合谋、地理位置非直线、产品差异等形成了空间区位竞争理论体系,更加完善,目的是为了解…
&blockquote&博弈论在现实中没有什么用&/blockquote&这样的观点也是醉了。你要是这么说,那我也可以说数学没有用。这不是废话么,任何理论和实际都是脱节的,如果因为脱节就说它没用,那什么有用呢?问什么都说“不一定”,那还要学术研究做什么?&br&&br&蜈蚣博弈其实是个非常非常具体的例子,最早是由 Rosenthal (1982)提出来的。而它其实隶属于更大的一类博弈范畴:Preemption game,中文是不是叫“占先博弈”啊?&br&&br&最早的占先游戏其实和经济学也没直接关系,Karlin (1959)中的例子:&br&&blockquote&两个牛仔决斗,一人一颗子弹,相隔几十米相互瞄准,时间越久越精准……&/blockquote&&br&很多工作用这类博弈来研究&b&专利竞赛(Patent Race)&/b&,这是非常重要的经济问题对吧。举几个早期的例子:Fudenberg et al. (1983) and Lippman & McCardle (1988)。&br&&br&还有一类研究是&b&经济泡沫(Bubble)&/b&,比如Abreu&Brunnermeier (2003),这也是很重要的经济问题对吧?&br&&br&至于蜈蚣博弈的“一轮游”结论,说实话非常好破解,实验室得不到的博弈结果多了,连囚徒困境都很难还原,原因么,你就给我几十块钱让我做小白鼠,老子当然懒得理性了,随便玩~&br&&br&蜈蚣博弈(至少是教科书里)的最重要的假设就是时间是有限的,信息对称,这无非就是让大家学学backward induction,但如果时间是无限的呢?如果信息是不对称的呢?收益是随机的呢?是不是人们就可能会等一等?是不是就会勾结?是不是就会利他了?&br&&br&当然,你也可以抬杠,说用来研究这些有啥意义?意义很大啊,美国花了这么大精力保护知识产权,维护专利,到底是不是好事呢?&br&&br&Hopenhayn&Squintani(2011) 将信息不对称加入了一个连续时间的占先游戏中,一个重要的结论是,R&D的保密会令创新的速度减慢,进而影响了福利。这不就是重要的政策指导么?
博弈论在现实中没有什么用这样的观点也是醉了。你要是这么说,那我也可以说数学没有用。这不是废话么,任何理论和实际都是脱节的,如果因为脱节就说它没用,那什么有用呢?问什么都说“不一定”,那还要学术研究做什么?蜈蚣博弈其实是个非常非常具体的例子…
&p&性别博弈(Battle of the sexes):&br&&/p&&p&&img src=&///equation?tex=%5C%5B%25%0A%5Cbegin%7Btabular%7D%0A%5Bc%5D%7Blll%7D%0A%26+%24F%24+%26+%24B%24%5C%5C%5Ccline%7B2-3%7D%25%0A%24F%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%242%2C1%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%240%2C0%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%24B%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%240%2C0%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%241%2C2%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%5Cend%7Btabular%7D%0A%5C%5D& alt=&\[%
\begin{tabular}
& $F$ & $B$\\\cline{2-3}%
$F$ & \multicolumn{1}{|l}{$2,1$} & \multicolumn{1}{|l|}{$0,0$}\\\cline{2-3}%
$B$ & \multicolumn{1}{|l}{$0,0$} & \multicolumn{1}{|l|}{$1,2$}\\\cline{2-3}%
\end{tabular}
\]& eeimg=&1&&&br&&br&&b&你上面图里画出来的不是这个博弈的相关均衡的集合,只是纳什均衡集合的凸包。&/b&例如,&img src=&///equation?tex=%5Cfrac%7B1%7D%7B4%7DFF%2B%5Cfrac%7B1%7D%7B2%7DFB%2B%5Cfrac%7B1%7D%7B4%7DBB& alt=&\frac{1}{4}FF+\frac{1}{2}FB+\frac{1}{4}BB& eeimg=&1&& 也是相关均衡,但不在该凸包中。&br&&/p&&br&&p&首先,每个相关均衡都是一个在策略组合的集合 &img src=&///equation?tex=%5C%7BF%2CB%5C%7D%5Ctimes+%5C%7BF%2CB%5C%7D& alt=&\{F,B\}\times \{F,B\}& eeimg=&1&& 上的概率分布(correlated distribution)&img src=&///equation?tex=p& alt=&p& eeimg=&1&&,&img src=&///equation?tex=p& alt=&p& eeimg=&1&&可以用下面的表格刻画&br&&img src=&///equation?tex=%5C%5B%25%0A%5Cbegin%7Btabular%7D%0A%5Bc%5D%7Blll%7D%0A%26+%24F%24+%26+%24B%24%5C%5C%5Ccline%7B2-3%7D%25%0A%24F%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%24a%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%24b%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%24B%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%24c%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%24d%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%5Cend%7Btabular%7D%0A%5C%5D& alt=&\[%
\begin{tabular}
& $F$ & $B$\\\cline{2-3}%
$F$ & \multicolumn{1}{|l}{$a$} & \multicolumn{1}{|l|}{$b$}\\\cline{2-3}%
$B$ & \multicolumn{1}{|l}{$c$} & \multicolumn{1}{|l|}{$d$}\\\cline{2-3}%
\end{tabular}
\]& eeimg=&1&&&img src=&///equation?tex=%5C%5B%25%0A%5Cbegin%7Btabular%7D%0A%5Bc%5D%7Blll%7D%0A%26+%24F%24+%26+%24B%24%5C%5C%5Ccline%7B2-3%7D%25%0A%24F%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%241%2F2%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%240%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%24B%24+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7D%7B%240%24%7D+%26+%5Cmulticolumn%7B1%7D%7B%7Cl%7C%7D%7B%241%2F2%24%7D%5C%5C%5Ccline%7B2-3%7D%25%0A%5Cend%7Btabular%7D%0A%5C%5D& alt=&\[%
\begin{tabular}
& $F$ & $B$\\\cline{2-3}%
$F$ & \multicolumn{1}{|l}{$1/2$} & \multicolumn{1}{|l|}{$0$}\\\cline{2-3}%
$B$ & \multicolumn{1}{|l}{$0$} & \multicolumn{1}{|l|}{$1/2$}\\\cline{2-3}%
\end{tabular}
\]& eeimg=&1&&&br&&br&例如,这个概率分布会以概率&img src=&///equation?tex=b& alt=&b& eeimg=&1&& 抽取行动组合&img src=&///equation?tex=%28F%2CB%29& alt=&(F,B)& eeimg=&1&&,并将&img src=&///equation?tex=F& alt=&F& eeimg=&1&& 推荐给第一个参与人,&img src=&///equation?tex=B& alt=&B& eeimg=&1&& 推荐给第二个参与人。当第一个人收到推荐&img src=&///equation?tex=F& alt=&F& eeimg=&1&& 的时候,他并不知道对方收到的推荐是什么,但由于他知道概率分布如上,他的条件概率估计是对方以概率&img src=&///equation?tex=%5Cfrac%7Ba%7D%7Ba%2Bb%7D& alt=&\frac{a}{a+b}& eeimg=&1&& 收到了推荐&img src=&///equation?tex=F& alt=&F& eeimg=&1&&,以概率&img src=&///equation?tex=%5Cfrac%7Bb%7D%7Ba%2Bb%7D& alt=&\frac{b}{a+b}& eeimg=&1&& 收到了推荐&img src=&///equation?tex=B& alt=&B& eeimg=&1&&。(如果&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 可以表示成两个参与人混合策略的乘积,那么&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 本质上就是不包含任何correlation 的。而右上表给出的概率分布&img src=&///equation?tex=%5Cfrac%7B1%7D%7B2%7DFF%2B%5Cfrac%7B1%7D%7B2%7DBB& alt=&\frac{1}{2}FF+\frac{1}{2}BB& eeimg=&1&& 则不能由任何乘积表示,也容易看出在该分布下,双方的策略是高度相关的。)&br&&br&&b&&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 构成相关均衡的条件是,在按照&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 随机抽取行动组合推荐给参与人时,每个参与人在接收到行动推荐后,给定根据&img src=&///equation?tex=p& alt=&p& eeimg=&1&&计算出的对方收到的行动推荐的条件概率并假定对方会服从,那么他的最优选择就是服从推荐。&/b&&br&&br&也就是说,相关均衡是基于推荐的均衡。可以通过交通调度来理解。调度员只需要分别告诉每个司机他该走哪条路,司机收到调度指令后,根据调度分布算出调度员给其他人的指令的概率分布是什么(从而计算拥堵程度),如果该分布是均衡,在给定其他司机都会服从调度的情况下,每个司机都会发现服从调度是最优的。&br&&br&=====================================================&br&&br&对于性别博弈,概率分布&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 构成相关均衡的条件是:&br&&br&1. 参与人1 在收到行动推荐&img src=&///equation?tex=F& alt=&F& eeimg=&1&& 时,选择&img src=&///equation?tex=F& alt=&F& eeimg=&1&& 是最优(即好过选择&img src=&///equation?tex=B& alt=&B& eeimg=&1&&)。给定条件概率,我们可以计算出&img src=&///equation?tex=F& alt=&F& eeimg=&1&& 和&img src=&///equation?tex=B& alt=&B& eeimg=&1&& 分别带来的收益,得到不等式&br&&img src=&///equation?tex=1F%3A+%5Cfrac%7Ba%7D%7Ba%2Bb%7D2%2B%5Cfrac%7Bb%7D%7Ba%2Bb%7D0%5Cgeq%5Cfrac%7Ba%7D%7Ba%2Bb%7D0%2B%5Cfrac%7Bb%7D%7Ba%2Bb%7D1& alt=&1F: \frac{a}{a+b}2+\frac{b}{a+b}0\geq\frac{a}{a+b}0+\frac{b}{a+b}1& eeimg=&1&&&br&&br&2. 同理,在1 收到推荐&img src=&///equation?tex=B& alt=&B& eeimg=&1&& 和 2 分布收到两个行动推荐时,服从推荐都需要是最优选择,于是如下三个不等式需要满足&br&&img src=&///equation?tex=1%2CB++%26+%3A0c%2B1d%5Cgeq2c%2B0d%2C%5C%5C%0A2%2CF++%26+%3A1a%2B0c%5Cgeq0a%2B2c%2C%5C%5C%0A2%2CB++%26+%3A0b%2B2d%5Cgeq1b%2B0d.& alt=&1,B
& :0c+1d\geq2c+0d,\\
& :1a+0c\geq0a+2c,\\
& :0b+2d\geq1b+0d.& eeimg=&1&&&br&&br&整理后,得到&br&&img src=&///equation?tex=a%2Bb%2Bc%2Bd++%26+%3D1%2C%5C%5C%0Aa%2Cb%2Cc%2Cd%5Cgeq+0%5C%5C%0Aa%2Cd++%26+%5Cgeq2c%5C%5C%0Aa%2Cd++%26+%5Cgeq+b%2F2& alt=&a+b+c+d
a,b,c,d\geq 0\\
& \geq2c\\
& \geq b/2& eeimg=&1&&&br&&br&&b&所有满足以上不等式组的&img src=&///equation?tex=a%2Cb%2Cc%2Cd& alt=&a,b,c,d& eeimg=&1&& 所定义的概率分布&img src=&///equation?tex=p& alt=&p& eeimg=&1&& 都是性别博弈的相关均衡。由于以上不等式的解的集合是一个多面体(准确地说,是有五个顶点的六面体)和它的内部,相关均衡的集合自然就是一个凸集。并且该凸集包含纳什均衡集合的凸包。&/b&&br&&br&相关均衡&img src=&///equation?tex=%28a%2Cb%2Cc%2Cd%29%3D%281%2F2%2C0%2C0%2C1%2F2%29& alt=&(a,b,c,d)=(1/2,0,0,1/2)& eeimg=&1&& 以一半概率选择&img src=&///equation?tex=%28F%2CF%29& alt=&(F,F)& eeimg=&1&&一半概率选择&img src=&///equation?tex=%28B%2CB%29& alt=&(B,B)& eeimg=&1&&,带来的期望支付是&img src=&///equation?tex=%283%2F2%2C+3%2F2%29& alt=&(3/2, 3/2)& eeimg=&1&& 是三个纳什均衡都达不到的。而相关均衡&img src=&///equation?tex=%28a%2Cb%2Cc%2Cd%29%3D%281%2F4%2C1%2F2%2C0%2C1%2F4%29%2C+%282%2F5%2C+0%2C+1%2F5%2C+2%2F5%29& alt=&(a,b,c,d)=(1/4,1/2,0,1/4), (2/5, 0, 1/5, 2/5)& eeimg=&1&& 则不在三个纳什均衡构成的凸包中。&/p&&br&&p&&b&References:&/b&&/p&&br&&p&Aumann, R. (1974), Subjectivity and correlation in randomized strategies, &i&Journal of Mathematical Economics&/i&, 1, 67-96.&/p&&p&Nau, R., Canovas, S.G., Hansen, P. (2004), On the geometry of Nash equilibria and Correlated equilibria, 32, &i&International Journal of Game Theory&/i&, 443-453. &/p&
性别博弈(Battle of the sexes):\[%
\begin{tabular}
& $F$ & $B$\\\cline{2-3}%
$F$ & \multicolumn{1}{|l}{$2,1$} & \multicolumn{1}{|l|}{$0,0$}\\\cline{2-3}%
$B$ & \multicolumn{1}{|l}{$0,0$} & \multicolumn{1}{|l|}{$1,2$}\\\cline{2-3…
其实是没有漏洞的,也就是说如果你能严格的这么去执行,你确实肯定会赚钱。&br&但是现实往往是不同于数学的,最明显的一个因素就是在数学中你可以有无限多的钱,而在现实里你只有有限多的钱。数学中你可以有无限多次赌博机会,每次赌博过程的时间成本是0,然而现实里你只有有限场比赛可以参与,而每天你只能进行有限场赌博&br&那世界杯而言,总共也只有64场比赛,要踢一个月时间。&br&我们可以简单的计算一下:&br&100;300;900;;2;0;5904900&br&好了我想不用我继续往下算了,我们就算一下,当你有590万的时候,你在一个月时间里64场比赛获得各个数字收益的概率。&br&&br&首先是最极端的,连续11场你都猜错了,这时候你的590万已经没有了,你赔光了,概率是70%的11次方,大概是1.977%,也就是你有将近2%的可能赔光,如果你身价更高一点,你有1180万呢?你大概也有1%的概率直接赔光。&br&&br&假设64场比赛你全部猜对了,ok,概率是30%的64次方,这个数字是,额哦,3. * 10 -34
&br&好吧,这个概率比你连续十年每一期的双色球都中头奖还低。&br&那么你赚的钱是多少呢?OK,6400.&br&我勒个去&br&你准备了590万,得到了天大的运气,都快接近普朗克常数了,结果你只赚了6400块。&br&&br&那么什么情况下你的收益会是最大的呢?当你只有590万的时候,你为了不赔光,你就不能连输11场,而为了多赚钱,你就不能每场都对,因为每场你只能赚100块。所以你需要连错十场然后对一场,然后错十场对一场,错十一场对一场,错十一场对一场,错十二场对一场,错九场对一场。为啥往后你就可以多错一两场了呢?因为你前面盈利了嘛。。ok,这样的话,你将会赚……好了好了,不仔细算了,大概是三千多万吧。&br&&br&那么这个概率是多少呢?好吧,大概是?????十万分一吧&br&&br&那么我们就不再细算了哈,你这种投放方法的正态分布是大概一万块的盈利。也就是当样本量很大的情况下,比如,你连续赌博100届世界杯,那么你将总共会获得100万的盈利。注意每一届世界杯你都要准备590万。&br&你花费了400年的时间&br&另外,还有两届你是赔光了。
其实是没有漏洞的,也就是说如果你能严格的这么去执行,你确实肯定会赚钱。但是现实往往是不同于数学的,最明显的一个因素就是在数学中你可以有无限多的钱,而在现实里你只有有限多的钱。数学中你可以有无限多次赌博机会,每次赌博过程的时间成本是0,然而…
谢邀…&br&混合策略的定义是纯策略上的一个概率分布,数学上来看很简单,但如何解释的确不像看起来的那么容易。我觉得如果不是专门做纯博弈论的,学习过程中采用其中一种对你来说最自然的解释就行。我在这里列出两种解释,因为手机答题,所有例子我都用“石头剪刀布”这个游戏,两位参与者就叫A和B。&br&&br&&br&先说一个比较基本的解释,也是一本标准的高微书上会给出的解释。混合策略就是随机化自己的纯策略,令自己的纯策略依赖于一个随机的信号。比如玩石头剪刀布的时候我事先给自己约定:我先扔一枚骰子,点数是1或2我就出石头;点数是3或4我就出剪刀;点数是5或6我就出布。这样就实现了(1/3,1/3,1/3)这个随机策略。(要生成别的分布,你可以利用电脑依[0,1]上均匀分布取一个数。)&br&&br&&br&上述解释的一个缺点是:现实中没人玩游戏前还会掷个骰子啊。于是出现第二种解释,最早由Aumann提出。&br&第二种解释是说:A的一个混合策略并不是描述A的行为,而是B对A的行为的一个信念。举个例子来说,A用(1/3,1/3,1/3)这个策略其实是B猜测A会以1/3概率出石头,1/3概率出剪刀,1/3概率出布。这样的话,石头剪刀布这个游戏的纳什均衡就可以解释为B认为A出石头剪刀布的概率各为1/3。A认为B也是这样。这种框架下纳什均衡的解释也并非采用“No profitable deviation”了,而是变成了以下两个条件:&br&1.所有参与者给定自己对他人的信念选择对自己最优的纯策略。&br&2.所有参与者的信念是正确的。&br&参考《A Course in Game theory》Chapter3。&br&&br&我自己的情况是:做题的时候(有计算的时候)会采用第一种解释,而理解理论的时候会采用第二种解释。就好比概率论里计算时用Riemann积分,开发理论时用Lebesgue积分。&br&&br&其余的解释还有许多。比如Myerson在《Game Theory》Chapter3里引入一个Game Theorist的角色,说所以参与者的混合策略是这个Game Theorist的一个信念(和上述第二种解释并无本质区别)
谢邀…混合策略的定义是纯策略上的一个概率分布,数学上来看很简单,但如何解释的确不像看起来的那么容易。我觉得如果不是专门做纯博弈论的,学习过程中采用其中一种对你来说最自然的解释就行。我在这里列出两种解释,因为手机答题,所有例子我都用“石头剪…
先说好了,我说的道理不算科学。&br&&br&&br&&br&玩2048么,&br&&br&一个局面看似上下左右都可以划,但玩久了你就发现,想玩下去的话,可行方法就那么几样,后期几乎每一步都没有什么可选的。&br&&br&很多东西在新接触的时候觉得很自由,对,它本身是很自由,但我们想要赢,想要面子,想要赚钱,想要交朋友,想要拉拢某某,想要搞垮某某,想要这样那样,每一条都是在那个自由的基础上加一个限制,&br&&br&最后,&br&&br&你以为有很多路可以走,其实四周有很多看不见的墙,最终你能走的路只有一条。&br&&br&那些&错误&的路当然不是不能走,你若放得下,游戏本身是很自由的,但我放不下,便得步步为营,&br&&br&因为我要面子,要盈利,要胜利,要我想要的尘世间的种种,那么就注定了这个局面一步走错,步步皆输,&br&&br&酱。
先说好了,我说的道理不算科学。玩2048么,一个局面看似上下左右都可以划,但玩久了你就发现,想玩下去的话,可行方法就那么几样,后期几乎每一步都没有什么可选的。很多东西在新接触的时候觉得很自由,对,它本身是很自由,但我们想要赢,想要面子,想要赚…
上财孙宁对这个问题进行了研究,有兴趣的自己 google 他的文章:&br&Hybrid mechanisms for car licenses allocation with bidders' budget constraints&br&他的结论是应该将拍卖和摇号结合起来,我认同这个结论。&br&&br&其算法如下:&br&1、Social planner 宣布车牌数量 m,拍卖环节会卖出的车牌数量 m_1 以及拍卖中的 reserve price r(不太高)&br&2、一般人决定是否参与拍卖环节,决定之后 social planner 会宣布参与拍卖的人数 n_1&br&3、拍卖环节,出价必须高于 r,前 m_1 高出价者获得车牌,付的钱是第 m_1 + 1 高的价格(不懂拍卖的请移步:&a class=& wrap external& href=&http://en.wikipedia.org/wiki/Generalized_second-price_auction& target=&_blank& rel=&nofollow noreferrer&&Generalized second-price auction&i class=&icon-external&&&/i&&/a&)&br&4、彩票环节,所有没获得车牌的人进行摇号,赢得车牌的人付 r&br&&br&通过选取合适的 m_1 和 r 值,这个算法大致能在效率、收益、公平这三个方面协调的比较好。&br&效率指的是公众的收益&br&收益考察的是 social planner 的收益&br&公平他们用的是 Gini 系数&br&&br&具体的还是读 paper 吧,今年 4 月的 version 已经 53 页了。&br&&br&另外,实证分析有不少人做,但没什么漂亮的结果。
上财孙宁对这个问题进行了研究,有兴趣的自己 google 他的文章:Hybrid mechanisms for car licenses allocation with bidders' budget constraints他的结论是应该将拍卖和摇号结合起来,我认同这个结论。其算法如下:1、Social planner 宣布车牌数量 m,拍…
老头子长期以来假装口吃,别人还以为是真的。此外,每当天阴下雨,他还总抱怨自己耳朵不灵便,每当这时,两位克洛肖先生总感厌烦,在听那老葡萄园主说话时他们总是暗地里做怪相,仿佛是要极力说出他故意卡在喉咙里的那几个字。这里,也许有必要将葛朗台口吃、耳聋的原委作一个介绍。其实在安茹,这位狡猾的葡萄园主的昂热地区法语讲得比任何人都流利,发音比任何人都清楚。过去尽管他精明能干,但他还是被一位犹太人愚弄过……&br&……因而,现在他在做任何一笔生意时都更需要耳聋和口吃。他需要跟他们兜圈子,把他们搞得晕头转向,从而掩盖自己的想法。他既不愿为自己的想法承担责任,而又想获得说话的主动权,使对方对自己的真实意图摸不着头脑。
《欧也妮·葛朗台》&br&&br&以上是这位闻名世界的吝啬鬼老葛朗台谈生意的不二法门
老头子长期以来假装口吃,别人还以为是真的。此外,每当天阴下雨,他还总抱怨自己耳朵不灵便,每当这时,两位克洛肖先生总感厌烦,在听那老葡萄园主说话时他们总是暗地里做怪相,仿佛是要极力说出他故意卡在喉咙里的那几个字。这里,也许有必要将葛朗台口吃…
这个游戏被我们帝国理工一群博士给改了。&br&&br&1)换牌喝一口(1/5杯),大家轮流换,可以有无限轮。&br&&br&2)等到大家都满意自己的牌的时候,开牌,最小的人喝一杯,第二的不用喝。&br&&br&3)如果中途有人愿意喝两杯,可以把最小的喝变成最大的喝(称为“反转”)&br&&br&4)最多可以反转四次,每次惩罚杯数加一&br&&br&之后这个游戏就变得极其下酒。。。
这个游戏被我们帝国理工一群博士给改了。1)换牌喝一口(1/5杯),大家轮流换,可以有无限轮。2)等到大家都满意自己的牌的时候,开牌,最小的人喝一杯,第二的不用喝。3)如果中途有人愿意喝两杯,可以把最小的喝变成最大的喝(称为“反转”)4)最多可以…

我要回帖

更多关于 博弈论模型求解步骤 的文章

 

随机推荐