1.求最短路径的dijkstra算法
2.有哪些看似是爱车,实则毁车的行为?
3.为什么企业,机关事业单位退休人员均涨6.5
4.震荡造句-用震荡造句
5.数据挖掘核心算法之一--回归
求最短路径的dijkstra算法
最短路径dijkstra算法如下:
Dijkstra迪杰斯特拉是一种处理单源点的最短路径算法,就是说求从某一个节点到其他所有节点的最短路径就是Dijkstra。
资料拓展:
迪杰斯特拉算法(Dijkstra)是由荷兰数腔计算机科学家狄克斯特拉于1959年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其薯纳衫余各顶点的最短路径算法,解决的是有权图中最短路径问题。
迪杰斯特拉算法主要特点是从起始点开始,采用贪心算法的策略,每次遍历到始点距离最近且未访问过的顶点的邻接节点,直到扩展到终点为止。
Dijkstra算法一般的表述通常有两种方式,一种用永久和临时标号方式,一种是用OPEN,CLOSE表的方式,这里均采用永久和临时标号的方式。注意该算法要求图中不存在负权边。
将T中顶点按递增的次序加入到S中,保证:从源点V0到S中其他各顶点的长度都不大于从V0到T中任何顶点的最短路径长度。每个顶点对应一个距离值。
S中顶点:从V0到此顶点的长度。T中顶点:从V0到此顶点的只包括S中顶点作中间顶点的最短路径长度。依据:可以证明V0到T中顶点Vk的,或是从V0到Vk的直接路径的权值;或是从V0经S中顶点到Vk的路径权值之和。
初始时令S={V0},T=V-S={其余顶点},T中顶点对应的距离值。若茄搭存在,d(V0,Vi)为弧上的权值。若不存在,d(V0,Vi)为∞。
从T中选取一个与S中顶点有关联边且权值最小的顶点W,加入到S中。对其余T中顶点的距离值进行修改:若加进W作中间顶点,从V0到Vi的距离值缩短,则修改此距离值。重复上述步骤2、3,直到S中包含所有顶点,即W=Vi为止。
有哪些看似是爱车,实则毁车的行为?
很多车主都会选择打蜡,其实这本来就是保护车的一个方式,不仅能让车子更加光亮,也能防止划痕的产生,但是,你要是打蜡的方式不对,材料得不好,那么这层蜡就白打了,不仅你的钱浪费了,还会对车子本身的漆造成损害,这样的保养实际上就是在毁车。
机油要买最贵的,加到最大量?有些老司机可能会觉得,给车辆的机油加得越多越贵就越好,其实过多的加注机油不但会增加发动机的内部阻力,而且还很容易使发动机产生积碳,严重时就会产生烧机油的现象。而还有车主会认为,给爱车加注的机油一定要用进口高标号的产品,其实只要根据自身车辆的发动机型号选择工况最为适合的机油产品就可以,并非越贵的产品就最适合自己的爱车。
自己瞎洗车。很多车主认为洗车店洗车不但洗得不干净,并且还有一些学徒工把车漆擦坏的现象,所以很多时候就选择了自己去洗车,殊不知很多车主根本就不懂洗车,洗车的时候用洗洁精和洗衣粉就往车子上倒了,这些洗洁剂的酸碱度先不说吧,洗衣粉里的杂质也会伤害车漆总应该会意识到吧。
不舍得开车。很多的车子在购置了新车子以后会舍不得开车,怕损伤到车子。这种现象倒也经常见到。但是新车闲置太久是会出毛病的。配件的老化会加剧,对车子也是有害的。
大部分人都有这样的心理,就是以为越贵的东西就越好,还有的以为,进口的东西一定比国内的要好,也不能全都包括。有的车主盲目使用最贵的机油,其实,该用什么机油要根据自己的车型、车子使用年长、受损程度等因素来决定,并不是最贵的就一定适合自己汽车。
汽车说到底还是一辆代步工具,正常使用和保养即可,另外养成良好的驾驶习惯,也会延长车辆的使用寿命。
为什么企业,机关事业单位退休人员均涨6.5
上海中公教育为您解答:
今年起我国将只按6.5%左右来提高企业和机关事业单位退休人员养老金标准。
解读
一、按较高标准涨或使待遇差拉大
根据上述说法,企业职工养老金迎来了“12连调”。但是今年的幅度却较去年的10%比例有所下降。
据中国社会保险学会副会长何平介绍,从2008年开始,养老金增长的幅度就被固定为10%。直到2015年,企业职工养老金依然遵循惯例增长了10%。
对此,人社部社会保障研究所所长金维刚分析,以前企业职工养老金连续由按照10%的比例往上调,主要是为了解决企业退休人员养老金待遇水平比较低,与机关事业单位退休人员养老金待遇差别大所采取的一项措施。经过多年调整,企业职工养老金已经由2004年的月均647元,提高到2015年超过2200元的水平,增长了近3.5倍。
因此,金维刚表示,“情况已经跟过去不一样了”,养老金待遇调整可以回到正常的状况,参照国际上通行养老金调整机制进行调整。
首都经贸大学劳动经济学院劳动与社会保障系主任朱俊生向记者表示,养老金涨幅回落与机关事业单位退休人员首次参与到养老金标准的调整中有极大关系。
朱俊生介绍,众所周知,由于我国此前存在的养老金双轨制问题,使得机关事业单位退休人员的养老金标准要高于部分企业退休人员的养老金标准。目前我国已经完成了制度上的并轨,但是机关事业单位和企业退休人员的养老金实际水平并未实现并轨。
他分析,一方面如果继续按10%的较高标准涨养老金,由于基数相对高,可能出现机关事业单位退休人员养老金增长额过快的问题。另一方面人社部近日透露,去年的统计数据显示,已经有7个省养老保险基金当期已经收不抵支。加之目前经济形势趋缓,财政支出压力加大,受上述这些因素的共同影响,可能才让有关部门做出了这一降低涨幅的决定。
虽然降低养老金涨幅有其客观原因,不过对于这项涉及众多参保者切身利益的问题,朱俊生分析,还是应该有一个公开的制度性规定,明确一系列的调整涉及因素,以及调整规则、公式和算法。
众所周知,目前我国汽油价格调整就采取了相对市场化的制度,根据公开的规则,很多业内机构都会预发油价调整的信息。与此类似,如果养老金标准调整也能采取类似方式,通过一系列参数的自我调整,就可以更好地实现制度内的自动调节,使得调整过程相对更加客观。
二、应最大限度体现多缴多得
对于具体调整规则,朱俊生认为,除了与当地职工平均工资增长率和物价涨幅等因素挂钩以外,最重要的是调整应与职工在职时期的缴费水平挂钩。换言之,多缴多得的原则应该优先在养老金调整中得以落实。
目前,有关部门已经明确提出,未来我国将推行延迟退休的政策。参保者无疑希望能够通过更长的缴费年限,实现多缴多得的目标。目前在养老金调整的实际情况中,向高龄老人、养老金偏低的退休人员,以及艰苦边远地区企业退休人员,普遍会进行更多的政策倾斜。但在这一调整养老金标准的过程中,多缴多得这一原则并未得以最大限度地体现。
目前各地普遍规定15年的养老保险累计缴费年限是退休标准之一,朱俊生介绍,现实中却有部分人在养老保险累计缴费达到15年后,就中断缴费放弃继续参保了。应该说,这与养老保险多缴多得的原则并未得到非常好的落实不无关联。
在这次调整中,报告提出按6.5%左右提高企业和机关事业单位退休人员养老金标准。鉴于对于养老保险调整规则的修改可能无法一蹴而就,朱俊生建议,在这次调整中,各地可以考虑尽量向企业退休人员多倾斜一些。
换言之,可以让企业退休人员的养老金标准按照平均略高于6.5%的标准来调整。由于机关事业单位退休人员养老金标准已经高于部分企业职工,可对这一群体按照略低于6.5%的标准来调整。这样也能尽量避免双方的养老金差距拉开得过大。
震荡造句-用震荡造句
一、信任,是架设在人心的桥梁,是沟通人心的纽带,是 震荡 感情之波的琴弦。
二、“哗哗”的瀑布声在山谷间 震荡 着,回响着,似千百架低音提琴在奏鸣,在轰响。
三、四海翻腾云水路,五洲 震荡 风雷激。
四、锣鼓声,号角声,声声相应,在天空中 震荡 。
五、在山谷中呐喊,音调雄壮,回声 震荡 ,山鸣谷应,飘散林海。
六、忆往夕,峥嵘岁月稠。在世界风雷 震荡 的社会巨变中,中国***已昂然走过了81年的历程。
七、在他跨过这一座九一生的悬桥,脚底下有些 震荡 的时候,大家一点儿声音也不敢发出来。
八、这种 震荡 波以每小时500,000公里破浪前行,并穿透宇宙空间。
九、上周,因缺乏消息面指引,油脂期价维持 震荡 。
十、2010年上半年,沈城房价走势在 震荡 中前行。
十一、如果你需要更强的选择性,应该将再生调节到发生 震荡 前的最强点上.
十二、美国股市整日受油价 震荡 的影响呈拉锯走势.布兰特原油期货在早盘尾段交易中攀升至117美元之上的两年半高位,但之后下滑.布兰特原油结算价涨0.93美元,报每桶116.35美元.
十三、 震荡 动作会使燃料床抖动,因此,相应的排热设计要比滑动式炉栅的更为慎重一点。
十四、防水新一代设计子弹型单震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
十五、 震荡 波就像一台粒子加速器,将等离子体中的电子加速到接近光速。
十六、指数窄幅 震荡 ,个股活跃仍将持续一段时间。
十七、前者能隙随著电场强度 震荡 ,后者能隙则是跟石墨带的宽度无关。
十八、今日两市小幅高开,在高开后不久便 震荡 走低,一度快速杀跌,地产是杀跌主力,沪指危及5日线。
十九、劫掠者的 震荡 手雷击中敌人的时候,会直接降低敌人的移动速度。
二十、这个 震荡 称为雷射尾迹场,因为雷射脉冲的轨迹,就像机船在海面上所产生的船痕。
二十一、他正要转身回到栅栏那里去,但是已经晚了:他听到背后有狗在狂叫。从房子那边,有一条大狗顺着落满枯叶的小道,向他猛扑过来,可怕的汪汪声 震荡 着整个花园。
二十二、成功的标准并不仅仅来自美国社会的承认。他们大多数人的成功是在经历了生活、心理环境的大 震荡 后,又找到了新的平衡,也超越了自己。
二十三、实际上,强美元政策并不是要不断推动美元上升,因美元过强对美国亦有负面影响,如由此引起国际金融市场 震荡 ,美国也难置身事外。
二十四、分析显示,磁镜波于X型与O型磁场结构上所形成的磁瓶,为造成撕裂模不稳定性 震荡 与成长率显著增加之主要原因。
二十五、他预计,在宽松的财政和货币政策以及美元疲软的背景下,金价将在“ 震荡 中”于今年夏天回到创纪录高点。
二十六、"在我们获得来自欧洲的有关债务危机的进展,或本周稍晚来自美联储的驱动前,我预计市场将陷于区间内,且走势将十分 震荡 ,"Dailey表示.
二十七、在同一场比赛中,后卫松科和替补门将库迪奇尼相撞,使得意大利人脑 震荡 。
二十八、不到长城非好汉,建设大业努力干,万众团结力量大,复兴宏图挥手间,四海翻腾云水怒,中国人民同致富,五洲 震荡 风雷激,华夏民族忙崛起。祝七一快乐。
二十九、非洲国家财政部长和中央银行行长结束了在利隆圭举行的为期两天的会议。会议主要集中在减缓全球经济 震荡 对非洲的影响的方法。
三十、在一些国家,这场危机实际上可能使得政府更想发展这类基金,因为官方人士认为,这类基金可以作为因应金融 震荡 的工具.
三十一、在经过一天的红盘走高 震荡 之后,周五纽约证券交易结束时,道琼斯主要工业平均指数有了小幅回升,以略超过248点收盘。
三十二、上周五还在拉升,再配合蒙目龙消息,本周继续宽幅 震荡 可能性还是较大。
三十三、向目标发出 震荡 波,在比较短的距离里面造成439到468的伤害,魔法能产生反馈效果。6秒内每秒回复14到33点的能量值。
三十四、Cheng的模型描述了在黑洞持续吞食恒星时,热等离子体反复而周期性的被注入银河晕这样的 震荡 波是如何形成的。
三十五、短期关注棉花止跌企稳迹象,PTA或维持 震荡 调整。
三十六、其中的前五大病毒家族的全部时间是 震荡 波病毒,其中利差,利用最近微软的漏洞,散布在机器无需用户干预的要求。
三十七、重要的是,所述插入物可以大体上放置在防汗带内,例如冲击下最容易震荡或损伤的部位。
三十八、约翰怀疑她上上周又把自己弄成脑 震荡 了,当时她淋浴时“滑倒”了,不得不拖着自己不省人事的躯体,摇摇晃晃、红赤赤、湿漉漉的脑袋上了床。
三十九、闪银色新一代设计子弹型单震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
四十、而北极 震荡 指数为正值时,北极会出现低气压,中纬度地区出现高气压。
四十一、但随后权重板块的冲高回落,也使得股指再度出现 震荡 调整.
四十二、使天气更加异常的因素:另外一种热带天气模式有点象穿着轮滑鞋的厄尔尼诺,被称为季内 震荡 。
四十三、然而,企业家们却开始不断裁员,在很多家网络公司对此行为作出无声回映的同时,厂商言乎而言的声称他们在第一次最大的互连网 震荡 期间所走的现实主义态度和行为路线。
四十四、从盘面走势看,国内棉花今日继续低开,盘中价格走势以 震荡 为主,收盘价格低于开盘价,持仓继续增加。
四十五、四海翻腾云水怒,五洲 震荡 风雷激。
四十六、而周线放量收阴,预示周初或将产生宽幅 震荡 .
四十七、最近,美军对伊拉克的入侵在阿拉伯世界内所引发的 震荡 还余波未平,如今他们发现自己又被卷入美伊间对地区控制权的争夺中。
四十八、外盘综述:隔夜美棉宽幅 震荡 ,目前交投最活跃的07合约昨日停止了连续七个交易日的下跌,收出阳线。
四十九、引入平移不变小波,较好地抑制了信号中的伪吉伯斯 震荡 .
五十、美股在上午 震荡 剧烈,但振幅较小,主要股指当前涨跌互见.
五十一、两个实验的重点是量子铝原子钟,它利用单一铝离子的 震荡 来精准测量时间的流逝。
五十二、若取消预售制度广州楼市 震荡 有多大?
五十三、微软早先向帮助确认 震荡 波制作者的人提供过相似的奖赏。震荡波是2004年爆发的另一臭名昭著的蠕虫病毒。
五十四、股市与情感:谈朋友叫选股,结婚叫成交,生子叫配股,超生叫增发,感情不合叫套牢,白头偕老叫长线,自由恋爱叫开放式基金,离婚是解套,吵架相当于 震荡 ,分手就是割肉,失恋等于跌。
五十五、至1990年以来,上海交易的股票指数基准飙升了27倍,不计在2008年的一次崩盘和许多次 震荡 。
五十六、霸天虎分裂, 震荡 波,萨克巨人与霸主三雄并立。
五十七、科幻新一代设计子弹型单震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
五十八、这个物体,将会在势阱内 震荡 。
五十九、强烈的恒星风压缩加热了星际尘埃,并在前方形成弧形的 震荡 波。
六十、神州 震荡 风雷激,喜见金瓯建党旗。马列真知指航向,朱毛胆剑救时危。雄心喝令山河变,壮志医平日月亏。四化宏图惊世界,八旬华诞颂新诗!
六十一、作为对综合前景分析的结果,我们预计股市会在今年上半年呈区间 震荡 。
六十二、然而,在中国 震荡 出现任何迹象之前,查诺斯、哈特和亨德利几位先生坚持立场已经有一段时间了。
六十三、金银岛仓单市场低开 震荡 ,尾市收跌.
六十四、实验进行到一半的时候,他自己爬到金属球上开始在那个巨大的 震荡 装置里满屋子荡来荡去,就好像他是百老汇中的蜘蛛人一样。
六十五、而干扰会改变那些测量值,所以GPS用精确复杂的算法能够感知和校准那些类型的干扰,当然核爆破所产生的这种 震荡 波也不例外。
六十六、时尚新一代设计子弹型单长震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
六十七、当核爆破离开地下,它会传递一种干扰空气的 震荡 波到电离层。
六十八、三鹿引爆有毒奶粉风潮, 震荡 了整个中国奶业.
六十九、继经历了 震荡 剧烈的正常交易时段之后,银行类股票在盘后交易中走软。
七十、能肘击的话继续,要是对手弯腰更好,双手抱住他的头,用膝盖撞他的面门几十下,完成这一系列动作以后,他绝对已经昏迷加脑 震荡 了。
七十一、同时它也被失效的 震荡 、突破三角旗形以及突破趋势线所确认。
七十二、虽然 震荡 市况之下投资者惊惶不安,部分赴美上市中国企业的财务问题也引起了担忧,但去哪儿还是要上市。
七十三、在横向 震荡 整固之后,深市于上周三率先向上突破.
七十四、虚空 震荡 :宠物会正确的对所有目标使用此技能,并非只对有法力值的目标使用。
七十五、与此同时,美元汇率从最近的抛压中得到一个暂时喘息的机会,在仍旧 震荡 和不安的交易中微幅上涨。
七十六、此案由中纪委和公安部直接查办,沈阳公安系统上下 震荡 ,内部称之为“六零七案”。
七十七、时尚新一代设计子弹型长短震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
七十八、威震天,为 震荡 波解冻的最后准备已经开始了。
七十九、道指和标准普尔500指数在盘中 震荡 后,最终几收平盘,投资者抛售经济成长相关类股,买入电信和公用事业等防御类股.
八十、门禁电锁控制器是采用红外线光耦合器反射型调变 震荡 方式,达到定位检知效果,使其能正确的掌握状况,进而做出适当的控制。
八十一、本文的结论是中国国有银行改革有其内在的渐进逻辑,期望通过一次“ 震荡 性”疗法来完成商业化改革注定会无功而返。
八十二、美股午后 震荡 剧烈,主要股指当前涨跌互见.
八十三、时尚新一代设计子弹型单震旦:备有指示灯,光暗度随 震荡 强度改变。配备超静音微型强劲马达之无段变速震动器。
八十四、美国股市在 震荡 交投中收平盘或小幅收低.美国公债价格飙升,打压指标收益率降至一年低位.
八十五、向目标发出 震荡 波,在比较短的距离里面造成312到334的伤害,魔法能产生反馈效果。6秒内每秒回复10到24点的能量值。
八十六、毅联汇业等公司正在试图预测,如果欧元区真的解体,在最初几小时或几天的 震荡 期间,可能会发生什么事。
八十七、因此,预计沪胶在连续几日反弹之后继续上涨空间较为有限,近期 震荡 回落的概率较大。
八十八、近日活跃度明显提高,后市有望 震荡 盘升.
八十九、日分时走势图上更是大幅 震荡 .
九十、这才应当是日本所需要的 震荡 性的改革,这也将会标志着新任首相不会满足于仅仅掌舵一艘缓慢下沉的巨轮。
九十一、欧元价格形势并不好,经济大环境仍处于摇摆 震荡 之中,“不过宝马汽车总会有销路”,菲戈说。
九十二、下游市场,聚酯切片市场继续维持 震荡 偏弱的格局,市场重心小幅阴跌。
九十三、狼市的特点是窄幅 震荡 、波动增加、股票相关性高、反转快。
九十四、明年整个市场是一个宽幅 震荡 、逐步筑底的过程.
九十五、股指随即围绕平盘位置展开 震荡 ,深成指表现较强.
九十六、向目标发出 震荡 波,在比较短的距离里面造成50到55的伤害,魔法能产生反馈效果。6秒内每秒回复3到5点的能量值。
九十七、“向我们报送影片的人,有机会真正地把他们自己的创造冲动和想象、社会识见相交、配起来,”CarolQueen,(源自)“完美 震荡 ”的全职性学家说。
九十八、重组预期已延烧多年,但是重组迫近的传言还是搅起股市层层波澜,5月23日港股沪市双双大幅 震荡 ,传言引起的恐慌情绪直到5月27日才被市场完全消化。
九十九、该股三个月来一直维持反复横盘 震荡 格局,无论在时间还是空间上调整均较为充分。
一百、迟到的给个横盘处理,不想我的来个 震荡 处理,忘了我的一律以停牌处理,不给我消息的统统戴个ST帽,平安夜我送你平安与快乐,若有比我早的则送个涨停!
一百零一、中的大个子单位是劫掠者,双持 震荡 手雷、拍晕生物、重伤机械、除了建筑和飞机一律大小通吃的绝世强者。
一百零二、屋子布置得漂亮新奇,彩灯拉花点缀独特。让烛光摇曳喜庆吉祥,让歌声 震荡 窗外四野。是笑声传诵喜悦欢快,是蛋糕美酒飘香四溢。“平安夜”同学们:一起享受,一起欢歌,一起狂舞,让。
一百零三、即使恰值金融市场 震荡 加剧,上个月家庭贷款还是增加。
一百零四、这种 震荡 波很难被测量,但科学家也许已经找到一种方法,利用常规的GPS。
一百零五、有些思想家在思考,然而土壤,就是说,人民大众,受到了革命潮流的冲击,却在他们下面,被一种无以名之的癫痫 震荡 着。
一百零六、您有是或在一个 震荡 性的事件附近的320,000个人。
一百零七、公式表明,电磁成形时磁感应强度正弦 震荡 ,幅值呈指数规律衰减.
一百零八、今年上半年,中国股市可能继续保持区间 震荡 态势,预计只有在通胀问题获得解决以后的下半年才能够翻红获利。
一百零九、美国讯远通信公司股价下挫创新低回落到阻力位。开盘跳空,价位下跌低于 震荡 区,在155和160点间徘徊。
一百十、霸天虎分裂, 震荡 波,萨克巨人与霸王三雄并立。
一百十一、游戏小橱在呻吟、回响,仿佛受到闪电和惊雷的 震荡 。
一百十二、西方列强的经济渗透和政治控制非但没有减弱反而增大,中东到20世纪初期仍未摆脱困境,而近代的这次撞击、裂变和 震荡 持续一百多年,余波延续到20世纪后期。
一百十三、牛高马大的身体摇晃了几下,剧烈的 震荡 让这个角斗士暂时陷入一种半昏迷状态。
一百十四、在10月中旬,型钢市场价格还可能继续 震荡 下跌,还有一个缓慢下跌筑底的过程.
一百十五、 震荡 市场中基金经理的选股能力至关重要.
一百十六、范晓说水库的位置是关键因素,水库中的水从高水位迅速的瞬间,周围会产生的剧烈 震荡 。
一百十七、曙光执政官是一种被燃烧状的能量涡流所围绕的人形单位,释放出难以置信的能量,他们强大的心灵 震荡 波可以攻击空中和地面的敌人。
一百十八、我可能脑 震荡 了,我去躺躺。
一百十九、我左臂严重擦伤,并有轻微脑 震荡 。
一百二十、周四英镑兑美元继续盘整 震荡 ,也总体持稳.
数据挖掘核心算法之一--回归
数据挖掘核心算法之一--回归
回归,是一个广义的概念,包含的基本概念是用一群变量预测另一个变量的方法,白话就是根据几件事情的相关程度,用其中几件来预测另一件事情发生的概率,最简单的即线性二变量问题(即简单线性),例如下午我老婆要买个包,我没买,那结果就是我肯定没有晚饭吃;复杂一点就是多变量(即多元线性,这里有一点要注意的,因为我最早以前犯过这个错误,就是认为预测变量越多越好,做模型的时候总希望选取几十个指标来预测,但是要知道,一方面,每增加一个变量,就相当于在这个变量上增加了误差,变相的扩大了整体误差,尤其当自变量选择不当的时候,影响更大,另一个方面,当选择的俩个自变量本身就是高度相关而不独立的时候,俩个指标相当于对结果造成了双倍的影响),还是上面那个例子,如果我丈母娘来了,那我老婆就有很大概率做饭;如果在加一个事件,如果我老丈人也来了,那我老婆肯定会做饭;为什么会有这些判断,因为这些都是以前多次发生的,所以我可以根据这几件事情来预测我老婆会不会做晚饭。
大数据时代的问题当然不能让你用肉眼看出来,不然要海量计算有啥用,所以除了上面那俩种回归,我们经常用的还有多项式回归,即模型的关系是n阶多项式;逻辑回归(类似方法包括决策树),即结果是分类变量的预测;泊松回归,即结果变量代表了频数;非线性回归、时间序列回归、自回归等等,太多了,这里主要讲几种常用的,好解释的(所有的模型我们都要注意一个问题,就是要好解释,不管是参数选择还是变量选择还是结果,因为模型建好了最终用的是业务人员,看结果的是老板,你要给他们解释,如果你说结果就是这样,我也不知道问什么,那升职加薪基本无望了),例如你发现日照时间和某地葡萄销量有正比关系,那你可能还要解释为什么有正比关系,进一步统计发现日照时间和葡萄的含糖量是相关的,即日照时间长葡萄好吃,另外日照时间和产量有关,日照时间长,产量大,价格自然低,结果是又便宜又好吃的葡萄销量肯定大。再举一个例子,某石油产地的咖啡销量增大,国际油价的就会下跌,这俩者有关系,你除了要告诉领导这俩者有关系,你还要去寻找为什么有关系,咖啡是提升工人精力的主要饮料,咖啡销量变大,跟踪发现工人的工作强度变大,石油运输出口增多,油价下跌和咖啡销量的关系就出来了(单纯的例子,不要多想,参考了一个根据遥感信息获取船舶信息来预测粮食价格的真实案例,感觉不够典型,就换一个,实际油价是人为操控地)。
回归利器--最小二乘法,牛逼数学家高斯用的(另一个法国数学家说自己先创立的,不过没办法,谁让高斯出名呢),这个方法主要就是根据样本数据,找到样本和预测的关系,使得预测和真实值之间的误差和最小;和我上面举的老婆做晚饭的例子类似,不过我那个例子在不确定的方面只说了大概率,但是到底多大概率,就是用最小二乘法把这个关系式写出来的,这里不讲最小二乘法和公式了,使用工具就可以了,基本所有的数据分析工具都提供了这个方法的函数,主要给大家讲一下之前的一个误区,最小二乘法在任何情况下都可以算出来一个等式,因为这个方法只是使误差和最小,所以哪怕是天大的误差,他只要是误差和里面最小的,就是该方法的结果,写到这里大家应该知道我要说什么了,就算自变量和因变量完全没有关系,该方法都会算出来一个结果,所以主要给大家讲一下最小二乘法对数据集的要求:
1、正态性:对于固定的自变量,因变量呈正态性,意思是对于同一个答案,大部分原因是集中的;做回归模型,用的就是大量的Y~X映射样本来回归,如果引起Y的样本很凌乱,那就无法回归
2、独立性:每个样本的Y都是相互独立的,这个很好理解,答案和答案之间不能有联系,就像掷硬币一样,如果第一次是反面,让你预测抛两次有反面的概率,那结果就没必要预测了
3、线性:就是X和Y是相关的,其实世间万物都是相关的,蝴蝶和龙卷风(还是海啸来着)都是有关的嘛,只是直接相关还是间接相关的关系,这里的相关是指自变量和因变量直接相关
4、同方差性:因变量的方差不随自变量的水平不同而变化。方差我在描述性统计量分析里面写过,表示的数据集的变异性,所以这里的要求就是结果的变异性是不变的,举例,脑袋轴了,想不出例子,画个图来说明。(我们希望每一个自变量对应的结果都是在一个尽量小的范围)
我们用回归方法建模,要尽量消除上述几点的影响,下面具体讲一下简单回归的流程(其他的其实都类似,能把这个讲清楚了,其他的也差不多):
first,找指标,找你要预测变量的相关指标(第一步应该是找你要预测什么变量,这个话题有点大,涉及你的业务目标,老板的目的,达到该目的最关键的业务指标等等,我们后续的话题在聊,这里先把方法讲清楚),找相关指标,标准做法是业务专家出一些指标,我们在测试这些指标哪些相关性高,但是我经历的大部分公司业务人员在建模初期是不靠谱的(真的不靠谱,没思路,没想法,没意见),所以我的做法是将该业务目的所有相关的指标都拿到(有时候上百个),然后跑一个相关性分析,在来个主成分分析,就过滤的差不多了,然后给业务专家看,这时候他们就有思路了(先要有东西激活他们),会给一些你想不到的指标。预测变量是最重要的,直接关系到你的结果和产出,所以这是一个多轮优化的过程。
第二,找数据,这个就不多说了,要么按照时间轴找(我认为比较好的方式,大部分是有规律的),要么按照横切面的方式,这个就意味横切面的不同点可能波动较大,要小心一点;同时对数据的基本处理要有,包括对极值的处理以及空值的处理。
第三, 建立回归模型,这步是最简单的,所有的挖掘工具都提供了各种回归方法,你的任务就是把前面准备的东西告诉计算机就可以了。
第四,检验和修改,我们用工具计算好的模型,都有各种假设检验的系数,你可以马上看到你这个模型的好坏,同时去修改和优化,这里主要就是涉及到一个查准率,表示预测的部分里面,真正正确的所占比例;另一个是查全率,表示了全部真正正确的例子,被预测到的概率;查准率和查全率一般情况下成反比,所以我们要找一个平衡点。
第五,解释,使用,这个就是见证奇迹的时刻了,见证前一般有很久时间,这个时间就是你给老板或者客户解释的时间了,解释为啥有这些变量,解释为啥我们选择这个平衡点(是因为业务力量不足还是其他的),为啥做了这么久出的东西这么差(这个就尴尬了)等等。
回归就先和大家聊这么多,下一轮给大家聊聊主成分分析和相关性分析的研究,然后在聊聊数据挖掘另一个利器--聚类。