一周做一个真题,然后花一周时间复盘来学习。为什么跟大家说说,你一周时间来做题,然后还要花同样的时间一周来复盘的,就是说你可能会在这一周里面做完了之后,时间一定要固定好,就是和你真实的时间保持一致。然后这样的话,和你真正去比赛的时候时间一致,你可以按照预估的一个进度来进行。
三个人:一个人主要负责代码,一个人主要负责写论文,剩下一个人辅佐写代码和论文。 当看一篇论文的代码实现的时候应该有百分之八十就是虚数,有一大半的部分是由那个主要写代码同学来做的那里,但是那里面可能会遇到一些你们之前没有准备到的东西,比如说一些比较新的代码,或者说一些专业领域里面会遇到的模块中的新的算法,但是他可能说是锦上添花,但是说你让那个主要写代码同学可能还有更重要的事情要去做。所以他可能不会花大量的时间来专门去研究那个小的算法怎么来实现,所以说他可以做其它的事情,就是按照我们大既定的方案往下走,然后呢,把那一小块的东西呢,让给那个中间的同学自由人,自由人去实现这个的时间会比较充裕,那么他可以花比较长的时间来实现这个模块,然后把这个模块呢,再传递给这样一个主要写代码的同学。当然了,比如说一些问题的重述问题的问题重述原理等等,那我们第一段的时候,最开始会有这样的一些东西,,可能一开始在前面大概会有七页左右的这些概述,就是大家每篇文都有的还没有涉及到具体问题一可能我们主要写的同学负责。
主要以机器学习为主,深度学习可以用作一个优化,深度学习的一点,如果只是简单的CNN或者说DNA或者说SVM,不做其他的变化的话,不加一些网络自己组合成一个新的模型来说,其实也比较老套,还不如用机器学习来做。因为,深度学习还是为了解决数据特别大的问题,数学建模给的数据,虽然多,但不是特别多。
数模的题可能是这样的,五六道题中一道是华为自己的题,有一道通讯类的题是A题,一般大家都不太会做,不是这个专业背景的比较难。剩下有两三道题是数据分析类的题,建议是选择数据分析类的题。
1 基础类
准备数据分析常用的算法和模型,机器学习的算法,深度学习的算法,比赛能直接用,专业方向的算法。 每一道选择三篇获奖优秀论文,只看摘要,把他们的方法罗列出来,总结出来放在表里,看他们怎么融合,常用的方法一般都会有用的。
2 专业有关
把数学建模的问题的能不能抽象成一个数学问题,然后,你把这个抽象的数学问题,放到我们的领域里来,看看你领域内有没有一些问题,能正好是跟这个问题相似的,哪怕只要相似到50%以上,那么你看看这个领域内来解决这个问题,用了什么特殊的方法,你可以把它融入进去。
3 背景相关
一些与背景问题有关的特殊的模型,可以准备不到。 比如说我们一九年他是温度,它是气象那个背景,他肯定会有一些气象里面专有的,比如说MK图片分析那个图。可能有些别的背景里面,它就不会用到这样一个图。然后比如说甲烷的这种,可能这种对于一些这种工程类的,或者说这种甲烷汽车领域的一些论文里面,他们有可能会加入一些特殊的一些模型,就是说针对这个背景的模型,这个模型的大概率来说,我们准备不到的,因为我并不知道真题是什么,只有拿到真题,然后才能去找到这些模型。所以说这就是对我们的一个代码能力,就是说你要有快速去实现一个模,快速实现一个方法。或者说从网上开源的一个方法,把它调通,适应你的整个算法流程的这样一个过程。
选题
三道数据分析的题,它里面用的方法,基础方法时相似的。举个20年的题为例。 甲烷,脑电波,汽车这几道,看背景,背景不熟的不选。 假如已经固定是甲烷,找相关论文,去知网,百度,CSDN等等,找到一些方法,分析这些方法的难以程度,看更能实现的方法。 看周围的人选择哪道题,大家选择多的是那一道题,可以选择,也可以和外组讨论,提升方案。
论文内容的填充
三个人讨论,从之前总结的算法池里面挑选出一个比较合理的,容易实现的方案出来,三个人讨论这个方案的每一步是做什么的,有个整个方案的流程图,每一步为什么可能,做完这一步下一步做什么,每个人都要明确方案大体的架构,对论文的逻辑要清晰。
方案定了,开始优化,脱离背景,抽象成数学问题,去知网搜论文看算法和专业背景,拼出一个大的方案出来,然后再深入某一个方案把它抽象成数学问题,然后再去知网去搜这个数学问题的更优化的解决方案,然后在每一步的迭代,到最后就是一个非常优秀的关于这个具体生活背景下的一个优化解决方案。
搜论文: 第一步,例如全球变暖的题目,知网搜看看摘要,看看别人在研究什么,算法是什么。 第一问第二问大概率是有联系的,和论文联系起来,总结出中心点,按照中心点写论文。 例如第二问变成拟合问题,就搜这方面的论文,是分类问题,就搜分类方面的论文。
一种小技巧:论文中写的是一个比较高级的算法,代码用了另一个算法,论文中的算法和代码实现的功能是一样的。
在问题重述里面:我们并不是说气象专业的,也不是说工矿专业的,我们是各个不同的专业是做什么,做的数学建模,所以你要第一步回答的是说这个具体的背景的问题,在数学表达里面,它到底是一个什么样的问题。他是一个规划问题,还是一个预测问题,还是一个最小路径问题,还是一个分类问题?你首先回答这么一个问题。
接下来就是根据整个的模型提出我们的模型架构。 就是说我在实现某一个模块的时候呢,我可能会选择两个方案。两个方案来进行对比,这样的话就会有模型的分析模型的比较,通过比较来得出选择这个模块是好的。 当你比较主要的模块之后,你就可以说我的这样一个方案是好的,就是有理有据,还有一点就是说我把这个问题归结成分类问题,它是有理论依据的这个理论依据呢,其实是我们可以通过一些论文来支撑我们。 把这样的一个具体背景转化成一个数学问题,然后用了一个什么样的方案,然后再解释一下这个方案为什么好,那么你这篇论文就算是完整的就是有输有输入有输出,还有分析。 就是说你本身发的不够硬怎么办,那就要去百度了。假设我们做了SQL方法对比SVM。两方你我们是不太清楚为什么选择哪一个模型,那么我们就把这个问题放到百度上或者放到支付宝上去搜你看看大家是怎么来评价的。然后进行融合过滤。就是让别人来替你说,你把话捋顺了说。
做大量的实验对比,说不出来话,就让图表来对你说,你比较大量的评价指标。评价指标是非常明晰的一个最简单东西,比如说方向或者误差,或者说比较更好的分类的ID的话,他比他高,他就是优秀的对。这是从结果层面来看。
还有一点就是说从算法原理上,就是说你可以说我这样的一个问题,它是一个什么什么背景下的什么什么问题,而我这个算法,他比a算法,比B算法,更适合在什么场景下来做,碰巧我们提的问题正好就是这个,就是这样一个背景,就是他更适合,你可以从两方面。它解决了什么问题,做什么优化,就这个算法的本身做什么算法优化,把它写出来。
画图:第一步应该是你先把那个徒手画出来,然后你再去优化,然后再去通过软件把它实现出来,尽量用彩色的,不要有黑白色。 因为你的论文呢,就是来支撑你的这样一个方案图的,你下面的所有的东西都是按照流程图来走的每一个模块,你整个论文会有一个大的方案图,你每一个小问都会有一个小的方案图,一定一定要画方案的流程,而且在每一个小点开始就把你们的流程图都画出来。一定要画方案图,换句话就是说如果你们的方案如流程图画不出来的话,你们千万不要写代码,千万别写论文,因为你们根本就把握不住你们整个论文的篇章结构,因为整个论文有40多页。
方案图举例:
是说你把你整个方案呢,用几个模块用模块化组件把它组合起来。
每一部分都是什么内容,每一部分又分为哪些内容,如果是新颖的或者重点的,想要重点突出的,可以标红突出来, 方案图可以捡重点的讲,流程图需要非常清晰。用流程图就不要用方案图,用方案图就不要用流程图。方案图是更凝练一点的流程图,优秀的算法,用一些红色的字体标注出来。
第一个时间点:第二天白天的八点 第二个时间点:第四天晚上的八点 分为三部分:选题,做题,论文优化三部分。
第一个时间点:第二天白天的八点 第一天开始定题目,如果是第一天上午定下来了,下午开始做第一问,但是做的过程遇到了坑,觉得怎么都解决不了,这个时候还没到第二天早上八点,还可以题目,换了题目之后去和其他组做这个题目的人交流,看看人家第一问用的是什么办法,别的组已经做出来了第一问的话,可以直接用他们的方法,搜集资料,实现这个方案就可以了,时间就可以赶上来了,不用着急。 但是,一旦到了第二天早上八点,还是选择做开始的这个题目的话,就是有坑,硬着头皮也要做下去,不能再换了。
第二个时间点:第四天晚上的八点 三个人坐在一起,搞一个屏幕,开始对论文,第一天写的论文,第四天去看的时候,肯定有很多很多的错别字和语病。不建议一个人看一次,最好三个人一起看,一起改。
摘要要改好多好多次,能不能获奖,摘要占有很大一部分,最好是一页半。 第一段写一个总体的背景,但是不要写很多东西,这一块儿不涉及到题目。 第二段开始,二三段把四个问题的整体方案介绍一下,介绍的时候要突出,用了哪些优秀的算法,取得了一个什么样的结果。 第四段开始针对每一段在写一个小的摘要,首先其次的格式清清楚楚地列出这样的一个思路、流程。 看整体的篇章布局,看能不能画成更好看的图,每一个图都要有目的有主题,进行美化图。最好是,单看一个图,就能明确看出想要表达什么意义,图表中的每一个重要数据,表达的是什么含义,都要表示出来。
中间时间 前两个问题:用半天或者大半天完成一题,后面题是一天。 实现一个问题之后,要进行优化。 如果六个小时还没解决,就要先邹一个结果摆在那里,加快速度完成后面部分,流出时间来完善使论文合情合理。