教资成绩出来了意料之中的,李清梦通过了,所以她要开始准备面试的事情了,虽然她觉得自己从小到大面对那些那些大大小小的场合是不会怯场的,但是教资面试是要以老师的身份展示自己,以前参加的比赛或是活动都是展示个人魅力的,但是这次不是,所以她就又开始看视频看题,看别人是如何进行教学的,以及如何回答老师的问题。
12月份相对来说比较轻松,虽然都是周末双休,没有像上半年那样大大小小的节日可以放假,只能等到元旦。但是因为大三了,课程本来就相对较少,现在又不考试什么的,所以还算轻松。
不过呢,轻松地只是应用数学专业的同学,信计专业的可是有的忙了。
12月1日,信计的机器学习老师发了要做的项目的要求,让大家做一个关于银行用户粘度预测的项目,两周之后答辩。
虽然这学期学的机器学习和第三学期学的数据挖掘有很多相似的地方,不过机器学习学的更细致更详细更全面。
做这种项目需要划分数据集和测试集,就是原本的数据是在同一个excel表格内,要先对其进行数据清洗,删除对结果没有太大影响的数据,比如说其中有一列是客户的星座,就可以直接删除。
然后分析数据,加载数据,然后使用一些模型进行比拟,看其是否具有相关性。
还是老样子,楚星河和王鑫一组,周柯和文彬彬一组。
楚星河负责后面的代码,也就是分析数据,加载数据,导入模型并比拟这些,以及完成ppt,因为一般自己是主讲的那个,所以他来做,王鑫就负责了数据清洗这一块儿,外加方案书。
数据清洗看似是简单的,但是如果清洗的不够干净的话会对后续产生一些影响,比如说总共有九十万条数据,其中有一列是缺失了三十万条,看似确实的很多,但要是具体的算一下,也并不多,所以我们需要填充缺失的数据,而不是直接删除整列,可以用中位数,众数或者是平均数来填充。
答辩分了两周进行,要是之前,都是在最后答辩,也就是复习周的第二周进行,但是这学期就是课还没上完,就开始做了项目。
答辩当天,机器学习的老师胡老师还叫了一位之前教过他们三学期的老师刘老师过来一起。
最开始胡老师还挺有耐心的,还会温柔的问答辩的同学一些问题,到后面,直接开骂,甚至有几组同学当场被毙,胡老师让他们直接重修。
楚星河的能力所有老师有目共睹,而且他们四个还在编程大赛中拿了一等奖,为学院,学校争光了,所以对楚星河,王鑫,周柯以及文彬彬,胡老师没有太过为难,只是照例问了几个学过的知识点,他们回答出来以后,胡老师就点点头让他们下去了,表示可以了。
答辩完这一个之后,紧接着就来了下一个,深度学习的,不过下一个不是固定的,而是三选一,三个项目中挑一个来做,大多数人选的都是一个叫5g信号套餐潜在客户预测,因为这个和深度学习的一样,同一种套路,都是分类问题。
但是楚星河想做回归问题,有一个二手房价预测和二手车价格预测。由于二手车的数据过于庞大而且杂乱,他觉得上一个项目已经很辛苦了,就挑了房价预测的,房价预测的数据比较少,数据清洗比较轻松,而且回归问题比起分类问题也较为轻松。
忘了说一句,这机器学习和深度学习
第161章 忙忙碌碌[1/2页]